logo of aligenie

智能互联平头哥-深度学习算法框架高级技术专家-北京

社招全职10年以上技术-芯片地点:北京状态:招聘

任职要求


学历:计算机科学、电子工程、人工智能或相关领域的硕士以上学位。

经验:
至少5年以上深度学习算法研究或框架开发相关工作经验,具有丰富的实际项目经验。
熟悉一种或多种深度学习框架(如 TensorFlowPyTorchKeras 等)的开发和应用。
具备低精度(fp8,int8,fp4 等)量化算法经验

技术能力:
扎实的算法基础和编程能力,熟练掌握 PythonC++ 等编程语言。
深入理解主流深度学习框架Pytorch、Te…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


职位概述:
作为平头哥数据中心产品线深度学习算法框架高级技术专家,将负责设计、开发和优化深度学习算法框架,提升算法模型在PTG AI芯片上的运行效率和性能。跨团队协作,确保高质量的代码和技术实现,同时为团队提供技术指导。

主要职责:
算法框架适配与开发:
对开源AI软件框架的内部实现有深入理解,能够快速将广大开源软件适配到 AI 芯片上,同时确保性能达到最优。同时根据公司AI芯片的差异化的功能,在框架层面实现软硬件结合的解决方案。

性能优化:
分析和优化深度学习模型的训练和推理性能,提升计算效率和资源利用率。
根据芯片硬件特点使用多种技术手段,包括分布式计算、模型压缩和量化,优化算法在实际应用中的表现。

跨团队协作:
与其他团队(如编译器、驱动、客户支持等)紧密合作,确保技术指标的达成,并实现符合用户需求和市场趋势的功能。
为团队成员提供技术指导和支持,推动团队技能的持续提升。

技术研究与创新:
跟踪深度学习和机器学习领域的最新研究动态,探索并实施新算法和技术。
参与编写技术文档和论文,促进技术的分享与传播。
包括英文材料
学历+
深度学习+
算法+
TensorFlow+
PyTorch+
Keras+
Python+
还有更多 •••
相关职位

logo of thead
社招10年以上技术-芯片

职位概述: 作为平头哥数据中心产品线深度学习算法框架高级技术专家,将负责设计、开发和优化深度学习算法框架,提升算法模型在PTG AI芯片上的运行效率和性能。跨团队协作,确保高质量的代码和技术实现,同时为团队提供技术指导。 主要职责: 算法框架适配与开发: 对开源AI软件框架的内部实现有深入理解,能够快速将广大开源软件适配到 AI 芯片上,同时确保性能达到最优。同时根据公司AI芯片的差异化的功能,在框架层面实现软硬件结合的解决方案。 性能优化: 分析和优化深度学习模型的训练和推理性能,提升计算效率和资源利用率。 根据芯片硬件特点使用多种技术手段,包括分布式计算、模型压缩和量化,优化算法在实际应用中的表现。 跨团队协作: 与其他团队(如编译器、驱动、客户支持等)紧密合作,确保技术指标的达成,并实现符合用户需求和市场趋势的功能。 为团队成员提供技术指导和支持,推动团队技能的持续提升。 技术研究与创新: 跟踪深度学习和机器学习领域的最新研究动态,探索并实施新算法和技术。 参与编写技术文档和论文,促进技术的分享与传播。

更新于 2026-01-04北京
logo of thead
社招5年以上技术-芯片

1、参与人工智能芯片的软硬件协同设计,指令集功能验证; 2、参与人工智能芯片的编译器算法设计和实现, 工具链开发与维护,网络模型的性能调优; 3、参与深度学习软件栈的设计和实现; 1. Working closely with hardware/architecture engineering and software teams to understand the hardware and software requirements. 2. Responsible for compiler and tool chain design, implementation, maintaining and performance tuning. 3. Responsible for the design and implementation of deep learning software stack.

更新于 2026-01-20上海|北京|杭州
logo of thead
社招5年以上技术-芯片

具体职责包括但不限于: 1.嵌入式/边缘AI推理计算的软件生态方案选择,SDK和软件框架方案设计和开发 2.异构核并行计算中间件软件的设计,开发,和性能优化,包括Runtime,调度等 3.AI和感知算法在异构核上的部署和优化(包括算力分配,算子融合,各种流水线并行,核间通信等),效果测试 4.应用解决方案的软件设计和开发,包括结合云的端云协同仿真器,模拟器、调试器、IDE开发和性能优化

更新于 2025-11-24上海
logo of thead
校招平头哥秋季202

随着芯片功能日益复杂,芯片功能和性能越来越依赖于底层软件。作为芯片团队的一个重要部分,芯片软件团队致力于在系统层次规范和定义芯片软/硬件接口, 桥接片上模块和设备与上层软件栈,培养和构建芯片生态环境。 你将了解到CPU如何从第一条指令开始,如何通过BIOS一步步引导操作系统,你也将了解到如何将主流深度学习框架,如Tensorflow, 移植到阿里自研的芯片平台,并带来数量级的性能提升。在这里,你将了解到所有你想了解的芯片细节。 同时,参与主流开源模块的移植和开发,如UEFI/Linux/Tensorflow/RISC-V,影响并引领开源模块的发展方向。

更新于 2025-08-01上海