logo of baidu

百度异构计算工程师 - 加速方向(J82685)

社招全职ACG地点:北京 | 上海 | 深圳状态:招聘

任职要求


-熟悉大模型或者自动驾驶模型结构
-熟悉MegatronvLLM大模型训推框架,结合场景做过深度优化
-有非GPU芯片适配和优化经验优先
-有分离式推理、投机式推理、MoE训练等研发经验优先
-有独立的分析问题和解决问题的能力
-有较强的责任心,较强的学习能力和沟通能力

工作职责


-结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态
-在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力
-探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统
-与业务团队协同,理解客户需求,驱动技术创新,业务持续突破
包括英文材料
大模型+
自动驾驶+
Megatron+
vLLM+
相关职位

logo of baidu
社招ACG

-结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态 -在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力 -探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统 -与业务团队协同,理解客户需求,驱动技术创新,业务持续突破

更新于 2025-04-07
logo of baidu
社招ACG

-优化LLM、长序列、多模态、MoE等先进模型的训练和推理效率,将各场景训推MFU优化到极致状态 -在自研芯片上适配常见的大模型与自驾模型,并结合芯片特点做优化,充分发挥自研芯片算力 -针对大规模异构混芯集群,探索自动并行、多芯混训等前沿技术,构建影响力 -与业务团队协同,理解客户需求,驱动技术创新,业务持续突破

更新于 2025-02-24
logo of baidu
社招ACG

- 结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态 - 在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力 - 探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统 - 与业务团队协同,理解客户需求,驱动技术创新,业务持续突破

更新于 2025-07-10
logo of bytedance
社招A196810

1、负责研发AI推理框架,适配并优化国产异构计算芯片,支持抖音、剪映等产品中的生成式算法落地,支撑字节跳动AI方向重要业务的发展; 2、负责使用国产芯片进行SD、多模态模型训练加速和推理加速。

更新于 2024-05-24