logo of baidu

百度异构计算工程师 - 加速方向(J88955)

社招全职ACG地点:北京状态:招聘

任职要求


- 熟悉大模型或者自动驾驶模型结构
- 熟悉MegatronvLLM大模型训推框架,结合场景做过深度优化
- 有非GPU芯片适配和优化经验优先
- 有分离式推理、投机式推理、MoE训练等研发经验优先
- 有独立的分析问题和解决问题的能力
- 有强烈的责任心,较强的学习能力和沟通能力

工作职责


- 结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态
- 在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力
- 探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统
- 与业务团队协同,理解客户需求,驱动技术创新,业务持续突破
包括英文材料
大模型+
自动驾驶+
Megatron+
vLLM+
相关职位

logo of baidu
社招ACG

-结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态 -在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力 -探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统 -与业务团队协同,理解客户需求,驱动技术创新,业务持续突破

更新于 2025-04-07
logo of baidu
社招ACG

-优化LLM、长序列、多模态、MoE等先进模型的训练和推理效率,将各场景训推MFU优化到极致状态 -在自研芯片上适配常见的大模型与自驾模型,并结合芯片特点做优化,充分发挥自研芯片算力 -针对大规模异构混芯集群,探索自动并行、多芯混训等前沿技术,构建影响力 -与业务团队协同,理解客户需求,驱动技术创新,业务持续突破

更新于 2025-02-24
logo of baidu
社招ACG

-结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态 -在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力 -探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统 -与业务团队协同,理解客户需求,驱动技术创新,业务持续突破

更新于 2025-07-10
logo of bytedance
社招A196810

1、负责研发AI推理框架,适配并优化国产异构计算芯片,支持抖音、剪映等产品中的生成式算法落地,支撑字节跳动AI方向重要业务的发展; 2、负责使用国产芯片进行SD、多模态模型训练加速和推理加速。

更新于 2024-05-24