百度异构计算工程师 - 加速方向(J82685)
社招全职ACG地点:北京 | 上海 | 深圳状态:招聘
任职要求
-熟悉大模型或者自动驾驶模型结构 -熟悉Megatron、vLLM等大模型训推框架,结合场景做过深度优化 -有非GPU芯片适配和优化经验优先 -有分离式推理、投机式推理、MoE训练等研发经验优先 -有独立的分析问题和解决问题的能力 -有较强的责任心,较强的学习能力和沟通能力
工作职责
-结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态 -在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力 -探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统 -与业务团队协同,理解客户需求,驱动技术创新,业务持续突破
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
自动驾驶+
https://www.youtube.com/watch?v=_q4WUxgwDeg&list=PL05umP7R6ij321zzKXK6XCQXAaaYjQbzr
Lecture: Self-Driving Cars (Prof. Andreas Geiger, University of Tübingen)
https://www.youtube.com/watch?v=NkI9ia2cLhc&list=PLB0Tybl0UNfYoJE7ZwsBQoDIG4YN9ptyY
You will learn to make a self-driving car simulation by implementing every component one by one. I will teach you how to implement the car driving mechanics, how to define the environment, how to simulate some sensors, how to detect collisions and how to make the car control itself using a neural network.
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
vLLM+
https://www.newline.co/@zaoyang/ultimate-guide-to-vllm--aad8b65d
vLLM is a framework designed to make large language models faster, more efficient, and better suited for production environments.
https://www.youtube.com/watch?v=Ju2FrqIrdx0
vLLM is a cutting-edge serving engine designed for large language models (LLMs), offering unparalleled performance and efficiency for AI-driven applications.
相关职位
社招ACG
-结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态 -在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力 -探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统 -与业务团队协同,理解客户需求,驱动技术创新,业务持续突破
更新于 2025-04-07
社招ACG
-优化LLM、长序列、多模态、MoE等先进模型的训练和推理效率,将各场景训推MFU优化到极致状态 -在自研芯片上适配常见的大模型与自驾模型,并结合芯片特点做优化,充分发挥自研芯片算力 -针对大规模异构混芯集群,探索自动并行、多芯混训等前沿技术,构建影响力 -与业务团队协同,理解客户需求,驱动技术创新,业务持续突破
更新于 2025-02-24
社招ACG
- 结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态 - 在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力 - 探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统 - 与业务团队协同,理解客户需求,驱动技术创新,业务持续突破
更新于 2025-07-10