logo of xpeng

小鹏汽车大模型平台 & Infra实习生

实习兼职地点:深圳 | 北京 | 上海状态:招聘

任职要求


1、本科及以上学历,计算机、软件工程等相关专业;
2、 精通 Python,熟练掌握 C++/Go 至少一门;
3、在以下至少一个方向有相关经验:
- 分布式训练系统(Megatron-LM/DeepSpeed/FSDP);
- GPU 编程与高性能计算(CUDA/NCCL/RDMA);
- ML 平台开发(Kubernete…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责大模型训练、推理和评测的基础设施研发,为算法团队提供高效稳定的工程底座。
1、训练系统:设计和优化大规模分布式训练架构(Pretrain/SFT/RL),解决千卡级训练的通信、调度、容错问题;
2、推理部署:基于 vLLM 等框架优化大模型推理性能,支撑 VLT/Omni 等模型在 XP5 端侧和云端的部署;
3、评测平台:开发 DeepInsight 评测系统,支持 LLM/VLM/WBC/VLA 多类模型的自动化评测、报告生成和 CI/CD 集成;
4、MLOps 工具链:构建模型版本管理、实验追踪、数据管理、资源调度等基础设施,提升研发效率;
5、RL 训练环境:构建分布式强化学习训练系统,支持 Agent-环境大规模并行交互。
包括英文材料
学历+
Python+
C+++
Go+
Megatron+
DeepSpeed+
FSDP+
CUDA+
还有更多 •••
相关职位

logo of bytedance
社招A78654

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责字节跳动机器学习平台的开发,支撑公司相关业务的算法生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。

更新于 2024-10-23杭州
logo of pinduoduo
社招1年以上技术类

1、负责大模型平台的架构优化,和算法一起提升大模型能力、推进落地; 2、负责新技术调研和预研,紧跟大模型方向的前沿技术; 3、设计&优化大模型训练&推理框架,通过深度优化CUDA kernel、KV Cache等优化框架性能;

更新于 2025-10-10上海
logo of baidu
社招3年以上ACG

-负责百度智能云千帆平台大模型方案售前的技术交流和咨询,包括需求分析、方案设计、产品演示等 -深入挖掘客户需求,结合公司产品和技术能力,制定符合客户实际需求的解决方案 -编写售前方案、技术文档、产品介绍等,确保信息的准确性和完整性 -参与项目投标,编写标书,协助销售团队完成项目的竞标工作 -与销售团队、研发团队、交付团队等内部部门保持密切沟通,确保项目的顺利推进和交付 -关注行业动态和竞争对手情况,及时为公司提供市场分析和建议

更新于 2025-04-25北京|上海
logo of baidu
社招3年以上ACG

-参与百度千帆大模型平台推理服务相关系统的设计与研发 -参与建设基于云计算基础架构的高可扩展、高性能服务平台 -负责大模型平台相关系统的维护和升级,进行性能优化、稳定性建设,提升资源利用率 -参与大模型相关前沿技术调研和创新能力落地

更新于 2024-06-26北京|上海