百度Summer Camp大模型基础设施研发实习生(J84884)
任职要求
-计算机等相关专业研究生在读 -熟练掌握C++和Python编程 -深入理解主流GPU、RDMA等…
工作职责
-大模型训练、推理通信算子性能优化 -大模型算力集群网络性能优化 -大模型算力集群高可用系统优化 -大模型基础设施相关的其他优化
我们是百度智能云AI计算加速团队,负责大模型训练和推理框架的优化工作,为语言模型、多模态模型、强化学习等先进的AI技术提供超大规模、极致性能、兼容多芯的软件方案,支持百度内外部客户模型的快速迭代和高效部署。在这里,你可以: -紧跟最新LM技术的发展,从模型-框架-硬件集群的全局视角,优化分布式训练和推理框架、底层算子的性能,将常见模型训推MFU优化到极致状态 -在百度自研芯片上适配常见的大模型与自驾模型,结合芯片特点做框架和算子的深度优化,充分发挥自研芯片算力 -结合文生视频、具身智能、自动驾驶等前沿场景,模型-框架-集群协同创新,探索前沿的训推框架和算子优化技术 -与业务团队协同,理解客户需求,驱动技术创新,业务持续突破
-参与Qianfan-VL多模态模型训练工作,负责图像、视频与文本模态的对齐和指令微调数据构造与清洗,模型实验 -构建优质代码数据语料库,通过检索生成结合执行环境自动验证的方式构造合成数据,通过持续预训练、强化学习等方式训练精专代码大模型 -跟进并探索前沿的模型范式,研究样本质量/数量对模型效果的影响,摸索更高效、低成本的蒸馏方案,研究RL在特定需求场景下的适用性 -深刻理解模型训练、推理的性能瓶颈,通过底层优化提升训练、推理性能 -研究方向(新增数据策略方向): 多模态大模型预训练/后训练数据清洗与合成 多模态推理场景强化 多模态教育、解题场景增强 复杂指令遵循 Agent场景数据构建 复杂场景下的代码提升
-课题:一见视觉智能体(AI Watchman)-构建通用视觉Agent,接管传统监控软件,打造数字AI值守员 -多模态大模型产业应用研究: 探索 VLM 在少样本工业场景下的视觉理解与逻辑推理能力,研究基于 Scaling Law 的数据自动清洗与自动化标注技术 -具身智能感知与决策系统: 研究边缘侧的高效感知与执行策略,构建能够理解复杂环境、操作物理/虚拟设备并进行自主决策的智能体 Runtime -自主进化 Agentic MLOps 闭环: 参与设计并实现全栈调试的 Skill 池。负责挂载语义诊断、逻辑参数调优、提示词自动变异与网络模型重设等核心能力,实现完整MLOps 工作流闭环
