滴滴大模型专家算法工程师(J251009023)
任职要求
任职要求:
1、计算机、数学相关领域的硕士及以上学历,具备一线工程能力;
2、有大模型训练经验,熟悉大模型训练方法(CPT/SFT/RL等)及训练框架(如 DeepSpeed、veRL、Llama-factory、Unsloth 等),结合业务场景特点,设计workflow/agent及训练方法;
3、有丰富的强化学习经验,熟练掌握对奖励信号的建模、PPO/DPO/GRPO 等算法并能结合场景灵活应用,熟悉 OpenRLHF、veRL 等强化学习框架;
4、对前沿科技高度好奇,密切跟进最新技术/论文/项目,深入技术原理,积极分享;
5、从业务需求出发,发现并解决问题,兼顾效果与效率。
加分项:
1、主导过大模型…工作职责
负责滴滴智能客服对话算法,具备系统、扎实的算法功底,结合业务场景,构建下一代客服 Agent,驱动服务体验与效率提升。 工作内容: 1、主导智能客服 Agent升级改造,与产品+工程团队合作,设计算法架构和技术路线; 2、负责领域大模型的后训练和研究,如数据合成、增量预训练、监督微调、偏好对齐、推理能力、工具调用、多模态等; 3、提升现有功能模块的效率与效果,如意图识别、多轮对话、角色模拟、智能辅助等; 4、关注行业前沿,推进技术与业务场景的完美结合,探索创新方法,持续提升团队影响力。
【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。
1. 高质量垂域数据工程:深入优化垂直领域(如文本内容审核)的高质量数据构建与迭代方法论,持续提升数据的质量、多样性与生产效率。 2. 可扩展后训练体系:探索适配领域特性的 SFT/RL 算法,构建高效、稳定、可扩展的垂域模型后训练范式,系统性提升模型能力。 3. 前沿技术研究与落地:探索推理模型前沿技术(如高效蒸馏、reward system、agentic RL、test-time learning 等)以及模型可解释性技术,沉淀技术成果和影响力,并推动大模型相关技术在行业场景中的转化与落地,提升领域模型竞争力,支撑业务持续增长。
1、跟踪前沿技术进展,负责机器人大模型(VLA)和数字孪生技术能力建设; 2、负责物流机器人方向技术路线制定、技术方案设计与评审、业务应用落地; 3、指导并培养算法工程师团队,提升算法团队技术能力;