蚂蚁金服蚂蚁集团-大模型算法工程师/专家-LLM后训练
任职要求
● 计算机科学、人工智能、数学等相关专业硕士及以上学历(优秀本科生可放宽)。 ● 熟练掌握 Python 和 PyTorch,具备分布式训练(如多机多卡调优)经验。 ● 深入理解 Transformer 架构及SFT/RLHF/DPO/PPO/GRPO等算法。 ● 在NeurIPS、ICML、ICLR、 ACL等顶会发表论文,或 Kaggle、ACM 竞赛获奖者优先。 加分项 ● 具备大规模(千卡级)训练调优经验。 ● 大规模MoE架构训练/调优经验。 ● 长思维链/复杂任务推理经验。 ● 在开源社区(如 HuggingFace、GitHub)有突出贡献。
工作职责
1. 参与大语言模型(LLM)后训练全流程优化,包括但不限于通用能力提升、安全对齐等方向。 2. 实现并应用SFT/RLHF/DPO/PPO/GRPO等算法,探索多目标奖励模型、过程监督等前沿技术,提升模型在指令遵循、逻辑推理、多任务泛化等方面的性能。 3. 构建模型效果评估体系,设计自动化评估方案,持续跟踪模型优化效果。 4. 参与技术开源与学术研究,发表顶会论文或贡献核心开源项目。
1、负责代码场景的效果优化,深入研究LLM后训练等相关技术,提高算法准确率和效率; 2、分析业务需求,设计并实现适用于不同场景的算法解决方案,支持产品线在算法方面的需求; 3、负责抖音/直播等多个业务线的营销内容生成及营销策略算法设计与优化; 4、持续跟进LLM前沿技术,基于LLM完成在代码领域中的复杂任务。
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、负责代码场景的效果优化,深入研究LLM后训练等相关技术,提高算法准确率和效率; 2、分析业务需求,设计并实现适用于不同场景的算法解决方案,支持产品线在算法方面的需求; 3、持续跟进LLM前沿技术,基于LLM完成在代码领域中的复杂任务。
团队介绍:TRAE(The Real AI Engineer),是字节跳动旗下产品,一个能理解需求、调动工具、独立完成开发任务的 AI 工程师,为用户提供端到端生成真实软件的服务。TRAE是当前国内最受欢迎的AI编程产品之一,也是全球首个端到端AI软件开发Agent产品,可覆盖简单到复杂全场景。我们正在寻找充满热情、富有创造力的人才。期待你的加入,与我们共同重塑开发范式,定义未来开发的形态。 1、负责代码场景的效果优化,深入研究LLM后训练等相关技术,提高算法准确率和效率; 2、分析业务需求,设计并实现适用于不同场景的算法解决方案,支持产品线在算法方面的需求; 3、持续跟进LLM前沿技术,基于LLM完成在代码领域中的复杂任务。
1、开发AI驱动的智能客服系统:设计并实现AI对话式客服助手,能够处理电商咨询、投诉、退款、争议解决及物流相关问题,以AI替代传统人工客服; 2、大语言模型(LLM)后训练与高效学习:应用最前沿的LLM训练优化技术,如指令微调、强化学习、持续学习等,在最少标注数据的情况下优化AI客服响应质量,具备大语言模型(LLM)微调、知识蒸馏或强化学习的相关经验,应用于对话式AI场景;深入理解检索增强生成(RAG)、专家混合模型(MoE)、稀疏注意力、强化学习、推理时间优化等技术,以提升AI对话质量; 3、基准测试与训练数据构建:识别具有挑战性的客服交互场景,如政策解读、争议处理、客户投诉、导购推荐等,并构建专门的测试集和训练集; 4、多语言与跨文化客服支持:构建能够适应多语言和不同文化背景的AI模型,确保客服交互的精准翻译和针对不同用户群体的合适响应;精通多语言自然语言处理(NLP)、机器翻译及跨语言对话建模; 5、模型优化与高效部署:研究模型压缩、量化、推理优化等技术,确保AI客服助手在大规模应用场景下具备低延迟、高可靠性的表现。