理想汽车基座模型-大模型训练框架研发工程师-北京/杭州
任职要求
职位要求 本科及以上学位,计算机、深度学习等相关专业,3年及以上工作经验 熟练掌握Linux环境下的C/C++与Python语言 熟练使用至少一种训练框架(Tensorflow、PyTorch 或其他自研框架) 熟练使用至少一种大规模训练优化框架(Megatron、DeepSpeed、Lightseq 或其他自研框架) 至…
工作职责
岗位职责 负责分析和优化大模型的分布式训练全链路过程,以提升训练性能和效率
负责智能客户运营等多个产品的算法研发与落地,机器学习建模、前沿技术追踪、大语言模型Large Language Model (LLM) 技术在各垂类业务场景落地的核心技术攻坚等。 比如智能运营助手、营销答疑助手、营销Agentic Workflows构建等场景的大模型落地,提升内外部用户的服务效率和用户体验。 职位描述: ‒ 负责基于通用基座大模型结合领域数据构建营销服务领域大模型,包括但不限于如下场景的营销LLM关键技术攻坚: 1. 大模型落地业务场景识别 2. 垂域数据清洗 / 构造 3. 垂域LLM的后训练 4. 搜索增强RAG 5. LLM Agents 6. LLM推理加速 ‒ 探索基于大模型技术的营销场景服务新形态,包括多场景下的大模型对话机器人、智能辅助Copilot、Agentic Workflow大模型在实际业务场景中的落地,打造营销领域的AI Agent标杆。
团队主要负责蚂蚁集团大语言模型的语料优化,涵盖数据扩源、数据质量提升、合成语料、数据利用方式优化、数学/代码/推理/对话能力提升等多个方向。我们致力于通过数据驱动的方式打造业界一流的语言基座模型。 1. 负责大语言模型各阶段训练语料的优化工作,包括预训练、后训练、强化学习训练阶段,具体的工作包括体系化地扩展各类型的数据、定义并迭代优化数据质量、建设高效的合成语料技术、优化高质量数据筛选策略、优化数据配比及训练策略等。 2. 负责端到端地优化基座模型的各项关键能力,包括数学、代码、推理、对话等能力,具体工作包括扩展各能力相关的语料、定义并迭代优化数据质量、针对性地合成相关语料、优化高质量数据筛选策略、优化各阶段数据配比及训练策略、优化评测方式等。 3. 负责研发语料优化相关的基础设施,包括研发高效的数据处理算子及链路、构建数据标签体系及标注模型、探索数据与模型效果的关系、设计数据效果评估机制等。 4. 跟踪和研究大模型领域的前沿技术方向,包括但不限于语料优化、预训练和后训练算法、知识增强、数据合成等,推动技术创新并应用到基座模型训练中。
-负责电商搜索场景的LLM相关算法研发工作,包括但不限于基座训练、sft、偏好对齐等 -利用LLM算法提升业务效果,包括但不限于需求理解、智能问答、优质内容生成、召回排序模块优化等 -跟进NLP/LLM/推荐/搜索等领域前沿技术 -结合产品需求推动前沿技术落地