通义通义实验室-算法专家-大模型稳定高效训练探索
任职要求
1. 有大模型算法设计和训练经验的优先。 2. 有大模型算法相关研究经历和具有影响力的科研工作(高引用论文、知名开源项目、企业大模型项目等)的优先。 3. 自我驱动力,动手能力强,对AI行业…
工作职责
1. 探索大模型behavior的系统化control,应对不同场景问题,系统化的设计和训练去追求大模型的极致最优表现。 2. 探索大模型能力的系统性评估,构建大模型的scalable的评测范式,构建大模型评估与训练的耦合机制。 3. 探索大模型的reasoning能力边界,提升大模型在广泛场景下的通用reasoning能力,解决大模型在训练reasoning能力过程中的困难问题,拓展大模型提升reasoning能力的训练范式和场景。
关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。
1、设计并优化大模型与强化学习融合算法架构,提升模型性能,使其适配AIOS运行环境,增强Al agent决策执行能力。 2、深度融合强化学习与大模型训练,精心设计奖励机制促使AI agent在AIOS生态中自主学习并执行最优策略。 3、主导模型训练工作,充分运用分布式计算资源和高效训练策路,精准调优参数,保障模型在AIOS和agent应用中的稳定性。 4、积极探索多模态融合创新应用,拓展模型能力边界,满足AIOS下Al agent复杂交互需求。 5、及时诊断并解决模型训练和应用过程中出现的问题,确保Al agent稳定运行,参与需求讨论,提供建设性技术建议。
1、设计并优化大模型与强化学习融合算法架构,提升模型性能,使其适配AIOS运行环境,增强AI agent决策执行能力; 2、深度融合强化学习与大模型训练,促使AI agent在AIOS生态中自主学习并执行优化策略; 3、主导模型训练,运用分布式计算资源和高效训练策略调优参数,保障模型在AIOS和agent应用中的稳定性; 4、探索多模态融合创新应用,拓展模型能力边界,满足AIOS下AI agent复杂交互需求; 5、及时诊断并解决模型训练和应用过程中出现的问题,确保AI agent稳定运行,参与需求讨论,提供建设性技术建议。