通义通义实验室-算法专家-多语言大模型
任职要求
1. 研究生以上学历,极佳的工程实现能力,熟悉Pytorch、Tensorflow等至少一种深度学习框架; 2. 熟悉机器学习/自然语言处理理论,实际参与建设过大模型预训练、微调、偏好对齐中至少一项,熟悉流程; 3.对于大模型…
工作职责
1. 负责基础大模型多语言能力研发,解决低资源、知识迁移、文化差异、安全对齐等技术问题。 2. 大模型应用算法前沿技术追踪、探索,建设技术影响力。 3. 负责研发基于大模型的多语言/跨语言任务处理新范式,构建基于大模型的多语言应用。 4. 负责大模型的在电商、教育、广告、游戏等多语言业务场景的应用落地。
1. 负责Qwen-Omni多语言能力研发,解决多语言语音翻译、实时同传等技术问题。 2. 大模型算法前沿技术追踪、探索,建设技术影响力。 3. 研发基于多模态大模型的多语言/跨语言任务处理新范式,构建基于大模型的多语言应用。 4. 负责在电商、教育、广告、游戏等多语言业务场景的应用落地。
阿里国际客户体验部算法团队,负责国际电商(AliExpress、Lazada、Daraz等平台)在线客服(图文沟通)、热线客服(电话沟通)、客服工作台的各类算法建设。面临几十种语言的复杂服务问题,目前聚焦大模型优化和Agent构建,在保证客户服务质量的情况下,大幅提升服务效率和降低服务成本。 1、多语言大模型的优化,包括:多语言对话数据挖掘与清洗、任务微调、强化学习偏好对齐等; 2、设计智能体框架和落地实现,推动在国际各个电商平台上的客服系统落地; 3、根据业务问题,探索大模型优化和应用的新范式。
关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。