
智能互联阿里云智能-大语言模型算法专家/高级算法工程师-杭州
任职要求
1. 具备扎实的大语言模型post-training实践经验(SFT/RL/Agent等)和垂域大模型研发落地经历;所研发模型具备大规模线上应用经历(如日均调用量达千万及以上)者优先。 2. 精通Python等语言,熟练掌握PyTorch、verl、vllm等主流训练和推理框架,具备扎实的coding能力;在ACM-ICPC等国内外知名算法竞赛中取得优异成绩者优先。 3. 能够…
工作职责
1. 高质量垂域数据工程:深入优化垂直领域(如文本内容审核)的高质量数据构建与迭代方法论,持续提升数据的质量、多样性与生产效率。 2. 可扩展后训练体系:探索适配领域特性的 SFT/RL 算法,构建高效、稳定、可扩展的垂域模型后训练范式,系统性提升模型能力。 3. 前沿技术研究与落地:探索推理模型前沿技术(如高效蒸馏、reward system、agentic RL、test-time learning 等)以及模型可解释性技术,沉淀技术成果和影响力,并推动大模型相关技术在行业场景中的转化与落地,提升领域模型竞争力,支撑业务持续增长。
【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。
1. 高质量垂域数据工程:深入优化垂直领域(如文本内容审核)的高质量数据构建与迭代方法论,持续提升数据的质量、多样性与生产效率。 2. 可扩展后训练体系:探索适配领域特性的 SFT/RL 算法,构建高效、稳定、可扩展的垂域模型后训练范式,系统性提升模型能力。 3. 前沿技术研究与落地:探索推理模型前沿技术(如高效蒸馏、reward system、agentic RL、test-time learning 等)以及模型可解释性技术,沉淀技术成果和影响力,并推动大模型相关技术在行业场景中的转化与落地,提升领域模型竞争力,支撑业务持续增长。
【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【职位介绍】 1、负责AI for Science尤其是生物医药方向的基础算法的研究和研发落地,包括不限于蛋白语言模型,基因语言模型,分子基础模型,生成式生物模型等。 2、对AI for Science尤其是基因全链路分析,药物早筛等问题中涉及的智能化和生成式模型等技术进行快速试错,找到可行方案,并不断对其进行创新改进,在各项性能指标上超出现有方案,不断提升行业天花板,不断完善相应的服务化工具。 3、以人工智能技术和高性能计算为基础,在相关方向产出高水平的文章,专利和软件服务,完善公司在AI for Science方面的技术布局,提升公司在相关领域的影响力。