阿里云阿里云智能-大语言模型算法专家/高级算法工程师-飞天实验室
任职要求
1. 通过高效的Post-training手段(SFT、RL等)提升LLM在业务场景下的表现,支撑通义的AI普惠影响力建设与调用规模推广,在NeurIPS、ICLR、ICML、ACL等顶级会议上有论文发表者优先。 2. 计算机、人工智能、数学等相关专业硕士及以上学历,具备3年及以上机器学习、大模型相关领域的研发经验,熟悉Qwen等主流大模型架构、具备丰富的模型训练优化经验及LLM Agent、、RLHF、Agent RL等大模型训练技术、掌握高效的分布式训练框架和策略的优先。 3. 解决更复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、Test Time Learning等,能够独立主导从问题建模、数据治理、算法任务设计、实验验证等完整技术闭环,有大模型相关高质量开源项目者优先。 4. 具备丰富大模型相关项目实战经验,有较强的业务理解能力,具备良好的沟通协作能力和跨团队合作意识,能够高效推动项目落地。
工作职责
【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。
【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【职位介绍】 1、负责AI for Science尤其是生物医药方向的基础算法的研究和研发落地,包括不限于蛋白语言模型,基因语言模型,分子基础模型,生成式生物模型等。 2、对AI for Science尤其是基因全链路分析,药物早筛等问题中涉及的智能化和生成式模型等技术进行快速试错,找到可行方案,并不断对其进行创新改进,在各项性能指标上超出现有方案,不断提升行业天花板,不断完善相应的服务化工具。 3、以人工智能技术和高性能计算为基础,在相关方向产出高水平的文章,专利和软件服务,完善公司在AI for Science方面的技术布局,提升公司在相关领域的影响力。
团队介绍 我们是阿里云智能集团飞天实验室团队,致力于通过技术创新和工程实践推动前沿AI技术的落地与应用。团队聚焦于模型服务的基础研发,覆盖从底层架构设计到上层业务支持的全链路开发工作。我们的目标是打造业界最出色、成本最低、效率最高、规模最大、稳定、易用的模型服务平台,支撑大规模AI模型的研发、部署与推理极致优化,助力企业级AI应用的快速发展。 岗位职责 1. 负责大规模语言基础模型、多模态模型、文生图、视频生成模型等AI能力的产品化落地工作; 2. 主要负责通义千问多端核心应用的构建,支持最新模型能力的落地; 3. 支持百炼大模型开发平台上应用组件、场景化应用的开发和落地。
职位概述: 阿里云飞天实验室正在寻找一位充满激情的大模型应用开发者,加入我们的创新团队,共同构建和优化阿里云百炼大模型平台的核心应用组件, 开发以核心技术驱动的前沿应用的构建。我们专注于前沿的大模型能力,基于最新的模型能力,构建大模型应用,支持阿里云toB客户, 打造海内外和开源社区影响力。 团队介绍: 我们是一支致力于AGI,构建前沿的大模型应用范式的团队。 岗位描述: 1. 负责大规模语言基础模型,多模态模型,文生图、视频生成模型等AI能力的产品化落地工作。 2. 支持百炼大模型平台上应用组件、场景化应用的开发和落地。 3. 主要负责百炼大模型平台应用广场、MCP广场能生态能力建设。 加入我们,你将获得: 1. 与行业顶尖人才共事的机会。 2. 参与前沿技术研究和产品开发的平台。 3. 开放和包容的工作环境如果你渴望在一个充满活力和创新的环境中工作,并且对人工智能技术充满热情,我们期待你的加入!