
智能互联阿里云智能-大模型算法开发高级工程师-杭州
任职要求
1. 深厚的算法理解力: 能够独立阅读并拆解大模型领域的前沿论文,理解 Transformer 及其衍生架构的数学原理与计算逻辑(不仅是会调用,更要懂原理)。 2. 硬核工程动手能力: 精通 Python/C++ 研发,熟练掌握PyTorch开发、有PyTorch分布式训练经验,有SFT、DPO、GRPO等后训练或强化学习实战经验,有 Agentic RL 训练经验。 3. 异构研发经验: 在处理大规模分布式推理或训练任务中,具备解决死锁、显存瓶颈及精度对齐等实际问题的实战经历,有主…
工作职责
1. 前沿模型架构研发:负责大模型前沿架构(如 Linear Attention、原生多模态、MoE 等)的底层工程实现。深度参与算法底层逻辑重构,将前沿理论模型转化为高性能的训练与推理模型。 2. 复杂算子优化与系统级重构:针对非标准及新型算法架构,设计并实现深度定制化的分布式算子。通过重构核心计算组件,解决超大规模模型在异构算力集群下的瓶颈问题,打造具备极致响应速度和吞吐能力的推理后端。 3. 大规模并行策略与资源调度:设计并落地匹配复杂架构的计算并行策略(TP/PP/EP/CP)及精细化显存管理方案。持续优化大规模集群通信机制,降低通信开销,确保在算力池中实现模型的高效、稳定运行。
1. 前沿模型架构研发:负责大模型前沿架构(如 Linear Attention、原生多模态、MoE 等)的底层工程实现。深度参与算法底层逻辑重构,将前沿理论模型转化为高性能的训练与推理模型。 2. 复杂算子优化与系统级重构:针对非标准及新型算法架构,设计并实现深度定制化的分布式算子。通过重构核心计算组件,解决超大规模模型在异构算力集群下的瓶颈问题,打造具备极致响应速度和吞吐能力的推理后端。 3. 大规模并行策略与资源调度:设计并落地匹配复杂架构的计算并行策略(TP/PP/EP/CP)及精细化显存管理方案。持续优化大规模集群通信机制,降低通信开销,确保在算力池中实现模型的高效、稳定运行。
【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。
职位概述: 阿里云飞天实验室正在寻找一位充满激情的大模型应用开发者,加入我们的创新团队,共同构建和优化阿里云百炼大模型平台的核心应用组件, 开发以核心技术驱动的前沿应用的构建。我们专注于前沿的大模型能力,基于最新的模型能力,构建大模型应用,支持阿里云toB客户, 打造海内外和开源社区影响力。 团队介绍: 我们是一支致力于AGI,构建前沿的大模型应用范式的团队。 岗位描述: 1. 负责大规模语言基础模型,多模态模型,文生图、视频生成模型等AI能力的产品化落地工作。 2. 支持百炼大模型平台上应用组件、场景化应用的开发和落地。 3. 主要负责百炼大模型平台应用广场、MCP广场能生态能力建设。 加入我们,你将获得: 1. 与行业顶尖人才共事的机会。 2. 参与前沿技术研究和产品开发的平台。 3. 开放和包容的工作环境如果你渴望在一个充满活力和创新的环境中工作,并且对人工智能技术充满热情,我们期待你的加入!
团队介绍 我们是阿里云智能集团飞天实验室团队,致力于通过技术创新和工程实践推动前沿AI技术的落地与应用。团队聚焦于模型服务的基础研发,覆盖从底层架构设计到上层业务支持的全链路开发工作。我们的目标是打造业界最出色、成本最低、效率最高、规模最大、稳定、易用的模型服务平台,支撑大规模AI模型的研发、部署与推理极致优化,助力企业级AI应用的快速发展。 岗位职责 1. 负责大规模语言基础模型、多模态模型、文生图、视频生成模型等AI能力的产品化落地工作; 2. 主要负责通义千问多端核心应用的构建,支持最新模型能力的落地; 3. 支持百炼大模型开发平台上应用组件、场景化应用的开发和落地。