logo of aliyun

阿里云阿里云智能-大语言模型算法专家/高级算法工程师-杭州

社招全职3年以上云智能集团地点:杭州状态:招聘

任职要求


1. 具备扎实的大语言模型post-training实践经验(SFT/RL/Agent等)和垂域大模型研发落地经历;所研发模型具备大规模线上应用经历(如日均调用量达千万及以上)者优先。
2. 精通Python等语言,熟练掌握PyTorch、verl、vllm等主流训练和推理框架,具备扎实的coding能力;在ACM-ICPC等国内外知名算法竞赛中取得优异成绩者优先。
3. 能够…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 高质量垂域数据工程:深入优化垂直领域(如文本内容审核)的高质量数据构建与迭代方法论,持续提升数据的质量、多样性与生产效率。
2. 可扩展后训练体系:探索适配领域特性的 SFT/RL 算法,构建高效、稳定、可扩展的垂域模型后训练范式,系统性提升模型能力。
3. 前沿技术研究与落地:探索推理模型前沿技术(如高效蒸馏、reward system、agentic RL、test-time learning 等)以及模型可解释性技术,沉淀技术成果和影响力,并推动大模型相关技术在行业场景中的转化与落地,提升领域模型竞争力,支撑业务持续增长。
包括英文材料
SFT+
AI agent+
大模型+
Python+
PyTorch+
vLLM+
还有更多 •••
相关职位

logo of aliyun
社招3年以上云智能集团

【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。

更新于 2025-10-18杭州
logo of alibaba
社招1年以上技术类-算法

1、参与LLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求 2、支持通用ai agent在产品业务应用中的落地研发和效果优化,包括但不限于通用ai agent,深入理解大模型和通用ai agent运行原理,明确提升通用ai agent效果的核心技术方向。 3、负责ai agent的框架构建,agent与工具调用的优化,相关场景下大模型的优化,将ai agent框架、工具、大模型有效结合,为通用ai agent效果提供最佳的使用体验。

更新于 2025-09-16杭州
logo of tongyi
社招3年以上技术类-算法

1. 具身智能大模型研究与优化 (1) 研究和构建具身智能大模型(Embodied Foundation Models)与机器人大脑。 (2) 探索语言、视觉、动作等多模态融合机制(VLM / VLA / VLA-Agent)。 (3) 优化模型的长时记忆、推理能力与可泛化性。 2. 机器人智能算法研发 (1) 设计和实现机器人多模态感知、导航、操作、交互等核心算法模块。 (2) 推进大模型驱动的机器人任务规划与决策。 (3) 基于模拟器与真实世界数据,进行大规模对齐与强化学习(Sim2Real, RLHF, Imitation Learning)。 3. 系统落地与协同研发 (1) 与硬件与系统团队协作,推动模型算法在真实机器人平台上的部署与性能调优。 (2) 支撑具身智能大模型的云端训练体系、数据闭环与MLOps工程。 (3) 发表高水平论文或申请相关专利,推动业界与学界前沿研究。

更新于 2025-12-18北京|杭州
logo of alibaba
社招2年以上技术类-算法

【职位描述】: 1、负责AI产品开发与应用:围绕外贸商品构建B类商品模型、AI发品、负向治理等能力; 2、技术能力:电商领域多模态大模型,包括从监督微调(SFT)到强化学习人类反馈(RLHF)的全链路技术构建,以及智能Agent系统,涵盖但不限于检索增强生成(RAG)系统、Agent系统和工作流推理等。 3、推动跨境电商AI创新业务的落地实施,包括高效的商品AI大模型、AI发品和诊断Agent等解决方案。 4、开展前沿LLM技术的探索,持续迭代和优化自研模型能力,以支持AI原生产品的实施。

更新于 2025-10-23杭州