智能互联阿里云智能-大模型算法开发高级工程师-杭州

社招全职3年以上2026-04-03地点：杭州状态：招聘

扫码手机上打开

任职要求

1. 深厚的算法理解力： 能够独立阅读并拆解大模型领域的前沿论文，理解 Transformer 及其衍生架构的数学原理与计算逻辑（不仅是会调用，更要懂原理）。
2. 硬核工程动手能力： 精通 Python/C++ 研发，熟练掌握PyTorch开发、有PyTorch分布式训练经验，有SFT、DPO、GRPO等后训练或强化学习实战经验，有 Agentic RL 训练经验。
3. 异构研发经验： 在处理大规模分布式推理或训练任务中，具备解决死锁、显存瓶颈及精度对齐等实际问题的实战经历，有主…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 前沿模型架构研发：负责大模型前沿架构（如 Linear Attention、原生多模态、MoE 等）的底层工程实现。深度参与算法底层逻辑重构，将前沿理论模型转化为高性能的训练与推理模型。
2. 复杂算子优化与系统级重构：针对非标准及新型算法架构，设计并实现深度定制化的分布式算子。通过重构核心计算组件，解决超大规模模型在异构算力集群下的瓶颈问题，打造具备极致响应速度和吞吐能力的推理后端。
3. 大规模并行策略与资源调度：设计并落地匹配复杂架构的计算并行策略（TP/PP/EP/CP）及精细化显存管理方案。持续优化大规模集群通信机制，降低通信开销，确保在算力池中实现模型的高效、稳定运行。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

大模型+

Transformer+

Python+

C+++

PyTorch+

SFT+

强化学习+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

阿里云智能-大模型算法开发高级工程师-杭州

社招3年以上云智能集团

1. 前沿模型架构研发：负责大模型前沿架构（如 Linear Attention、原生多模态、MoE 等）的底层工程实现。深度参与算法底层逻辑重构，将前沿理论模型转化为高性能的训练与推理模型。 2. 复杂算子优化与系统级重构：针对非标准及新型算法架构，设计并实现深度定制化的分布式算子。通过重构核心计算组件，解决超大规模模型在异构算力集群下的瓶颈问题，打造具备极致响应速度和吞吐能力的推理后端。 3. 大规模并行策略与资源调度：设计并落地匹配复杂架构的计算并行策略（TP/PP/EP/CP）及精细化显存管理方案。持续优化大规模集群通信机制，降低通信开销，确保在算力池中实现模型的高效、稳定运行。

更新于 2026-04-03杭州

阿里云智能-大模型算法专家-杭州

社招5年以上云智能集团

1. 参与阿里云AI产品的创新研发，基于LLM、多模态等大模型构建有商业化价值的视频、图片、文档等处理应用和完整技术解决方案；具体工作包括但不限于对模型进行Post-training，多智能体协同，以及通过传统机器学习模型加强AI应用的效果和效率； 2. 参与阿里云AI产品的算法迭代和技术框架设计，包括但不限于算法链路设计、数据集建设、模型优化、自动化评估、面向商业化效果的AB实验体系构建、算法部署等工作； 3. 基于需求分析将复杂的业务场景分解抽象为可理解的模型，通过开源业界&公司内调研进行合适的算法技术选型，进行系统化取舍判断并推演设计出最终算法解决方案。

更新于 2026-02-09杭州

阿里云智能-大模型算法专家-杭州

社招5年以上

更新于 2026-04-03杭州

阿里云智能-大模型研发算法专家/高级算法专家（多模态/全模态/LLM）-北京/杭州

社招3年以上云智能集团

1、围绕行业AI应用快速落地，研发端到端智能体核心技术，方向包括但不限于：Agent RL强化学习方法、全模态数据解析与私域知识加工、自规划和自主进化的多智能体等技术，提升智能体在复杂业务流中的效果与适应性。 2、攻坚突破大模型产品在行业应用落地和交付过程中的技术难题，与业界先进技术进行持续对比，并保持优势。 3、具备良好的产品化思维，驱动产品迭代，与产品和工程团队紧密合作，将算法技术应用于实际产品，带来产品商业化增量和竞争力。 4、深入研究大模型和智能体技术，持续关注和探索大模型和智能体方向的前沿动向和技术趋势，打造产品业界影响力。

更新于 2026-02-05北京|杭州