阿里云阿里云智能-大模型算法开发高级工程师-杭州

社招全职3年以上云智能集团2026-04-03地点：杭州状态：招聘

扫码手机上打开

任职要求

1. 深厚的算法理解力： 能够独立阅读并拆解大模型领域的前沿论文，理解 Transformer 及其衍生架构的数学原理与计算逻辑（不仅是会调用，更要懂原理）。
2. 硬核工程动手能力： 精通 Python/C++ 研发，熟练掌握PyTorch开发、有PyTorch分布式训练经验，有SFT、DPO、GRPO等后训练或强化学习实战经验，有 Agentic RL 训练经验。
3. 异构研发经验： 在处理大规模分布式推理或训练任务中，具备解决死锁、显存瓶颈及精度对齐等实际问题的实战经历，有主…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 前沿模型架构研发：负责大模型前沿架构（如 Linear Attention、原生多模态、MoE 等）的底层工程实现。深度参与算法底层逻辑重构，将前沿理论模型转化为高性能的训练与推理模型。
2. 复杂算子优化与系统级重构：针对非标准及新型算法架构，设计并实现深度定制化的分布式算子。通过重构核心计算组件，解决超大规模模型在异构算力集群下的瓶颈问题，打造具备极致响应速度和吞吐能力的推理后端。
3. 大规模并行策略与资源调度：设计并落地匹配复杂架构的计算并行策略（TP/PP/EP/CP）及精细化显存管理方案。持续优化大规模集群通信机制，降低通信开销，确保在算力池中实现模型的高效、稳定运行。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

大模型+

Transformer+

Python+

C+++

PyTorch+

SFT+

强化学习+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

阿里云智能-大模型算法开发高级工程师-杭州

社招3年以上

1. 前沿模型架构研发：负责大模型前沿架构（如 Linear Attention、原生多模态、MoE 等）的底层工程实现。深度参与算法底层逻辑重构，将前沿理论模型转化为高性能的训练与推理模型。 2. 复杂算子优化与系统级重构：针对非标准及新型算法架构，设计并实现深度定制化的分布式算子。通过重构核心计算组件，解决超大规模模型在异构算力集群下的瓶颈问题，打造具备极致响应速度和吞吐能力的推理后端。 3. 大规模并行策略与资源调度：设计并落地匹配复杂架构的计算并行策略（TP/PP/EP/CP）及精细化显存管理方案。持续优化大规模集群通信机制，降低通信开销，确保在算力池中实现模型的高效、稳定运行。

更新于 2026-04-03杭州

Token Foundry-大模型算法开发高级工程师-杭州

社招3年以上技术类-开发

更新于 2026-07-17杭州

大模型算法开发

社招3年以上算法开发岗

1.医疗大模型后训练:通过持续预训练、指令微调、RLHF技术手段，提升大模型在指令遵循、医学推理能力、长文本、角色扮演等核心任务上的能力。涉及技术包括但不限于自动数据配比、提升指令数据质量、数据合成、奖励建模、DPO、自进化等技术； 2.大模型智能体核心算法研发:包括意图理解、规划决策、任务分解、工具调用、多智能体协作等关键模块的设计与优化,提升Agent的自主决策和任务完成能力； 3.大模型业务应用:在问诊、诊断等方向达到医生能力等效，并应用于京东健康医疗服务，实现医生效率提升;构建AI原生产品，应用于大规模C端用户健康管理。

更新于 2026-06-10北京

AI大模型算法开发实习生-抖音研发

实习A176461A

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。团队介绍：抖音研发部门负责多款大型产品的研发，包括但不限于抖音、西瓜视频、汽水音乐。加入我们，你将有机会参与亿级用户场景的开发与架构工作，使用前沿的技术助力业务一起不断成长。 1、基于LLM构建面向研发团队的测试提效工具与平台，覆盖需求测试流程中的典型场景，包括但不限于：智能缺陷检测、测试风险分析、用例自动生成等； 2、深入参与复杂在线AI应用的评测体系建设，根据迭代内容设计前沿评测方法，包含评估指标、Agent评估器、评测自动化Workflow等，持续迭代优化在线AI应用效果； 3、持续追踪AI Agent、RAG等领域的最新学术和开源成果（如React、AutoGPT、CrewAI、LangChain等），推动前沿技术落地与产品化。

更新于 2026-04-06北京