
智能互联阿里云智能-大模型算法开发高级工程师-杭州
任职要求
1. 深厚的算法理解力: 能够独立阅读并拆解大模型领域的前沿论文,理解 Transformer 及其衍生架构的数学原理与计算逻辑(不仅是会调用,更要懂原理)。 2. 硬核工程动手能力: 精通 Python/C++ 研发,熟练掌握PyTorch开发、有PyTorch分布式训练经验,有SFT、DPO、GRPO等后训练或强化学习实战经验,有 Agentic RL 训练经验。 3. 异构研发经验: 在处理大规模分布式推理或训练任务中,具备解决死锁、显存瓶颈及精度对齐等实际问题的实战经历,有主…
工作职责
1. 前沿模型架构研发:负责大模型前沿架构(如 Linear Attention、原生多模态、MoE 等)的底层工程实现。深度参与算法底层逻辑重构,将前沿理论模型转化为高性能的训练与推理模型。 2. 复杂算子优化与系统级重构:针对非标准及新型算法架构,设计并实现深度定制化的分布式算子。通过重构核心计算组件,解决超大规模模型在异构算力集群下的瓶颈问题,打造具备极致响应速度和吞吐能力的推理后端。 3. 大规模并行策略与资源调度:设计并落地匹配复杂架构的计算并行策略(TP/PP/EP/CP)及精细化显存管理方案。持续优化大规模集群通信机制,降低通信开销,确保在算力池中实现模型的高效、稳定运行。
1. 前沿模型架构研发:负责大模型前沿架构(如 Linear Attention、原生多模态、MoE 等)的底层工程实现。深度参与算法底层逻辑重构,将前沿理论模型转化为高性能的训练与推理模型。 2. 复杂算子优化与系统级重构:针对非标准及新型算法架构,设计并实现深度定制化的分布式算子。通过重构核心计算组件,解决超大规模模型在异构算力集群下的瓶颈问题,打造具备极致响应速度和吞吐能力的推理后端。 3. 大规模并行策略与资源调度:设计并落地匹配复杂架构的计算并行策略(TP/PP/EP/CP)及精细化显存管理方案。持续优化大规模集群通信机制,降低通信开销,确保在算力池中实现模型的高效、稳定运行。
职位概述: 阿里云飞天实验室正在寻找一位充满激情的大模型应用开发者,加入我们的创新团队,共同构建和优化阿里云百炼大模型平台的核心应用组件, 开发以核心技术驱动的前沿应用的构建。我们专注于前沿的大模型能力,基于最新的模型能力,构建大模型应用,支持阿里云toB客户, 打造海内外和开源社区影响力。 团队介绍: 我们是一支致力于AGI,构建前沿的大模型应用范式的团队。 岗位描述: 1. 负责大规模语言基础模型,多模态模型,文生图、视频生成模型等AI能力的产品化落地工作。 2. 支持百炼大模型平台上应用组件、场景化应用的开发和落地。 3. 主要负责百炼大模型平台应用广场、MCP广场能生态能力建设。 加入我们,你将获得: 1. 与行业顶尖人才共事的机会。 2. 参与前沿技术研究和产品开发的平台。 3. 开放和包容的工作环境如果你渴望在一个充满活力和创新的环境中工作,并且对人工智能技术充满热情,我们期待你的加入!
职位概述 我们正在寻找一位在前端技术和AI应用融合方面有深度实践的高级工程师。您将负责构建智能化的用户界面,将AI能力转化为优秀的用户体验,并在快速发展的技术环境中推动产品创新。 核心职责 主要职责 智能界面开发:设计并实现集成AI功能的前端应用,包括大语言模型交互、智能推荐、数据可视化等功能模块 技术架构设计:负责前端技术选型、架构设计和核心代码实现,确保系统的可扩展性和高性能 产品全流程参与:从需求分析到产品上线,深度参与产品开发的完整链路,包括技术方案设计、开发实现、测试优化 跨团队协作:与算法工程师、产品经理、设计师、后端工程师密切配合,确保AI功能的顺利落地 次要职责 技术分享与指导:参与团队技术分享,指导初级工程师,推动团队技术能力提升 基础设施建设:参与前端基础架构、组件库的建设和维护 技术调研:跟踪前端和AI领域的新技术趋势,评估新技术的应用可能性 任职要求 必备条件 技术经验:3年以上Web前端开发经验,熟练掌握HTML、CSS、JavaScript(ES6+) 技术栈:深入理解React/Hooks、TypeScript、Emotion等现代前端技术栈 问题解决能力:能够独立分析和解决复杂技术问题,在模糊需求下能够推动项目进展 协作能力:具备良好的沟通能力和团队协作精神 学习能力:对新技术保持好奇心,具备快速学习和适应能力 优先条件 全栈能力:具备Node.js或Python开发经验,能够理解前后端集成 大型项目经验:有复杂前端项目的架构设计和性能优化经验 AI技术了解:熟悉TensorFlow.js、ONNX.js等前端AI框架 数据可视化:有数据可视化或人机交互设计的实践经验 开源贡献:在开源社区有积极贡献或技术分享经验 我们提供 参与前沿AI产品的开发机会 与优秀团队成员共同成长的环境 创新的工作氛围 有竞争力的薪酬待遇和职业发展空间 工作环境 鼓励创新和挑战传统思维 快节奏的技术迭代环境 注重数据安全和用户隐私保护 支持技术学习和能力提升
1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、熟悉大模型算法工程化,与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享