logo of aliyun

阿里云阿里云智能-大模型算法专家/高级专家-北京/杭州

社招全职技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 有大模型应用系统设计、分布式训练、大模型推理优化等实践经验优先;
2. 人工智能、计算机等相关学科的硕士及以上学历,在近3年内有国际顶会文章,或在知名开源项目、企业级大模型平台有核心贡献的优先;
3. 自我驱动力,动手能力强,对AI行业有浓厚…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责大模型(含多模态)及下游任务的训练及优化突破,包括但不限于:异构GPU混合训练和推理加速算法;对齐、强化学习、混合专家等大模型核心训练技术。
2. 分析和解决大模型在领域应用中的技术难题并进行突破,并与业界先进技术进行持续对比。
3. 持续关注业界最新研究动向和技术趋势,对技术方向研判选型,并进行落地。
4. 与产品和工程团队紧密合作,将先进的算法技术应用于实际产品开发。
包括英文材料
大模型+
系统设计+
学历+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

1.负责主流大模型(DeepSeek、通义、LLaMA等)的全栈性能优化,涵盖模型架构优化、训练/推理框架调优及底层算子优化,提升模型在单机/集群场景下不同GPU/NPU硬件平台的运行效率 2.开发创新推理加速方案,通过投机采样算法改进、MTP机制优化等框架级特性,提升MOE架构模型推理效率;并通过优化集群并行推理场景的专家负载均衡、计算/通信 Overlap 等特性,提升集群级别的推理效率 3.完成 W8A8 等量化算法研发,并在框架层面支持量化模式下的 TP、EP 等并行模式的性能优化 4.针对多种计算架构(NVIDIA/AMD GPU、国产化 NPU 等)进行深度硬件适配,开发高性能算子库与内存管理组件,实现跨平台性能优化与资源利用率的提升

更新于 2025-12-12北京|深圳|杭州
logo of eleme
社招3年以上技术类-算法

方向一:搜推效率、生成式、店品券 岗位职责: 1、负责搜索/推荐业务的召回、粗排/精排算法设计和优化,提升大盘转化效率; 2、负责用户、商户、query、营销信号等各维度特征、模型样本等基础模块的搭建和优化; 3、应用机器学习/深度学习、生成式推荐等算法技术,优化召回/排序模型,推动生成式推荐算法的工业落地; 4、与上下游的数据、工程、产品等团队紧密配合,把算法模型等上线到业务场景中,提升业务效果; 5、跟进推荐系统前沿研究方向,结合业务场景进行创新与落地,做技术沉淀和paper发表。 方向二:大混排(统一混排)、全站推 岗位职责: 1、负责混排(信息流+商业化)算法的设计和优化,提升流量变现效率和用户体验; 2、建立并优化目标函数,通过混排多目标优化平衡用户体验 & 平台收益; 3、结合用户画像、内容特征、广告属性等多维度信号,构建高效的特征工程与模型; 4、应用深度学习、强化学习等技术优化推荐与广告混排效果; 5、与工程、产品、运营团队密切协作,将算法落地到生产环境,并持续监控与优化效果; 6、跟踪前沿的推荐与广告算法研究,推动新技术在业务中的应用。

更新于 2026-03-31上海|北京|杭州
logo of aliyun
社招8年以上云智能集团

1. 针对整机柜服务器产品进行全面的计算、互联、监控等能力的全面赋能和开发; 2. 寻找适合于整机柜异构服务器产品的业务产品并进行对应的昆仑组件设计和开发,包含性能评测分析、容器镜像等 3. 针对整机柜硬件架构及业务落地场景,构建故障异常case并能设计故障诊断方案; 4. 负责跟踪及研究主流GPU架构设计技术,参与下一代AI Infra的设计; 5. 根据业务画像,构建有竞争力的异构硬件和系统全链路的量化分析,形成数据决策数据库;有效推动异构服务器产品的规划和落地。

更新于 2025-09-09北京|杭州
logo of aliyun
社招3年以上云智能集团

● 设计和实现高效的训练推理框架,提升多节点、多GPU环境下特别是异构算力场景下的计算效率。具备良好的工程实践和算法理论基础,熟悉底层的硬件编程和常见GPU的算子库开发,能对算法的运行效率如速度、显存占用等进行优化,推动算法稳定、高效的运行。 ● 完善优化训练推理框架,针对市面上的国产信创卡能提出统一的优化方案,并推进在底层的通信效率、资源占用、稳定性方面持续建设。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。完善错误自愈机制,提升平台训练的MFU,打造行业内一流的异构算力混训混推GPU框架。 ● 技术方案设计:主导核心模块技术方案设计与评审,结合业务需求与系统现状,制定可落地的架构规划。 ● 基础服务开发:构建高可用、可扩展的基础服务组件,支持训练/推理框架的快速迭代与稳定部署。 ● 项目管理:主导跨团队协作项目的全生命周期管理,包括需求拆解、排期规划、进度跟踪与风险控制,确保项目高效交付。 ● 持续关注并跟进业界技术发展,比如超长上下文、端到端推理思维链、多模态等方向。

更新于 2025-07-14北京|杭州