logo of aliyun

阿里云阿里云智能-大模型算法专家/高级专家-北京/杭州

社招全职技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 有大模型应用系统设计、分布式训练、大模型推理优化等实践经验优先;
2. 人工智能、计算机等相关学科的硕士及以上学历,在近3年内有国际顶会文章,或在知名开源项目、企业级大模型平台有核心贡献的优先;
3. 自我驱动力,动手能力强,对AI行业有浓厚…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责大模型(含多模态)及下游任务的训练及优化突破,包括但不限于:异构GPU混合训练和推理加速算法;对齐、强化学习、混合专家等大模型核心训练技术。
2. 分析和解决大模型在领域应用中的技术难题并进行突破,并与业界先进技术进行持续对比。
3. 持续关注业界最新研究动向和技术趋势,对技术方向研判选型,并进行落地。
4. 与产品和工程团队紧密合作,将先进的算法技术应用于实际产品开发。
包括英文材料
大模型+
系统设计+
学历+
还有更多 •••
相关职位

logo of quark
社招2年以上技术类-算法

1. 负责语音合成、语音识别、端到端语音交互大模型算法的基础研究和应用落地; 2. 参与语音合成与识别技术在业务场景落地,解决落地过程中的前沿问题,持续优化语音合成与识别核心技术效果; 3. 深入调研和关注音频/NLP/多模态/全模态等方向的前沿技术,持续探索语音技术的新能力和新应用。

更新于 2025-09-19北京|杭州
logo of quark
社招2年以上技术类-算法

1. 探索研究多模态理解、多模态生成、计算机视觉、自然语言处理、音频等前沿技术; 2. 参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成交织的基础模型,提升大模型能力; 3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。

更新于 2025-07-04北京|杭州
logo of tongyi
社招2年以上技术类-算法

1. 探索研究多模态理解、多模态生成、计算机视觉、自然语言处理、音频等前沿技术; 2. 参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成交织的基础模型,提升大模型能力; 3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。

更新于 2025-11-03北京|杭州
logo of aliyun
社招3年以上云智能集团

● 设计和实现高效的训练推理框架,提升多节点、多GPU环境下特别是异构算力场景下的计算效率。具备良好的工程实践和算法理论基础,熟悉底层的硬件编程和常见GPU的算子库开发,能对算法的运行效率如速度、显存占用等进行优化,推动算法稳定、高效的运行。 ● 完善优化训练推理框架,针对市面上的国产信创卡能提出统一的优化方案,并推进在底层的通信效率、资源占用、稳定性方面持续建设。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。完善错误自愈机制,提升平台训练的MFU,打造行业内一流的异构算力混训混推GPU框架。 ● 技术方案设计:主导核心模块技术方案设计与评审,结合业务需求与系统现状,制定可落地的架构规划。 ● 基础服务开发:构建高可用、可扩展的基础服务组件,支持训练/推理框架的快速迭代与稳定部署。 ● 项目管理:主导跨团队协作项目的全生命周期管理,包括需求拆解、排期规划、进度跟踪与风险控制,确保项目高效交付。 ● 持续关注并跟进业界技术发展,比如超长上下文、端到端推理思维链、多模态等方向。

更新于 2025-07-14北京|杭州