logo of alibaba

阿里巴巴未来生活实验室-大模型训练算法专家-北京/杭州

社招全职地点:北京 | 杭州状态:招聘

任职要求


1. 自然语言处理机器学习数据挖掘、人工智能等相关专业的硕士生/博士生;
2. 熟练掌握Tensorflow、Pytorch等深度学习框架,扎实的编程基础,具备独立的算法实现能力;
3. …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 跟进和研发大规模语言模型(LLM)的预训练、持续训练、SFT、RLHF 等技术。
2. 跟进多模态的大模型(vLLM)预训练、SFT、RLHF等技术。
3. 研发基于大模型的淘宝问问助手、ChatBot、检索增强、Code、Longchain等下游应用。
4. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
包括英文材料
NLP+
机器学习+
数据挖掘+
TensorFlow+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

1.负责主流大模型(DeepSeek、通义、LLaMA等)的全栈性能优化,涵盖模型架构优化、训练/推理框架调优及底层算子优化,提升模型在单机/集群场景下不同GPU/NPU硬件平台的运行效率 2.开发创新推理加速方案,通过投机采样算法改进、MTP机制优化等框架级特性,提升MOE架构模型推理效率;并通过优化集群并行推理场景的专家负载均衡、计算/通信 Overlap 等特性,提升集群级别的推理效率 3.完成 W8A8 等量化算法研发,并在框架层面支持量化模式下的 TP、EP 等并行模式的性能优化 4.针对多种计算架构(NVIDIA/AMD GPU、国产化 NPU 等)进行深度硬件适配,开发高性能算子库与内存管理组件,实现跨平台性能优化与资源利用率的提升

更新于 2025-12-12北京|深圳|杭州
logo of aliyun
社招8年以上云智能集团

1. 针对整机柜服务器产品进行全面的计算、互联、监控等能力的全面赋能和开发; 2. 寻找适合于整机柜异构服务器产品的业务产品并进行对应的昆仑组件设计和开发,包含性能评测分析、容器镜像等 3. 针对整机柜硬件架构及业务落地场景,构建故障异常case并能设计故障诊断方案; 4. 负责跟踪及研究主流GPU架构设计技术,参与下一代AI Infra的设计; 5. 根据业务画像,构建有竞争力的异构硬件和系统全链路的量化分析,形成数据决策数据库;有效推动异构服务器产品的规划和落地。

更新于 2025-09-09北京|杭州
logo of aliyun
社招5年以上云智能集团

1. 负责算力引入的前置测试,主要包含整机压测,部件性能测试,多机训练/推理单集群多品牌机器混部场景测试。 2. 负责算力引入GPU软硬件结合的疑难故障&性能问题分析和解决。 3. 负责GPU压测,监控,故障诊断工具开发和优化。 4. 负责主流模型和应用在新异构系统上的性能评测和分析。 5. 负责分析大规模LLM在训练和推理中面临的的AI异构硬件系统瓶颈,提出面向未来的AI异构系统架构建议,以支撑更高效的LLM扩展。

更新于 2025-11-26北京|杭州
logo of aliyun
社招2年以上云智能集团

1、负责政企客户的大模型需求收集、分析,设计服务解决方案,通过SOP的把控,端到端的把控项目风险和履约落地。 2、负责政企客户的大模型项目专家技术支持,包括但不限于模型调优、Prompt工程、工作流、RAG、AI agent。 3、负责阿里云 AIStudio、AIWorks等平台的企业级客户的专家服务,持续推动客户做好标准化大模型迁云、云上优化,并根据现场问题持续反馈推进产品改进。 4、深入大模型和客户业务的结合,沉淀孵化大模型服务解决方案,制定服务差异化竞争策略,助力客户在大模型应用上取得成功。

更新于 2025-08-19北京|深圳|杭州