logo of alibaba

阿里巴巴阿里妈妈-AI Training专家-北京

社招全职3年以上地点:北京状态:招聘

任职要求


我们希望你:
-  计算机/人工智能/软件工程/电子信息/自动化/数学等相关专业背景,博士优先。
- 有超大规模分布式机器学习系统设计开发与Training System经验,了解MLSys相关前沿技术并能推动创新实践;熟悉TensorFlow/PyTorch/XLA/MLIR/TVM/TRT-LLM/DeepSpeed/Megatron等业界主流AI框架或编译器优先。
- 具备一线的C++/Python工程能力,精通数据结构和常用算法,掌握各种编译、调试、性能分析工具,有CPU/GPU/ASIC系统软件或硬件背景,熟悉计算机体系结构,熟悉并行编程(CUDA/OpenCL等);有代码生成和优化背景,熟悉GCC/LLVM等主流编译器的实现的优先。

工作职责


我们是淘天集团阿里妈妈工程平台团队,致力于打造面向搜推广场景及GenAI与AI Agent应用的AI Infra平台。团队服务于淘天电商广告核心业务,承担 广告模型超大规模Embedding表征学习和Sparse-Dense模型及Dense大模型(LLMs/Diffusion等)训练与推理,AI Infra研发和优化等关键职责,在高性能在线服务&训练平台(推荐系统/多模态大模型/大语言模型)、分布式系统(计算/存储/网络)、异构计算和AI编译优化(GPGPU/CPU)等课题上都具有业界前沿的挑战。
1. 负责超大规模Sparse-Dense模型(for 广告)和Dense大模型(for GenAI应用)的训练架构设计优化并推动生产落地。
2. 负责大规模异构硬件Training系统的计算性能与效率优化。
3. Algorithm-Training-Inference Co-Design,整体提升模型效率。
包括英文材料
机器学习+
系统设计+
TensorFlow+
PyTorch+
大模型+
DeepSpeed+
Megatron+
C+++
Python+
数据结构+
算法+
CUDA+
OpenCL+
GCC+
LLVM+
相关职位

logo of alibaba
社招

我们是淘天集团阿里妈妈工程平台团队,致力于打造面向搜推广场景及GenAI与AI Agent应用的AI Infra平台。团队服务于淘天电商广告核心业务,承担 广告模型超大规模Embedding表征学习和Sparse-Dense模型及Dense大模型(LLMs/Diffusion等)训练与推理,AI Infra研发和优化等关键职责,在高性能在线服务&训练平台(推荐系统/多模态大模型/大语言模型)、分布式系统(计算/存储/网络)、异构计算和AI编译优化(GPGPU/CPU)等课题上都具有业界前沿的挑战。 1. 负责超大规模Sparse-Dense模型(for 广告)和Dense大模型(for GenAI应用)的训练架构设计优化并推动生产落地。 2. 负责大规模异构硬件Training系统的计算性能与效率优化。 3. Algorithm-Training-Inference Co-Design,整体提升模型效率。

更新于 2025-06-17
logo of quark
社招3年以上技术类-算法

岗位描述: 全面负责夸克大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建,驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展,打造世界一流的模型效果,并定义其在未来 AI 应用中的核心价值。 工作职责: ● 【战略规划与技术引领】 制定并执行大模型 Post-training 的中长期技术路线图,预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向,确保技术路径与公司业务战略高度协同。 ● 【核心能力与壁垒构建】 领导团队进行体系化的数据驱动实验,不仅局限于日常迭代,更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题,构建技术壁垒。 ● 【前沿算法研究与创新】 深入探索并推动 Post-training 领域的前沿算法创新,包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。 ● 【多模态与未来探索】 从统一多模态模型的战略视角出发,您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略,确保模型在图文问答、视频对话 等复杂场景下实现无缝、精准的理解与生成。 ● 【团队领导与效能提升】 负责 Post-training 算法团队的组建、培养与管理,打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架,实现研发效能的倍增。

更新于 2025-09-16
logo of bytedance
社招A259550

团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、基于通用大模型,结合创作垂类应用场景,进行相关的数据建设、指令微调、偏好对齐、模型优化,升数据合成、模型推理 & 规划能力,构建全面客观准确的评测体系,探索提升垂类大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建以智能创作为核心的多模态AI Agent;推动相关的新技术、新产品落地。

更新于 2024-10-21
logo of tencent
社招5年以上搜索-元宝技术

1.负责AI搜索中大模型后训练方向的核心技术研发,包括SFT、偏好学习、强化学习等算法研发、优化与创新,提升AI搜索的回复效果; 2.跟踪AI搜索领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用; 3.参与产品讨论,基于技术对产品提出改进建议。

更新于 2025-09-22