阿里巴巴阿里妈妈-广告AI Serving研发工程师-北京
任职要求
1. 计算机、软件工程、电子信息、自动化、数学等相关专业背景。 2. 有较好的工程能力,熟练使用C++,精通数据结构和常用算法,掌握各种编译、调试、性能分析工具。 3. 有下面一个或多个方面的背景优先: (1) 有AI相关领域背景,熟悉TensorFlow/PyTorch/XLA/MLIR/TVM等业界主流AI框架或编译器优先; (2)…
工作职责
面向电商场景的广告/搜索/推荐业务,针对 召回/排序/机制策略 和 多模态AI模型、以及超大规模稀疏特征与Embedding,打造高性能的AI Serving系统。开展: 1. CPU/GPU/ASIC软硬件协同优化,发挥数十万CPU核和近万加速卡的计算潜力; 2. 稠密大模型 结合 稀疏-稠密模型的广告深度学习系统优化、编译优化和算法优化; 3. 面向广告/搜索/推荐AI Serving的新迭代范式探索。
服务淘天电商核心营销业务,针对AI在广告业务场景的应用开展: 1. 负责广告预测引擎及AI Serving系统的设计与开发,支持高并发、低延迟的广告实时预测需求,解决实际的业务问题; 2. 参与分布式系统架构优化,提升广告模型服务的稳定性、资源利用率及大规模模型计算能力; 3. 算法-软件-硬件协同优化(异构并行计算、AI编译、稀疏量化、混部与弹性等),发挥数十万CPU核和数千加速卡的计算潜力; 4. 研究业界前沿的AI算法、系统和硬件,探索面向推荐系统或大模型AI在线服务的理想软件和硬件系统。
【岗位职责】 1. 主导新一代训练与推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。 2. 与存储、数据平台深度协同,打造端到端 ML 数据 Pipeline:统一特征管理、秒级调试、版本追踪与一键上线,让数据科学家专注模型创新。 3. 持续优化训推基础设施:自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架,实现 10x 级性能提升。 4. 跟踪 LLM / Agent 最新进展,将其工程化落地到搜索、广告、推荐及智能体业务,定义行业新标准。
1. 主导新一代训练与推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。 2. 与存储、数据平台深度协同,打造端到端 ML 数据 Pipeline:统一特征管理、秒级调试、版本追踪与一键上线,让数据科学家专注模型创新。 3. 持续优化训推基础设施:自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架,实现 10x 级性能提升。 4. 跟踪 LLM / Agent 最新进展,将其工程化落地到搜索、广告、推荐及智能体业务,定义行业新标准。
我们是淘天集团阿里妈妈工程平台团队,致力于打造面向搜推广场景及AIGX应用的业界最强AI在线服务平台。团队服务于淘天电商核心业务,承担 广告模型超大规模特征工程和AI推理、LLM/Diffusion等大模型服务 的研发和优化等关键职责,在高性能在线服务(推荐系统/多模态大模型/大语言模型)、分布式系统(计算/存储/网络)、异构计算和AI编译优化(CPU/GPU/XPU)等课题上都具有业界最前沿的挑战。 1)负责超大规模生成式模型在线服务系统架构设计并推进落地; 2)负责大规模异构硬件系统inference在离线计算资源优化; 3)负责模型交付pipeline整体优化。