logo of eleme

饿了么淘宝闪购-模型训练推理优化专家-上海

社招全职2年以上技术类-开发地点:上海状态:招聘

任职要求


1、计算机相关专业本科及以上学历,具有扎实的工程算法基础,掌握各种编译、调试、性能分析工具
2、极佳的工程实现能力,精通C/C++Python,熟悉常用的机器学习框架(如TensorFlow、Py…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责淘宝闪购深度模型和超大规模训练推理,支持万亿规模的稠密及稀疏训练推理优化,结合分布式系统、高性能计算、异构计算,探索性能边界,支撑超大规模模型的训练及推理部署
我们关注超大规模模型训练及推理系统,为深度学习模型提供算力基座

岗位职责:
1、支持百亿-万亿规模的稠密模型、稀疏模型训练,在千卡集群上,实现多种分布式训练架构,以及强化学习训推一体复用等技术,消除各类大规模模型分布式训练的瓶颈
2、支持大规模深度模型的推理部署性能优化,通过高性能计算、分布式计算、异构计算、编译优化等手段,在千卡集群上,解决大尺寸模型的推理性能瓶颈
3、深入工程和算法协同,结合大规模推荐、大语言、多模态算法,探索适合业务的创新训练范式
包括英文材料
学历+
算法+
C+
C+++
Python+
还有更多 •••
相关职位

logo of eleme
社招3年以上技术类-算法

1. 构建和维护外卖即时物流领域的知识库,整合行业数据、业务规则和专家经验,利用大模型技术对知识库进行自动化更新和优化,提升知识库的覆盖率和准确性。 2. 负责海量数据的清洗,构建高质量的训练数据集。 3. 负责即时物流大模型的架构设计、训练、微调,在效果、推理速度、计算和存储成本推理等方面迭代到先进水平。 4. 将大模型技术应用于外卖即时物流的核心业务场景,如供需预测、骑手行为建模、路径优化、指标归因等,提升下游任务收益。 5. 跟踪大模型领域的最新研究成果,结合业务需求进行技术创新,探索大模型在物流配送中的无限可能。

更新于 2026-01-16北京|上海
logo of eleme
社招3年以上技术类-算法

1. 负责B端餐饮SaaS业务核心算法模块的设计、开发与持续优化,探索并落地大模型(LLM)在餐饮SaaS业务领域的创新应用,如智能自然语言对话取数、数据分析、智能营销、智能文案生成、Agent驱动的自动化运营等; 2. 掌握LLM相关Prompt Engineering、RAG、微调、强化学习等前沿技术,能够构建高效、可扩展的实时特征工程与在线推理系统,支撑高并发、低延迟的算法服务; 3. 主导模型应用与AI基建技术架构演进,与产品、工程、数据、运营团队紧密协作,将算法能力转化为实际业务价值;优化数据合成、模型训练、Agent服务等核心环节,解决推理优化、大模型幻觉、知识库召回准确率等复杂技术问题。

更新于 2026-01-20成都
logo of eleme
校招淘宝闪购秋季20

我们是淘宝闪购AI算法团队,工作涉及:外卖垂域大模型训练、Agent和AI产品创新、图片理解与生成、视频语音多模态等方面,围绕餐饮/零售/医药等业务,紧密支撑搜索、推荐、营销、用增、toB等多场景的AI需求。 具体职责包括但不限于: 1、参与大语言模型、AIGC(图片/视频)生成大模型、多模态模型工作,包括数据收集与处理、预训练和领域持续预训练、提示与指令设计、SFT与RL对齐、通用&应用能力的训练。 2、参与AI应用项目的研发工作,让AI能力落地取得收益,比如在智能搜索、导购体验、下单效率、AI点餐、图片素材、视频素材、创意生成等,支撑搜索/推荐/营销/用增/供给等多个场景。 3、具备一定的AI Infra能力,基于大模型底层训练平台和业界主流框架,来训练和调优模型。能够参与到底层模型工程团队的训练推理加速、资源优化等工作中,有CUDA算子优化经验者优先。 4、AI技术日新月异,对前沿技术敏感;能及时跟进并消化吸收前沿技术,将其转化为实际生产力,包括且不限于NLP、CV、搜推广营销等领域;有一定的学术能力,能跟业界、学界保持良好的交流。

更新于 2025-12-05上海
logo of eleme
校招淘宝闪购秋季20

负责淘宝闪购搜索推荐场景下,生成式大模型训练及推理能力迭代,主要解决大规模数据下的分布式训练以及在线推理能力。 1、参与生成式模型相关的大规模分布式机器学习平台的架构设计和构建; 2、参与大规模海量数据的离线训练和在线推理,提升模型预测的准确性和实时性; 3、与算法部门深度合作,进行算法与系统的联合优化; 4、持续关注领域内先进的技术和理论,负责机器学习系统前瞻技术的调研和引入。

更新于 2026-01-15北京|上海