阿里巴巴【急招】业务技术-大模型算法专家/高级工程师-杭州/北京
任职要求
1. 自然语言处理、机器学习、人工智能、计算机、电子与通信等相关专业的硕士生/博士生; 2. 熟悉LLM/MLLM的基本原理和相关算法,具备良好的逻辑分析能力和数理基础,在顶会(如NeurIPS、ICLR、ICML等)或期刊上有论文发表者优先; 3. 熟练掌握P…
工作职责
1. 负责大模型(LLM/MLLM)核心技术研发,包括预训练、垂域SFT、RLHF等,持续追踪和应用领域最新技术进展; 2. 负责大模型性能优化:研发模型加速技术,如量化、剪枝与知识蒸馏;优化数据特征与调度策略;构建高效推理链路、提升运行速度及降低成本; 3. 基于淘天用户丰富的消费行为,打造技术先进的电商用户理解大模型,提升对用户的异构行为本质的认知能力,支撑用户个性化的搜索、商详、互动等多种电商业务场景; 4. 基于淘天海量商品数据,打造技术先进的电商多模态大模型,提升对多模态异构的商品数据(图、文、视频等)的理解能力和结构化能力,输出底层算法能力和高质量结构化数据,支撑多种电商业务场景,并面向商家和消费者探索AIGC等创新业务应用; 5. 持续跟踪、探索大模型/多模态大模型方向的前沿技术,将各方向的SOTA能力集成到模型底座上,提升下游任务的效果,打造团队的技术先进性。
团队介绍 淘宝搜索不仅是阿里电商的核心流量入口,更是承接数亿用户购物需求、驱动集团业务增长的超级引擎。作为全集团算法密度最高、数据规模最大、业务复杂度最强的核心场景,我们正在经历从“传统搜索”向“下一代 AI 搜索”的深刻变革。 在这里,你的每一行代码都可能重塑亿万用户的购物体验,每一次技术决策都可能驱动电商大盘的增长引擎。搜索远不止“查询”——它是一个高度个性化的超级入口:千人千面、千次搜索千种链路,不同搜索词触发不同的召回、排序与展现策略。业务快速迭代,新场景层出不穷,挑战与创新始终并存。 在这里,你面临的既有分布式系统超高并发、极低延迟的架构挑战,也有 AI 大模型在工业级产品落地的无限可能。这不仅是一份工作,更是一块 AI 技术的真实试验田。如果你渴望在AI与工程的交汇点深耕成长,这里就是你成为未来AI型技术人才的最佳土壤。 加入我们,与顶尖的算法和工程专家并肩作战,共同定义未来的搜索形态,成为真正的 AI 复合型人才。 岗位职责 ● 引领下一代AI原生搜索系统:深度参与“生成式搜索”从理念到产品的全链路建设,推动大模型与传统搜索架构的深度融合。 ● 打造搜索运营智能体:从“AI辅助”迈向“AI自治”,定义并落地新一代智能运营范式,探索Agent在复杂电商场景中的极限能力。 ● 构建虚拟试穿与智能搭配平台:将前沿生成式AI技术转化为亿级用户可感知的极致体验,推动“看图购物”进化为“沉浸式体验购物”,重塑消费决策路径。 ● 夯实亿级高并发智能工程底座:在保障极致稳定性的前提下,突破大模型推理延迟瓶颈,打造支持未来智能电商的高性能、高可用、高智能系统架构。 ● 驱动搜索体验持续跃升:在AI赋能下,同步优化相关性、多样性与转化效率,为用户提升决策质量,为平台开辟新增长曲线。

团队介绍 淘宝搜索不仅是阿里电商的核心流量入口,更是承接数亿用户购物需求、驱动集团业务增长的超级引擎。作为全集团算法密度最高、数据规模最大、业务复杂度最强的核心场景,我们正在经历从“传统搜索”向“下一代 AI 搜索”的深刻变革。 在这里,你的每一行代码都可能重塑亿万用户的购物体验,每一次技术决策都可能驱动电商大盘的增长引擎。搜索远不止“查询”——它是一个高度个性化的超级入口:千人千面、千次搜索千种链路,不同搜索词触发不同的召回、排序与展现策略。业务快速迭代,新场景层出不穷,挑战与创新始终并存。 在这里,你面临的既有分布式系统超高并发、极低延迟的架构挑战,也有 AI 大模型在工业级产品落地的无限可能。这不仅是一份工作,更是一块 AI 技术的真实试验田。如果你渴望在AI与工程的交汇点深耕成长,这里就是你成为未来AI型技术人才的最佳土壤。 加入我们,与顶尖的算法和工程专家并肩作战,共同定义未来的搜索形态,成为真正的 AI 复合型人才。 岗位职责 ● 引领下一代AI原生搜索系统:深度参与“生成式搜索”从理念到产品的全链路建设,推动大模型与传统搜索架构的深度融合。 ● 打造搜索运营智能体:从“AI辅助”迈向“AI自治”,定义并落地新一代智能运营范式,探索Agent在复杂电商场景中的极限能力。 ● 构建虚拟试穿与智能搭配平台:将前沿生成式AI技术转化为亿级用户可感知的极致体验,推动“看图购物”进化为“沉浸式体验购物”,重塑消费决策路径。 ● 夯实亿级高并发智能工程底座:在保障极致稳定性的前提下,突破大模型推理延迟瓶颈,打造支持未来智能电商的高性能、高可用、高智能系统架构。 ● 驱动搜索体验持续跃升:在AI赋能下,同步优化相关性、多样性与转化效率,为用户提升决策质量,为平台开辟新增长曲线。
你可以获得: • 参与前沿AI技术研发,引领行业技术发展 • 与顶尖技术团队协作,攻克技术难题 • 技术成果直接服务海量用户,创造实际价值 • 完整的技术成长路径和职业发展机会 1. AI应用系统构建 • 设计和构建基于大模型的AI应用系统,包括智能客服、代码助手、AI运维等产品 • 运用指令微调(SFT)、强化学习(RLHF/DPO)等技术优化模型在特定场景的表现 • 构建完整的AI应用架构,涵盖数据处理、模型部署、用户交互等全链路 2. Agent智能体开发 • 设计和实现智能Agent系统,具备任务规划、工具调用、多轮交互等核心能力 • 构建多Agent协同框架,实现智能体间的分工协作和知识共享 • 探索Agent在复杂业务场景中的应用模式,如自动化运维、智能分析等 3. 业务场景优化 • 深入理解业务需求,将AI技术与实际场景深度结合,提升用户体验 • 优化AI应用在多轮对话、知识问答、决策支持等场景的效果和效率 • 与产品和工程团队协作,推动AI应用从原型到生产的完整落地
