阿里巴巴淘天算法技术-AI搜算法工程师-杭州/北京
任职要求
1.计算机、人工智能、数学等相关专业硕士及以上学历; 2.扎实的编程基础,熟练掌握PyTorch,熟悉llama-factory, VeRL/ROLL等训练框架; 3.深入理解LLM/MLLM原理,具备大模型Post-training(SFT、RLHF/RLVR)实战经验,熟悉RAG、Agent技术栈…
工作职责
1.负责LLM与搜索引擎的深度融合,推动AI搜索技术迭代,通过RAG、Agent等技术提升用户搜索体验; 2.参与AI搜索模型全链路能力建设,聚焦Post-training(SFT、RLVR、Agentic RL、CoT)等核心技术; 3.构建数据驱动的Agentic闭环链路,支持智能体推理、Case分析、训练数据合成与自动化评估,实现搜索效果的持续优化; 4.持续跟踪AI搜索领域最新技术动态,推动研究成果沉淀为技术文章、专利或学术论文,打造团队技术影响力;
淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。这一关键角色中,您将参与淘宝搜索功能的核心算法研究,特别是专注于搜索相关性领域和AI搜创新领域。该职位要求理解搜索引擎的工作原理,在深度语义相关性模型、大语言模型、多模态技术等技术方面有突出贡献。作为团队的核心成员,您将不仅要在您的直接工作领域推动技术突破,还要与其他方向的团队(包括召回、排序、机制等)进行全链路联动,共同推进搜索算法的整体优化。 1. 核心模型研发与创新: 负责淘宝主搜的核心算法研发,主导设计和优化面向电商场景的相关性大模型。重点投入Agentic Search、多模态(文图、视频)相关性、AI生成式搜索等前沿方向,从模型层面根本性地提升搜索相关性、用户体验和商业效率。 2. 电商知识资产构建: 主导构建电商领域的高质量多模态数据飞轮。通过知识库建设、主动学习、数据挖掘和智能标注等手段,持续迭代和优化数据质量,为大模型的训练和迭代提供核心“燃料”,沉淀公司级的电商知识数据资产。 3. 用户体验洞察与度量: 深入理解和洞察电商搜索场景下的用户意图与行为模式,建立并完善一套科学的、数据驱动的搜索体验分析与评估方法论。以量化指标和用户反馈指导模型迭代方向,确保技术创新最终服务于用户价值。 4. 前沿技术探索与应用: 密切追踪LLM(大语言模型)、MLLM(多模态大模型)、NLP、AIGC等领域的最新技术进展。快速进行技术预研、验证,并将其创造性地应用于电商搜索业务中,解决实际问题。在应用基础上进行技术创新,鼓励发表高水平论文、申请技术专利,构建团队在行业内的技术影响力。 我们提供 1. 高空间的舞台: 真实、海量、复杂且高价值的业务场景,让你的技术才能得到最大程度的发挥。 2. 前沿的技术挑战: 直接参与定义下一代AI搜索,与行业顶尖人才共同攻克最具挑战性的技术难题。 3. 充足的资源支持: 丰富的计算资源与数据资产,以及鼓励创新和试错的文化氛围。 4. 清晰的成长路径: 完善的职业发展体系和技术晋升通道,支持个人在技术深度和业务广度上的持续成长。
淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。这一关键角色中,您将参与淘宝搜索功能的核心算法研究,特别是专注于搜索相关性领域和AI搜创新领域。该职位要求理解搜索引擎的工作原理,在深度语义相关性模型、大语言模型、多模态技术等技术方面有突出贡献。作为团队的核心成员,您将不仅要在您的直接工作领域推动技术突破,还要与其他方向的团队(包括召回、排序、机制等)进行全链路联动,共同推进搜索算法的整体优化。 工作职责: 1. 设计和优化淘宝主搜的搜索相关性算法和电商AI综搜创新业务,包括但不限于文本相关性大模型、多模态相关性大模型、多模态商品理解、AI搜索等等。 2. 通过数据飞轮、知识库建设、数据挖掘、标注任务迭代等持续提高数据质量,积累电商域的知识数据资产。 3. 深入理解电商搜索用户需求, 建立和完善搜索体验分析方法论,以指导模型的迭代和优化。 4. 密切关注并引入前沿的LLM、MLLM、NLP和机器学习技术,将其应用于搜索体验优化,并在此基础上进行技术创新。
淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。这一关键角色中,您将参与淘宝搜索功能的核心算法研究,特别是专注于搜索相关性领域和AI搜创新领域。该职位要求理解搜索引擎的工作原理,在深度语义相关性模型、大语言模型、多模态技术等技术方面有突出贡献。作为团队的核心成员,您将不仅要在您的直接工作领域推动技术突破,还要与其他方向的团队(包括召回、排序、机制等)进行全链路联动,共同推进搜索算法的整体优化。 1. 负责大语言模型和多模态大模型在电商内容生成场景的算法研发,包括但不限于进行指令微调(Supervised Instruction Tuning),以增强模型遵循指令生成特定格式和风格内容的能力 。 2. 运用生成式AI技术,为搜索结果页的商品自动生成富有吸引力的标题、精准的卖点摘要,并探索文生图等多模态技术以创造全新的商品展示图像。 3. 建立科学的内容质量与业务效果评估体系,负责对算法模型进行评估和改进,通过A/B实验等方式量化分析生成内容对业务指标的影响,持续推动算法创新与迭代。 4. 与产品、工程及业务团队紧密合作,深刻理解业务需求,推动算法技术转化为实际的产品解决方案,确保技术成功落地。 5. 跟踪并研究大模型领域的前沿技术进展,结合业务需求制定研发方案,探索AI Agent、RAG等技术在电商搜索场景的创新应用。 我们提供 1. 高空间的舞台: 真实、海量、复杂且高价值的业务场景,让你的技术才能得到最大程度的发挥。 2. 前沿的技术挑战: 直接参与定义下一代AI搜索,与行业顶尖人才共同攻克最具挑战性的技术难题。 3. 充足的资源支持: 丰富的计算资源与数据资产,以及鼓励创新和试错的文化氛围。 4. 清晰的成长路径: 完善的职业发展体系和技术晋升通道,支持个人在技术深度和业务广度上的持续成长。
联盟算法团队依托淘宝联盟和淘宝内容营销,以先进的机器学习和AI技术驱动站外十亿级消费者的电商营销场景发展。淘宝联盟是百万淘客在站外的商品分发,实现淘宝千万级用户引流,十亿级GMV规模的站外营销生态;淘宝内容营销是基于万级内容创作者生产的内容以及站外媒体投放,为商家提供站外种草价值的广告营销生态。 我们根据淘宝联盟生态的特点,基于海量时空传播图网络,构建先进的多Treatment价量关系等营销算法模型,实现智能化选品,出价,发券系统;在程序化流量中,深耕多场景多目标预估、个性化排序模型和匹配策略。在淘宝内容营销场景下,我们从内容企划,自动化投放,价值评估全链路实现智能化,涉及站外趋势预测,智能选品,增量目标下的人群挖掘,细粒度的多触点增量预估与评估等技术。在不断提升业务效果的同时,我们在AI算法方面不断突破技术边界:基于强化学习的多模态大语言模型的端到端多模态表征技术,基于LLM大语言模型的智能文案,营销AI agent等技术,广泛应用在同款比价,内容理解,选品出价等场景。 热忱欢迎对营销算法,搜推广,计算机视觉和大语言模型等方向感兴趣的同学加入我们,一起加油,共同成长!我们坚信你的加入,是我们彼此优秀的开始。