
智能互联淘天算法技术-生成式推荐/大模型应用算法专家-杭州*
任职要求
1. 自然语言处理、人工智能、机器学习、计算机等相关专业硕士及以上学历。 2. 3年以上算法研发经验,熟悉Dense/MoE语言大模型、多模态大模型、推理大模型、agent相关原理,能紧跟最新技术进展。 3. 具备LLM/MLLM实操经验,熟练使用llama-factory、verl、roll、m…
工作职责
1. 负责设计和落地Session实时意图感知的AI导购方案,包括但不限于用户多模态异构行为序列的意图分析能力、推理能力、大模型在线推理加速能力,实现不同需求状态下的最优决策学习,提升大模型推词体验和效率。 2. 深入理解电商用户需求,负责通过定义分类目决策属性、构建多模态商品理解知识库、建设个性化AI对比总结能力等方式,提升用户在实际购物过程中多商品对比挑选决策效率,打造标品和非标品下的购物指南体验。 3. 持续跟进LLM/MLLM方向的前沿进展,将各方向的SOTA能力集成到模型底座上,提升下游任务效果,打造团队的技术先进性。
1. 负责设计和落地Session实时意图感知的AI导购方案,包括但不限于用户多模态异构行为序列的意图分析能力、推理能力、大模型在线推理加速能力,实现不同需求状态下的最优决策学习,提升大模型推词体验和效率。 2. 深入理解电商用户需求,负责通过定义分类目决策属性、构建多模态商品理解知识库、建设个性化AI对比总结能力等方式,提升用户在实际购物过程中多商品对比挑选决策效率,打造标品和非标品下的购物指南体验。 3. 持续跟进LLM/MLLM方向的前沿进展,将各方向的SOTA能力集成到模型底座上,提升下游任务效果,打造团队的技术先进性。
职位描述 面向淘天自营业务场景,探索大模型与推荐算法结合的下一代推荐系统技术,充分利用大模型的领域知识和学习范式为推荐系统注入新动力,包括但不限于生成式推荐、模型Scaling Law、用户超长序列建模等,解锁更大的算法提升空间; 1.负责大语言模型、多模态大模型的训练,探索预训练表征的高效处理方式以及与推荐系统的结合方式,让推荐系统充分理解世界知识; 2.基于类Transformer架构的设计和升级推荐大模型,验证推荐的Scaling Law,探索兼顾性能和效果的模型技术,持续提升业务场景效果; 3.结合业务目标和场景特点,探索并利用大语言模型技术对现有推荐系统的各环节进行优化改进,探索并开发生成式推荐系统技术,提升用户体验,实验业务价值; 4.持续关注行业内人工智能技术的发展趋势,结合业界前言技术和业务需求,和工程同学一起探索&打造大模型应用的最佳实践,提升业务效果和用户体验;
职位描述 1.负责LLM后训练、多模态理解、RL Reasoning、Agent相关基础算法,生成式检索/排序相关算法的研究及开发。 2.将相关算法应用到用户画像建模,商品理解及推荐,复杂Query意图识别及召回等业务场景。
我们是淘天集团阿里妈妈工程平台团队,致力于打造面向搜推广场景及GenAI与AI Agent应用的AI Infra平台。团队服务于淘天电商广告核心业务,承担 广告模型超大规模Embedding表征学习和Sparse-Dense模型及Dense大模型(LLMs/Diffusion等)训练与推理,AI Infra研发和优化等关键职责,在高性能在线服务&训练平台(推荐系统/多模态大模型/大语言模型)、分布式系统(计算/存储/网络)、异构计算和AI编译优化(GPGPU/CPU)等课题上都具有业界前沿的挑战。 1. 负责超大规模Sparse-Dense模型(for 广告)和Dense大模型(for GenAI应用)的训练架构设计优化并推动生产落地。 2. 负责大规模异构硬件Training系统的计算性能与效率优化。 3. Algorithm-Training-Inference Co-Design,整体提升模型效率。