logo of alibaba

阿里巴巴淘天算法技术-推荐大模型算法工程师-自营&近场算法-杭州

社招全职2年以上地点:杭州状态:招聘

任职要求


1. 硕士及以上学历,具备2年以上工作经验,有一年以上LLM/MLLM经验,计算机科学、人工智能、自然语言处理计算机视觉相关专业优先; 
2.具备扎实的编程能力和机器学习基础,动手能力强,熟练使用至少一种开源深度学习框架;
3.掌握LLM基础,对搜推广算法(用户兴趣建模、多目标建模等)、LLM/MLLM模型…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


职位描述
面向淘天自营业务场景,探索大模型与推荐算法结合的下一代推荐系统技术,充分利用大模型的领域知识和学习范式为推荐系统注入新动力,包括但不限于生成式推荐、模型Scaling Law、用户超长序列建模等,解锁更大的算法提升空间;
1.负责大语言模型、多模态大模型的训练,探索预训练表征的高效处理方式以及与推荐系统的结合方式,让推荐系统充分理解世界知识;
2.基于类Transformer架构的设计和升级推荐大模型,验证推荐的Scaling Law,探索兼顾性能和效果的模型技术,持续提升业务场景效果;
3.结合业务目标和场景特点,探索并利用大语言模型技术对现有推荐系统的各环节进行优化改进,探索并开发生成式推荐系统技术,提升用户体验,实验业务价值;
4.持续关注行业内人工智能技术的发展趋势,结合业界前言技术和业务需求,和工程同学一起探索&打造大模型应用的最佳实践,提升业务效果和用户体验;
包括英文材料
学历+
机器学习+
C+
C+++
Java+
Python+
深度学习+
TensorFlow+
还有更多 •••
相关职位

logo of alibaba
社招1年以上

团队介绍: 天猫国际是阿里巴巴集团旗下跨境进口零售平台,聚合全球品牌、商家及供应链资源,将海外优质商品带给中国消费者,天猫国际自营业务由平台自行采购、运营、履约,实现从商品引入、价格策略、商品运营、库存管理到配送的全链路可控。 算法场景涵盖供应商入驻、商品运营助手、搜推体验、智能客服等B/C两端整个链路,同时包含大模型的推荐应用、多模态理解、时序预测、运筹优化等,是复合型算法工程师的最佳训练场。 在这里,你将得到大模型在电商场景下丰富的应用挑战,同时自营模式保障算法应用的可控性和数据完整性,方便进行端到端建模与全链路分析,可以快速实验与迭代; 自营业务对托管商品的定价、素材优化、运营策略有直接决策权,算法可以快速验证并调整,无需长周期的商家协调; 业务价值可量化,算法效果可以直接体现在商品销量、毛利率、库存周转率、用户体验留存等核心指标上; 既有丰富的落地场景又有跨境特有的业务挑战,以及进口电商领域有丰富经验积累的师兄帮助,拓展算法工程师的深度和广度。 岗位描述: 1、大模型后训练:参与大语言模型的后训练工作,包括微调、指令对齐、多轮对话,落地并优化通用大模型在自营场景的应用。 2、Agent能力研发:基于大模型构建智能Agent体系,包括工具调用(Tool Use)、任务规划、多Agent协作等核心策略的设计与优化。 3、增强方法研发:实现并优化检索增强(RAG)流程,包括索引构建、召回优化、知识融合、上下文管理等。 4、性能评测与优化:设计评测指标,分析模型在不同任务下的表现,持续迭代模型与Agent的效果。 5、深入跟踪前沿技术,并在业务场景中验证和落地。 6、与产品、工程团队协作,将算法成果部署到线上服务,确保性能和稳定性。

更新于 2025-11-30杭州
logo of kuaishou
社招D13360

1、通过大模型技术,在亿级别用户规模的视频推荐系统下,提升停留时长、点击率、留存率等核心指标; 2、通过大语言模型算法和系统,重构推荐系统的推荐范式与顶层逻辑; 3、针对海量用户行为数据,提供分布式的算法实现的解决方案,大幅提升算法计算规模和性能; 4、参与搭建推荐系统框架,提供高并发,大数据,高效可靠的线上服务。

更新于 2025-07-25北京
logo of kuaishou
校招J1005

1、探索大模型与推荐算法结合的下一代推荐系统技术,充分利用大模型的领域知识和学习范式为推荐系统注入新的能量,包括但不限于文本/ID生成式推荐、模型Scaling Law、用户超长序列端到端建模等; 2、探索视频、文本和语音等多模态信号的高效处理方式以及与推荐系统对齐的能力,让推荐系统看懂、听懂和理解世界; 3、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索; 4、紧跟行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践。

更新于 2025-12-03北京|杭州
logo of bytedance
社招A171639

1、在电商推荐海量用户与商品的数据下,探索大模型、大算力与推荐系统的结合; 2、探索多模态大模型等技术,提升相关类场景效果与用户体验; 3、参与基于LLM的生成式召回模型开发,解决电商场景下的冷启动和长尾商品推荐难题; 4、优化LLM在电商推荐中的推理效率,确保高并发场景下的实时推荐响应。

更新于 2025-06-04上海