logo of alibaba

阿里巴巴研究型实习生-搜推智能产品-因果推断算法工程师

实习兼职淘天集团研究型实习生地点:北京 | 杭州状态:招聘

任职要求


1. 自然语言处理机器学习数据挖掘、人工智能等相关专业的硕士生/博士生,实习时间可满一年;
2. 精通深度学习Transformer架构,具备模型创新与底层开发能力;
3. 熟悉因果推断(如Uplift Model、PSM、Doubly Robust、Representation Learning for CATE)等方法优先,有实际项目经验优先;
4. 熟悉推荐系统、增长策略或在线营销场景者优先;
5. 具备优秀论文产出能力,有CCF-A类或顶级AI/ML会议(如KDDICMLNeurIPS、WWW)发表者,或在数学、ACM、天池等竞赛中取得优异成绩者优先;
6. 具备优秀的逻辑思维与系统设计能力,对算法研究与业务落地有强烈热情。

工作职责


我们是淘天集团淘宝用户算法团队,致力于通过外投广告、商品推荐、权益激励与消息触达等,全面提升淘宝用户的增长效率与长期价值。团队聚焦用户全生命周期管理,以算法驱动精细化运营,持续优化获客效率、增量GMV与用户LTV。
在权益策略场景中,传统模型面临选择性偏差、高噪声干扰、多场景异构等挑战,难以准确识别微弱增量信号。为此,我们正在构建下一代因果Transformer框架。
你将承担以下核心职责:
1. 增量建模与因果推断:深入解决观测数据中的选择偏差与时变混杂问题,基于淘天用户特征体系,提升权益效果的归因准确性;
2. 算法创新与模型研发:探索并设计基于因果推断Transformer的新型架构,设计提升微弱信号识别能力,推动CDUT等前沿模型落地;多场景协同建模:统一建模大促、日常、会员等多权益场景,实现跨场景知识迁移与泛化能力提升;
3. 前沿成果输出:在KDD、ICML、NeurIPS等顶级会议发表高水平论文,拓展因果推断与个性化营销领域的影响力;
4. 应用场景覆盖淘天多个权益体系,完成算法的线上应用及取得线上效果提升。

加入我们,你将参与最具挑战性的工业级因果推断课题,定义智能营销与用户增长的未来技术范式。
包括英文材料
NLP+
机器学习+
数据挖掘+
深度学习+
Transformer+
因果推断+
推荐系统+
ICML+
NeurIPS+
系统设计+
算法+
相关职位

logo of alibaba
实习淘天集团研究型实

1.跟进和研发大规模语言模型(LLM)的预训练、持续训练、SFT、RLHF 等技术; 2.大语言模型应用在大淘宝推荐场景的落地,包括逻辑推理、智能内容理解、商品创意生成等; 3.建立新一代认知推荐算法体系,结合交互式推荐的产品创新,提升用户体验和首页推荐的长期价值; 4.结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。

更新于 2025-08-08
logo of alibaba
实习淘天集团研究型实

1. 探索语音大模型,包括语音合成、音色克隆、端到端合成、情感化语音合成等技术,实现细粒度控制的语音合成; 2. 参与全双工多模态交互系统研发; 3. 将以上技术落地到淘天业务,考虑模型性能与效率。

更新于 2025-08-14
logo of alibaba
实习淘天集团研究型实

1. 探索多模态大模型的高效训练,包括预训练、SFT、及RLHF等技术; 2. 探索高效的视觉编码器结构、对齐范式、训练策略、数据清洗、质量分级、数据合成等; 3. 探索原生多模态大模型的架构与训练范式; 4. 探索图像、视频、音频的全模态大模型; 5. 结合淘天业务,推动多模态大模型在搜索、推荐、广告等业务中的应用。

更新于 2025-08-14
logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 大语言模型(LLM)和多模态大模型(MMLM)的发展为推荐系统带来了新的生机。相较于传统推荐模型依赖协同过滤信息进行建模,大语言模型因其强大的泛化和推理能力,可以更好地对物品、内容进行关联、分析用户行为和偏好,从而具备处理复杂场景中复杂用户行为的潜力。但同时,虽然大语言模型在理解和生成自然语言方面表现出色,但它们在处理推荐系统中数据稀疏、特征异构、训练和部署效率等方面仍存在众多挑战。本项目旨在对传统推荐模型、大语言模型甚至多模态大模型进行联合建模,以期取长补短,更有效地利用多模态异构信息,从而进一步提升推荐模型表现。 主要的挑战包括但不限于: 1. 大语言模型的编码效率问题:LLM的训练及推理成本随编码的信息量增加而快速膨胀,如何高效地对长用户行为序列进行多模态编码是联合建模相关探索的基础问题。 2. 多模态信息融合问题:物品、内容存在大量不同模态且异构的信息,如何有效地对多模态信息进行融合,是保障联合建模效果的重要问题。 3. 联合建模的模态差异化优化问题:不同模态在拟合速度、信息权重等方面存在天然差异,如何在联合建模过程中平衡和调节不同模块的优化是联合建模的难点。