蚂蚁金服研究型实习生-生成式搜索算法方向研究型实习生
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的…
工作职责
研究领域: 人工智能 项目简介: 生成式搜索是支付宝搜索CY25的重点技术和业务方向,技术挑战是怎么去通过LLM生成高时效、高准确率的的搜索结果。 对RAG、语义召回、语义ReRank、幻觉检测等技术有比较高的挑战。 希望能够引进相关方向的研究型实习生,在生成式搜索相关技术方向上进行课题攻关,进一步提升团队技术能力和技术深度。
1.参与高德地图首页“即时推荐”系统的算法研发,探索大语言模型(LLM/MLLM)与推荐系统的融合创新; 2.协助构建面向LBS场景的AI Agent推荐原型,包括用户意图理解、个性化内容生成、检索增强(RAG)、多步推理等模块; 3.参与生成式推荐相关技术实验,如语义ID建模、指令微调(Instruction Tuning)、偏好对齐(DPO/RLHF)、自动化数据合成等; 4.在指导下,能够完成算法调研、实验设计、代码实现与效果分析,推动技术方案在真实业务场景中验证与落地;
1. Agent方向:直接参与到导购Agent的算法研发工作,包含无障碍导购Agent、搜索导购Agent两个Agent项目并结合技术创新与实际业务落地,产出高质量论文、专利与开源成果。包括相关项目的高质量数据构建,支撑复杂任务建模与行为学习,运用大模型SFT、RL等Post-training训练方法并探索 Online RL 等前沿方法,设计并落地“过程监督 + 结果监督”联合训练范式,融合MCTS、ToT、Reflection等推理方法,等等; 2. LLM应用方向:探索基于LLM的Query理解大模型,通过天猫的数据微调大模型生成ID表征向量,在搜索和推荐算法各模块进行深度的探索和应用。包括但不限于语义相关性、类目预测、召回排序等。探索生成式搜索技术(如Query扩展、结果摘要生成),助力搜索从“信息呈现”向“决策辅助”升级; 3. 结合业务需求,设计和扩展LLM的应用场景范围及规模,提高模型微调后再垂直领域的应用及专家模式的架构尝试; 4. 跟踪LLM与Agent领域的国际前沿技术动态,开展前沿算法的研究工作,推动技术创新在业务场景中的落地应用,重点突破复杂推理、GUI Agent、AI搜索等方向的技术沉淀和业务创新。
职位描述 你将加入高德地图核心算法团队,在算法专家的指导下探索大模型(LLM/多模态)与推荐系统的深度结合。你将有机会接触亿级用户规模的真实业务场景,参与从前沿技术研究到工程落地的全过程。 你将参与或负责以下工作内容(包括但不限于): 1.用户兴趣预测:基于生成式大模型解析用户行为与商品/内容语义,构建⽤户需求预测模型,提升推荐场景的转化与⽤户体验; 2.端到端⽣成式链路:探索端到端生成式范式,替代传统多阶段漏斗链路流程,基于强化学习融合业务逻辑,建设出具备⾼效scaling能力的生成式算法新链路; 3.重排范式创新:借鉴生成式大模型技术构建生成式重排创新范式,通过Reward model + 强化学习实现端到端序列整体生态价值建模; 4.深入研究和理解大模型预训练、微调与强化学习技术,结合搜推业务目标持续优化模型效果。