腾讯AI搜索算法专家(大模型后训练方向)
任职要求
1.计算机科学、人工智能等相关专业硕士及以上学历; 2.具备良好的LLM技术基础,熟练使用深度学习训练和推理框架,深入理解Transformer、GPT等模型架构; 3.在Post-training方向有一定研究基础,熟悉SFT/DPO/PPO/…
工作职责
1.负责AI搜索中大模型后训练方向的核心技术研发,包括SFT、偏好学习、强化学习等算法研发、优化与创新,提升AI搜索的回复效果; 2.跟踪AI搜索领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用; 3.参与产品讨论,基于技术对产品提出改进建议。
1、负责跨境电商垂域多语言基础大模型的研发,持续建设和优化电商领域预训练、微调、后训练等全链路算法技术建设。 2、负责利用大模型提升电商领域的业务效果,例如搜索相关性、商品理解、多语言翻译和文案生成等方向。 3、前沿大模型技术突破,挖掘AI大模型技术在跨境电商场景的潜力,攻克大模型电商场景多语言翻译、大模型Agent等技术难题。
1. Agent方向:直接参与到导购Agent的算法研发工作,包含无障碍导购Agent、搜索导购Agent两个Agent项目并结合技术创新与实际业务落地,产出高质量论文、专利与开源成果。包括相关项目的高质量数据构建,支撑复杂任务建模与行为学习,运用大模型SFT、RL等Post-training训练方法并探索 Online RL 等前沿方法,设计并落地“过程监督 + 结果监督”联合训练范式,融合MCTS、ToT、Reflection等推理方法,等等; 2. LLM应用方向:探索基于LLM的Query理解大模型,通过天猫的数据微调大模型生成ID表征向量,在搜索和推荐算法各模块进行深度的探索和应用。包括但不限于语义相关性、类目预测、召回排序等。探索生成式搜索技术(如Query扩展、结果摘要生成),助力搜索从“信息呈现”向“决策辅助”升级; 3. 结合业务需求,设计和扩展LLM的应用场景范围及规模,提高模型微调后再垂直领域的应用及专家模式的架构尝试; 4. 跟踪LLM与Agent领域的国际前沿技术动态,开展前沿算法的研究工作,推动技术创新在业务场景中的落地应用,重点突破复杂推理、GUI Agent、AI搜索等方向的技术沉淀和业务创新。
1. MLOps平台开发打造一站式大模型开发平台,负责主流开源和闭源模型的训练、评测、蒸馏、压缩、部署全链路工具开发 ● 参与模型各种后训练如微调、蒸馏、强化学习的产品化,以及vLLM/sglang/自研推理引擎的优化,提供有竞争力的推理性能 ● 负责各种MLOps工具链开发,如AI资产管理、实验管理、血缘跟踪、评测对比等,帮助用户串联AI开发全流程,提升模型开发效率 ● 负责多模态数据自动标注和挖掘功能的开发,为智驾和具身智能客户提供新一代的数据工程解决方案 2. 企业级Agent开发平台建设 ● 建设具备全模态能力的agent开发平台,帮助客户构建RAG、chatbot、data agent、design agent、research agent等各种AI agent应用 ● 提供白盒化开发模式,建设全链路的可观测、可调试和监控能力,帮助用户构建同时具备高精度和高性价比的agent应用 ● 针对企业客户对安全隐私的强需求,构建全方位的安全防护能力,包括不限于模型安全护栏、工具沙箱、细粒度权限管控等 ● 与阿里云大数据、智能搜索等业务产品合作,建设阿里云agent工具生态