美团数字人算法工程师(智能对话方向)
任职要求
1.本科及以上学历,计算机、数学、统计学或相关专业背景; 2.具备丰富的算法策略开发经验,熟悉机器学习、自然语言处理、数据挖掘等相关领域的基本理论和算法; 3.精通Python、Java等编程语言,熟悉常用的机器学习和深度学习框架,如TensorFlow、PyTorch等; 4.具备扎实的数学基础和统计分析能力,能够设计和实现算法模型,解决实际问题; 5.具备良好的团队合作能力和沟通能力,能够与跨部门团队紧密合作,推动项目的顺利进行; 6.具备较强的问题分析和解决能力,能够快速响应和解决实际应用中的技术难题。
工作职责
1.负责数字人算法策略的研发和优化,包括但不限于智能问答、情感分析、个性化推荐等方面; 2.设计并实现算法模型,对大规模数据进行处理和分析,提高数字人算法的准确性和效率; 3.跟踪行业前沿技术和算法发展趋势,不断进行技术创新和优化,提升产品的竞争力; 4.与产品团队合作,理解业务需求并解决相关问题,确保算法的实际应用效果。
负责抖音对话机器人场景中NLP技术的研发与应用,研究包括传统NLP技术、LLM技术在聊天机器人领域基础技术支持和落地应用。主要工作方向包括: 1、负责对客服、角色化对话机器人算法方向的通用NLP基础能力建设,包括但不限于数据建设、模型训练推理框架迭代、维护模型评估指标体系、建设通用NLP模型; 2、支持LLM、MLLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求; 3、建设基于LLM/MLLM技术的新一代的智能客服机器人,探索建设数字人技术在抖音落地应用。
负责抖音对话机器人场景中NLP技术的研发与应用,研究包括传统NLP技术、LLM技术在聊天机器人领域基础技术支持和落地应用。主要工作方向包括: 1、负责对客服、角色化对话机器人算法方向的通用NLP基础能力建设,包括但不限于数据建设、模型训练推理框架迭代、维护模型评估指标体系、建设通用NLP模型; 2、支持LLM、MLLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求; 3、建设基于LLM/MLLM技术的新一代的智能客服机器人,探索建设数字人技术在抖音落地应用。
负责抖音对话机器人场景中NLP技术的研发与应用,研究包括传统NLP技术、LLM技术在聊天机器人领域基础技术支持和落地应用。主要工作方向包括: 1、负责对客服、角色化对话机器人算法方向的通用NLP基础能力建设,包括但不限于数据建设、模型训练推理框架迭代、维护模型评估指标体系、建设通用NLP模型; 2、支持LLM、MLLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求; 3、建设基于LLM/MLLM技术的新一代的智能客服机器人,探索建设数字人技术在抖音落地应用。
团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 抖音作为全球领先的综合性内容平台,拥有庞大的用户群体和多元化的业务生态。在设计如此大规模的推荐系统时,面临社交网络复杂、电商用户兴趣跨域迁移困难、内容与用户冷启动样本稀疏、直播推荐多目标融合效能不足、兴趣重复密集探索不足等多重挑战。 课题内容: 1、社交网络增强的跨域兴趣建模:结合图神经网络(GNN)与大语言模型(LLM),构建用户全生命周期行为图谱,融合社交关系、内容互动与电商行为,挖掘社交网络中的社团结构与跨域兴趣传播路径; 2、兴趣迁移与转化信号捕捉:通过跨域对比学习与对抗生成技术,构建内容兴趣到电商兴趣的隐式映射网络,结合强化学习动态调控探索与利用,兼顾推荐精准性与多样性; 3、多模态小样本冷启动优化:利用LLM的Few-shot推理能力,通过内容语义理解与外部知识增强,设计元学习框架实现新ID特征与泛化特征的联合表征,缓解冷启动数据稀疏问题; 4、多目标融合与长短期价值平衡:基于大模型的泛化能力与长上下文感知,统一建模直播多目标(点击、时长、打赏等)的分布偏差与动态权重,设计个性化融合策略,替代传统多阶段漏斗架构,提升实时推荐效率。 兴趣密集与兴趣探索:通过用户兴趣画像建模与强化学习技术,实时捕捉用户消费与兴趣变化,缓解兴趣密集问题,为用户探索新的兴趣; 5、涉及研究方向:图神经网络(GNN)、大语言模型(LLM)、多模态内容理解、小样本学习与元学习、多目标推荐系统、端到端深度学习。