美团【北斗】营销算法研究员(因果推断/运筹优化/强化学习)
任职要求
1.计算机、人工智能、运筹优化、因果推断、强化学习专业硕士以上学历。 2.在顶级期刊或国际会议(如CCF-A)上,以第一作者发表论文;或者在顶级竞赛上获奖。 3.专业成绩排名top1%,或者有国内一线大厂因果推断、运筹优化相关方向实习经历,并有突出工作成果。 4.具有优异的理解能力和逻辑思维能力,能够在复杂场景下分解和抽象问题,提供优秀、完整、可行的解决方案; 5.对解决挑战性问题充满激情,较强的责任心、主动性和韧性,能良好的沟通协作。 岗位亮点: 1.公司核心业务、核心团队,团队有多位北斗员工; 2.技术氛围浓郁,每年都有多篇顶会论文发表; 3.因果推断领域,国内最有技术挑战力的业务场景、问题,全行业首次落地uplift预估与组合优化的一体化建模。
工作职责
研究方向一:多决策变量联合因果效应建模 该方向建模和评估多维单一干预动作或多干预动作的联合因果效应。关键问题点如下: 1.识别多干预动作、单干预动作多维间是否存在相互作用,并解决高维混杂空间投影问题,量化这些相互作用的影响。 2.解决交叉混杂效应等难题,建立多干预动作、多干预维度的联合分布模型,量化预估共同作用时的联合因果效应。 3.预估用户/群体粒度的多干预动作因果效应,并提供直观解释,帮助决策者理解更好的制定有效策略。 研究方向二:基于强化学习的序列化因果建模和决策 该方向研究特定业务场景下,通过序列化的干预动作设计,实现有限资源下的累积收益最大化。关键问题如下: 1.建立连续决策因果归因能力:准确估计在前置treatment序列下,当前干预动作选择的用户个性化因果效应。 2.基于强化学习的序列化决策:基于因果效应的预估,运用强化学习技术做出本次干预动作的最优化决策;学习干预顺序和时间间隔对结果的影响,优化组合干预策略以达到最佳的结果。 3.延迟因果效应建模:干预动作的影响可能不会立即显现,如何表征延迟效应、建模长程因果传导效应,并基于对未来流量或用户行为的预估,做出前瞻性的决策。 研究方向三:基于LLM的用户意图识别和营销增长机会点发现 该方向研究如何充分利用LLM的序列推理能力,基于用户行为序列实时识别用户意图和营销增长机会点。关键问题如下: 1.潜在意图识别:构建显性→潜在→衍生的意图金字塔模型和多层级attention机制,增强隐式关系捕捉能力,提升意图识别覆盖率。 2.提升意图识别准确率:系统性构建高质量意图数据集,合理应用RAG技术,建设RLHF和对抗性数据增强能力。 3.提升意图可解释性:解决用户表层表达与深层需求间的语义断层,融入因果推理模块、构建反事实注意力机制。 研究方向四:观测样本与RCT样本的消偏融合研究 样本消融研究主要关注如何结合不同来源的数据改善因果推断的准确性和可靠性。关键问题如下: 1.如何识别和消除观测数据中的混淆偏差,如何识别同时影响treatment和结果的混杂因素。 2.如何针对业务场景和数据集特点,选择合适的消偏算法,消除观测数据中的选择偏差和控制RCT数据的归纳偏差。 3.如何有效地融合RCT和观测数据,以利用两者的优势并克服各自的限制,有效降低方差的同时尽可能得到无偏估计。
研究方向一:基于大模型的智能销售助手研究 本课题致力于将大模型技术和智能外呼任务相结合,优化美团智能外呼系统,增强其在复杂对话环境下的意图理解与灵活应对能力。力图实现更自然的语音交互、更精准的营销策略,以及更灵活的应答处理等。 1.转化信号奖励建模:依托业务场景多轮对话的真实转化信号,构建商家画像、对话文本特征信号以及交互环境特征,预估对话的转化率,进而通过强化学习(DPO/GRPO/RLHF)引导模型营销话术生成。 2.销售领域垂类大模型:通过收集多场景销售数据以及美团广告产品知识,通过continue-Pretraining构建垂类通用销售模型基座,支持多业务场景快速支持应用。 3.Multi-Agent交互式外呼系统:通过构建任务规划、流程监督、对话营销等多个agent交互逻辑,在较低响应耗时条件下,实现最佳的电话沟通效果。 研究方向二:基于大模型的智能IM的研究与应用 本课题致力于将大模型技术和商家端的各项客服任务相结合,通过大模型能力赋能美团商家与用户交互过程,降低商家与客户交互的成本,提升商户的成单数量。 1.基于多智能体的商家助手设计:设计基于大模型的多智能体交互方案,让模型在与用户交互过程中,能给有效识别用户意图,完成多轮交互。 2.工具调用与任务分解:设计多工具调用框架,使商家助手能够动态组合调用业务API、业务数据库等工具,完成多种复杂任务。 研究方向三:基于大模型的广告创意生产 本课题借助大模型的音、视、图、文等多模态理解、思考与生成能力,结合用户画像、商户/品特征、热点趋势等信息,探索实现低成本、个性化的商用级创意内容(如图文笔记、长视频)的生成技术。 1.多模态深度思考:设计与实现多模态深度思考方案,优化模型对多源异构信息进行抽取筛选、加工整合、衍生创作的能力,提升创意内容生成的质量与多样性。 2.开放问题的强化学习:针对无标准答案的开放问题(如笔记生成、剧本创作、素材选取等),设计与实现适配的奖励机制与策略,通过强化学习提升模型能力。 3.创意生产Agent:参考人工生产中的不同角色分工合作流程,设计与实现创意生产的多agent协作框架,并通过线上效果反馈机制,闭环提升生产的效率与质量。
负责金融场景的大模型的研发和应用,研究相关技术在AI营销、AI风控、AI客服、AI催收领域的落地价值和解决方案,通过AI赋能业务,满足业务迅速增长的智能交互、智能决策需求。 研究方向一:基于大模型的多轮对话理解与生成 1.深入参与对话机器人在数据建设、指令微调、偏好对齐、强化学习、推理优化等环节的建设; 2.研究和解决大模型落地的关键问题,如检索增强、长文本理解、模型小型化技术等,并提升训练-评测的迭代效率。 研究方向二:大模型智能体算法研究 1.负责基于大模型的智能体架构构建,实现复杂问题的理解规划、工具执行以及感知反思能力; 2.探索最前沿技术,设计算法迭代飞轮,优化大模型基础模型,高效提升模型效果; 3.负责多智能体架构设计与落地,在多个金融业务场景中应用。
研究方向一:多模态Agent 1.基于多模态数据的智能决策、任务自动化及人机协同,提升直播运营效率与效果 2.多Agent框架设计与系统研发 研究方向二:高表现力数字人生成驱动 1.语音精准唇形驱动。通过AIGC、人脸驱动等能力,形成人形交互的行业最优产品化方案 2.人体驱动技术。针对AI直播业务场景,适配最优的人体肢体驱动技术解决方案 3.端到端人形生成能力。打造从语音文本输入到完整数字人输出的跨模态生成架构,通过联合训练实现语音驱动表情、文本驱动肢体语言、情感驱动微动作的多维度协同控制 研究方向三:智能对话与多模态内容生成交互技术 1.多模态智能对话技术。基于业务数据,利用RAG、跨模态检索、大模型后训练等方式,打造高效的智能对话能力 2.多模态内容理解及生成技术。基于业务数据,利用多模态大模型、AIGC技术构建多模态交互的基础数据
【课题说明】 传统销售模式中,销售人员通过电销系统触达商户,对商户进行营销/运营触达,整体链路人工依赖率高。随着大模型技术的快速发展,基于大模型的智能外呼在提升电销覆盖率和转化率方面展现出极大潜力。 本课题致力于将大模型技术和智能外呼任务相结合,优化美团智能外呼系统,增强其在复杂对话环境下的意图理解与灵活应对能力。力图实现更自然的语音交互、更精准的营销策略,以及更灵活的应答处理等。 【建议研究方向】 1.转化信号奖励建模:依托业务场景多轮对话的真实转化信号,构建商家画像、对话文本特征信号以及交互环境特征,预估对话的转化率,进而通过强化学习(DPO/GRPO/RLHF)引导模型营销话术生成。 2.销售领域垂类大模型:通过收集多场景销售数据以及美团广告产品知识,通过continue-Pretraining构建垂类通用销售模型基座,支持多业务场景快速支持应用。 3.Multi-Agent交互式外呼系统:通过构建任务规划、流程监督、对话营销等多个agent交互逻辑,在较低响应耗时条件下,实现最佳的电话沟通效果。