美团【北斗】营销算法研究员(因果推断/运筹优化/强化学习)
任职要求
1.计算机、人工智能、运筹优化、因果推断、强化学习专业硕士以上学历。 2.在顶级期刊或国际会议(如CCF-A)上,以第一作者发表论文;或者在顶级竞赛上获奖。 3.专业成绩排名top1%,或者有国内一线大厂因果推断、运筹优化相关方向实习经历,并有突出工作成果。 4.具有优异的理解能力和逻辑思维能力,能够在复杂场景下分解和抽象问题,…
工作职责
研究方向一:多决策变量联合因果效应建模 该方向建模和评估多维单一干预动作或多干预动作的联合因果效应。关键问题点如下: 1.识别多干预动作、单干预动作多维间是否存在相互作用,并解决高维混杂空间投影问题,量化这些相互作用的影响。 2.解决交叉混杂效应等难题,建立多干预动作、多干预维度的联合分布模型,量化预估共同作用时的联合因果效应。 3.预估用户/群体粒度的多干预动作因果效应,并提供直观解释,帮助决策者理解更好的制定有效策略。 研究方向二:基于强化学习的序列化因果建模和决策 该方向研究特定业务场景下,通过序列化的干预动作设计,实现有限资源下的累积收益最大化。关键问题如下: 1.建立连续决策因果归因能力:准确估计在前置treatment序列下,当前干预动作选择的用户个性化因果效应。 2.基于强化学习的序列化决策:基于因果效应的预估,运用强化学习技术做出本次干预动作的最优化决策;学习干预顺序和时间间隔对结果的影响,优化组合干预策略以达到最佳的结果。 3.延迟因果效应建模:干预动作的影响可能不会立即显现,如何表征延迟效应、建模长程因果传导效应,并基于对未来流量或用户行为的预估,做出前瞻性的决策。 研究方向三:基于LLM的用户意图识别和营销增长机会点发现 该方向研究如何充分利用LLM的序列推理能力,基于用户行为序列实时识别用户意图和营销增长机会点。关键问题如下: 1.潜在意图识别:构建显性→潜在→衍生的意图金字塔模型和多层级attention机制,增强隐式关系捕捉能力,提升意图识别覆盖率。 2.提升意图识别准确率:系统性构建高质量意图数据集,合理应用RAG技术,建设RLHF和对抗性数据增强能力。 3.提升意图可解释性:解决用户表层表达与深层需求间的语义断层,融入因果推理模块、构建反事实注意力机制。 研究方向四:观测样本与RCT样本的消偏融合研究 样本消融研究主要关注如何结合不同来源的数据改善因果推断的准确性和可靠性。关键问题如下: 1.如何识别和消除观测数据中的混淆偏差,如何识别同时影响treatment和结果的混杂因素。 2.如何针对业务场景和数据集特点,选择合适的消偏算法,消除观测数据中的选择偏差和控制RCT数据的归纳偏差。 3.如何有效地融合RCT和观测数据,以利用两者的优势并克服各自的限制,有效降低方差的同时尽可能得到无偏估计。
1、负责共享两轮车电气件的硬件开发。 2、根据产品需求完成电气系统设计、硬件方案设计,编写设计文档。 3、负责关键电子元器件物料选型、原理图绘制和电路板布局布线,BOM确认,进行样板焊接和调试。 4、配合软件、结构、测试等部门完成产品开发和产品验证,跟进并解决生产问题。 5、跟踪存量产品的市场问题,制定并落地解决方案。 6、跟踪行业新标准和技术动态,参与新技术预研和应用。
信息工程介绍:构建空间智能商业引擎,支撑高德日均调用北斗定位4800亿次,我们在商业服务领域面临多重极端技术挑战;节假日搜索系统需承载超百万QPS峰值请求,同时保障更新99.999% SLA;实时管理海量动态服务节点(从充电桩状态到酒店房态),时空数据更新毫秒级延迟。 1、提升交易稳定性、数据一致性、缩短RT等; 2、业务层面打造交易平台,支持业务快速试错、迭代,提升产研效率,快速助力业务KPI的达成。 3、负责高德基于LBS本地生活类业务(例如:酒店、门票、加油充电、美食生服)的营销运营体系建设,营销引擎、增长相关系统研发和迭代。 4、参与系统稳定性保障体系的建设,包括系统风险识别与优化、稳定性工具沉淀,保障大促及平时业务系统稳定、高效运转 5、负责协调上下游团队,推动项目高效、有序落地。
1、研究大模型(如 GPT、BERT 等)在定位多径和多模态定位中的应用可能性。探索如何利用大模型强大的学习能力和泛化能力,对复杂的定位数据进行特征提取、模式识别和预测分析 2、深入研究定位多径问题,包括但不限于卫星定位(如 GPS、北斗)、无线定位(如 Wi-Fi、蓝牙)等场景下的多径传播机制,提升定位精度到米级别 3、深入钻研 RTK(实时动态)载波相位差分技术,对其核心算法进行优化与创新。研究多系统(如 GPS、北斗、GLONASS 等)融合下的 RTK 定位算法,通过改进算法提高定位的精度、可靠性和稳定性,复杂场景定位精度到1米
【课题说明】 通用模型往往难以兼顾多样化的场景需求,容易出现泛化能力强但针对性不足的问题。针对这一挑战,本课题聚焦于研究面向具体业务或应用场景的强化学习训练优化策略,通过引入场景特定的奖励函数、环境建模和数据采样机制,提升模型在特定任务下的表现能力与适应性。课题重点突破模型在细粒度场景下的泛化能力不足、奖励稀疏、训练效率低等问题,为大模型的行业落地提供有力支撑。 【建议研究方向】 1.场景特定奖励设计:针对不同业务场景,定制化设计奖励函数,提升模型在目标任务中的表现能力。 2.环境模拟与数据生成:构建高保真场景模拟环境,开发高效的数据采样与生成机制,提升强化学习训练效率。 3.迁移与泛化能力增强:研究多场景迁移学习与元强化学习方法,提升模型从通用能力到场景定制能力的转化效率。 4.推理增强型RAG系统:基于图结构的知识融合、混合模型的协同推理架构和强化学习驱动的优化方法,进一步提升RAG系统能力。 5.基于价值观约束的大模型风险控制与安全防护。