logo of meituan

美团【北斗】生成式广告训练推理工程师(推理/训练/One Model架构)

校招全职核心本地商业-业务研发平台地点:北京 | 上海状态:招聘

任职要求


1.深入了解至少一种深度学习编程框架(TensorFlow/Pytorch/其它),对Cuda编程有实战经验的优先
2.深入理解Transformer架构,熟悉SFT、RLHF、DPO/PPO等训练算法;熟悉DeepSpeed、Megatron-LM等训练框架者优先
3.熟悉LLM主流推理引擎,如FasterTransformer、vLLM、TRT-LLM、SGLang等;熟悉常见的推理优化方法,如量化、FlashAtt…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


研究方向一:端到端生成式广告大模型训练推理系统
信息流广告系统一般采用“召回->粗排->精排->出价->拍卖”的多级漏斗架构,但各模块独立优化导致优化目标不一致,前链路会制约后链路上限,漏斗效率折损大。随着大模型和生成式技术的快速发展,其强大的表征能力和良好的Scaling性质也为广告系统提供了新的可能性。本研究旨在探索如何利用生成式技术重塑整个广告系统,通过一个端到端的生成式广告大模型完成所有决策,打破多级漏斗框架,打开模型决策空间,最大化平台收益。
1.生成式广告训练系统设计:基于前沿大模型(如Transformer、HSTU等),设计生成式推荐模型的分布式训练框架,优化数据/模型的高效并行处理和混合精度训练策略。
2.高性能推理引擎建设:既有大稀疏(Embedding),又有大稠密(LLM)的模型结构下,优化延迟、吞吐量和显存占用,支持千亿/万亿参数模型的实时推理需求。
3.广告链路端到端重塑:超长行为序列与超大候选Item情况下,优化传统的多阶段网络传输架构,需要一体化硬件支撑的召回/排序/机制统一服务。

研究方向二:大模型后训练与推理优化
为了推动大模型在AI电销以及智能IM的规模化应用,致力于打造业界领先的大模型技术,聚焦于模型后训练优化与高效推理部署,共同突破模型压缩、推理加速等核心技术,降低大模型落地成本,提升服务性能。
1.后训练优化:实现并优化基于人类反馈的强化学习(RLHF)算法,包括奖励模型(Reward Model)训练、PPO/DPO/GRPO等策略优化;设计并优化多机多卡并行策略(如DP/PP/TP/EP等),解决千亿/万亿模型训练中的计算、显存和通信瓶颈。
2.推理部署优化:设计高效推理框架,探索模型压缩(量化、剪枝、知识蒸馏)、动态计算优化等技术,实现低延迟、高吞吐的部署方案,并优化硬件资源利用率,降低服务成本。
包括英文材料
深度学习+
TensorFlow+
PyTorch+
CUDA+
Transformer+
SFT+
算法+
还有更多 •••
相关职位

logo of meituan
社招5年以上软硬件服务-骑行

1、负责共享两轮车电气件的硬件开发。 2、根据产品需求完成电气系统设计、硬件方案设计,编写设计文档。 3、负责关键电子元器件物料选型、原理图绘制和电路板布局布线,BOM确认,进行样板焊接和调试。 4、配合软件、结构、测试等部门完成产品开发和产品验证,跟进并解决生产问题。 5、跟踪存量产品的市场问题,制定并落地解决方案。 6、跟踪行业新标准和技术动态,参与新技术预研和应用。

更新于 2025-04-01深圳|北京
logo of amap
社招6年以上技术类-开发

信息工程介绍:构建空间智能商业引擎,支撑高德日均调用北斗定位4800亿次,我们在商业服务领域面临多重极端技术挑战;节假日搜索系统需承载超百万QPS峰值请求,同时保障更新99.999% SLA;实时管理海量动态服务节点(从充电桩状态到酒店房态),时空数据更新毫秒级延迟。 1、提升交易稳定性、数据一致性、缩短RT等; 2、业务层面打造交易平台,支持业务快速试错、迭代,提升产研效率,快速助力业务KPI的达成。 3、负责高德基于LBS本地生活类业务(例如:酒店、门票、加油充电、美食生服)的营销运营体系建设,营销引擎、增长相关系统研发和迭代。 4、参与系统稳定性保障体系的建设,包括系统风险识别与优化、稳定性工具沉淀,保障大促及平时业务系统稳定、高效运转 5、负责协调上下游团队,推动项目高效、有序落地。

更新于 2025-06-27北京
logo of jd
校招多模态大模型与应

1、研究大模型(如 GPT、BERT 等)在定位多径和多模态定位中的应用可能性。探索如何利用大模型强大的学习能力和泛化能力,对复杂的定位数据进行特征提取、模式识别和预测分析 2、深入研究定位多径问题,包括但不限于卫星定位(如 GPS、北斗)、无线定位(如 Wi-Fi、蓝牙)等场景下的多径传播机制,提升定位精度到米级别 3、深入钻研 RTK(实时动态)载波相位差分技术,对其核心算法进行优化与创新。研究多系统(如 GPS、北斗、GLONASS 等)融合下的 RTK 定位算法,通过改进算法提高定位的精度、可靠性和稳定性,复杂场景定位精度到1米

更新于 2025-06-10北京
logo of meituan
实习核心本地商业-业

【课题说明】 通用模型往往难以兼顾多样化的场景需求,容易出现泛化能力强但针对性不足的问题。针对这一挑战,本课题聚焦于研究面向具体业务或应用场景的强化学习训练优化策略,通过引入场景特定的奖励函数、环境建模和数据采样机制,提升模型在特定任务下的表现能力与适应性。课题重点突破模型在细粒度场景下的泛化能力不足、奖励稀疏、训练效率低等问题,为大模型的行业落地提供有力支撑。 【建议研究方向】 1.场景特定奖励设计:针对不同业务场景,定制化设计奖励函数,提升模型在目标任务中的表现能力。 2.环境模拟与数据生成:构建高保真场景模拟环境,开发高效的数据采样与生成机制,提升强化学习训练效率。 3.迁移与泛化能力增强:研究多场景迁移学习与元强化学习方法,提升模型从通用能力到场景定制能力的转化效率。 4.推理增强型RAG系统:基于图结构的知识融合、混合模型的协同推理架构和强化学习驱动的优化方法,进一步提升RAG系统能力。 5.基于价值观约束的大模型风险控制与安全防护。

更新于 2025-05-27北京