小红书大模型后训练算法工程师/专家
任职要求
任职资格: 1、在后训练微调领域拥有丰富的项目经验,熟悉LoRA、DPO、PPO、KTO、ReFT等算法原理,具备扎实的数学基础,熟悉线性代数、概率统计、优化算法等。 2、了解至少一种主流深度学习框架(如PyTorch、PaddlePaddle、TensorFlow等)的内部原理与实现,并具备直接开发或二次开发经验。 3、对Megatron-LM、DeepSpeed等分布式框架及LLaMA…
工作职责
中台稠密引擎组,是小红书负责建设通用深度学习训练推理引擎的团队,面向全公司LLM、多模态LLM、SD、传统CV&NLP等稠密计算型模型训练与推理的业务场景,打造高效、易用、业界领先的训练与推理引擎,为小红书社区、商业化、安全等众多业务方向提供先进的引擎能力,支撑业务持续提升训练推理效率、模型迭代效率与算法研发效率。 1、参与设计和实现深度学习后训练及微调的前沿算法(包括但不限于RFT、RLHF等),以适应多样化的业务场景; 2、结合业务数据和场景,评估选择最适合的微调算法,以支撑业务大语言模型(LLM)微调指标的提升; 3、与数据团队紧密合作,深入理解数据特性,参与设计实现数据提质算法引擎工具,产出高质量数据集提升模型微调效果; 4、与公司内各算法团队深度合作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 5、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;

1、深入理解电商平台业务场景,负责自然语言处理(NLP)、语义分析、人机对话模型等核心算法的研究与实现; 2、基于电商业务场景数据,重点负责大模型后训练算法,以及策略优化等相关工作; 3、负责搭建和优化Agentic系统,挑战将前沿Agent架构和算法应用于大规模电商核心业务,打开业务增长空间。 4、跟踪行业前沿技术,探索Agentic RL、DeepSearch、高效大模型等技术,参与新一代基座模型的调优与创新。

【岗位亮点】 打造现象级AI产品:你的算法将服务数亿用户,利用行业最丰富的地理数据,扩展语义理解与路线生成的边界。 前沿技术实践场:深度参与垂类多模态大模型的训练与优化,探索多模态Agent+地图理解的无限可能。 真实场景大挑战:面对MLLM在地图任务下语义和空间的双重挑战,构建行业标杆级模型。 【团队成就】 我们团队致力于构建下一代核心智能驾驶体验,在过去四年持续创造多个突破性创新产品技术。 智能出行开拓者:连续4年推出行业标杆产品,包括: 2022年 红绿灯倒计时黑科技 (拯救千万路怒症的神级操作) 2023年 V2X车车对话系统 (让汽车学会"社牛"沟通) 2024年 AI领航红绿灯 (比驾校教练更懂路的老司机) 2025年 TrafficVLM-Agent 上线 (高德地图“天眼”功能) 2025年 RouteVLM-Agent上线 (路线生成的无限可能) 【你将参与】 1. 用AI解锁出行新玩法:基于海量地图数据与用户场景,研发支持从“用户任意query”到一条“用户偏好&地理空间对齐的可行路线”的规划大模型。 2. 打造行业领先的大模型应用:SFT微调、强化学习等技术,让大模型真正理解复杂出行需求中的时空语义关系。 3. 定义未来出行方式:打造Agent自进化机制,不断提升出行场景的agent能力边界。 4. 顶会论文产出:共同探索工业落地与科技前沿。
1、负责基于扩散模型的世界生成、视频生成等相关场景的算法研发工作,结合实际应用场景攻克技术难题,包括世界生成过程中的可控性、时空一致性、实时性等问题; 2、参与并主导生成式大模型核心算法研发,包括 Diffusion、Autoregressive(AR)、VAE、Transformer 等架构。研发时空视频编码、压缩与生成算法,优化模型在生成任务中的一致性与时序表现。设计并实现从预训练到后训练(SFT、RLHF)的全流程模型优化方案,提升生成质量、可控性和效率; 3、负责生成式大模型的总体技术架构设计,探索多模态融合、跨任务迁移等创新方向,跟踪前沿研究进展,进行技术评估与落地转化,推动团队在行业/学术上的技术领先。
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们在做什么? 高德拥有全中国最庞大、最真实的物理世界视觉数据。我们不只是在做地图,我们正在基于空间智能构建一个能够感知、理解并预测物理规律的“具身基座模型”。 在这里,你将触达数亿级真实街景、轨迹与语义数据,解决从“数字地图”到“通用物理智能”的终极跨越。 岗位核心挑战 具身基座模型 (Embodied Foundation Models): 研发下一代VLA/WAM大模型,突破多模态指令到精准动作映射的瓶颈,实现跨场景的零样本迁移能力。 世界模型 (World Models): 构建基于大规模视频生成的物理世界模拟器,利用生成式AI预测场景演化,为具身智能提供无限的训练“想象空间”。 大模型后训练与强化学习 : 探索GRPO、PPO、SAC等算法在多模态大模型、具身控制上的应用,通过大规模强化学习提升Agent在复杂时空环境下的决策边界。 大规模数据合成与闭环: 利用高德独有的时空数据优势,构建自动化的具身数据生产、评测管线,解决Scaling Law在具身领域的落地难题。 开源影响力与行业基准: 主导或深度参与具身智能开源项目建设。 我们鼓励将核心算法框架、高质量具身数据集或评估基准贡献给开源社区,打造具有行业号召力的开源作品,定义下一代具身智能的技术标准。 为什么加入高德视觉团队? 顶级的“真”数据: 区别于实验室的玩具数据集,我们拥有海量真实室内外场景与空间语义数据,这是训练基座模型最完美的温床。 极致的算力支持: 提供充足的集群资源,让你的Idea不受算力瓶颈束缚。 真实的应用场景: 你的代码将直接驱动真实物理产品,影响数亿用户的出行决策。 极简的技术氛围: 扁平化管理,与世界顶尖研究者共同探索AI的下一站。 加入我们,一起定义物理世界的AI入口!