小红书大模型算法工程师-基础模型
任职要求
1. 具备扎实的机器学习、深度学习理论基础,对多模态、序列建模、跨域学习、迁移学习有深入理解与实践 2. 有推荐系统、搜索排序或者广告系统等相关业务经验,具…
工作职责
1. 负责小红书多场域(如广告、电商、推荐等)通用基础模型的设计与研发,提升模型的泛化与迁移能力 2. 负责跨域学习、序列建模、多模态建模等新范式在业务中的应用。 3. 负责统一的用户/内容表征体系构建,支持长周期用户兴趣建模与动态演化。 4. 探索新一代模型体系构建,提升业务模型技术的天花板
1、机器人基础模型架构设计与开发:如视觉-语言-动作(VLA)模型的算法研发,包括多模态特征对齐、动作序列生成与推理优化,推动模型在机器人操作场景的端到端能力提升; 2、具身智能多模态系统构建:设计融合视觉、语言与动作的联合训练框架,开发基于Transformer或扩散模型的跨模态交互机制,提升模型在复杂动态环境中的语义理解与决策能力; 3、算法性能优化与工程化:针对具身智能硬件平台(如机械臂、移动机器人)优化VLA等模型的实时推理性能,通过算子融合、量化压缩等技术实现低延迟部署。 4、跨模态数据闭环建设:搭建大规模具身智能数据采集与增强系统,设计数据标注与仿真验证工具链,支撑VLA等模型在真实场景的持续迭代。
我们是百度搜索基础模型团队,专注为百度搜索打造成本低、速度快、业务效果好的大语言模型能力。 如果你想挑战千亿参数级模型的极限、参与大模型训练,并将前沿技术落地到日常亿级用户的搜索体验中,这里就是你的舞台! 岗位职责 -模型成本/速度优化:通过 MoE 路由优化、Attention 稀疏计算等技术,提升推理效率、降低部署成本 -模型能力优化:面向搜索业务进行基础模型深度定制优化,包括 MoE 稀疏化策略设计、搜索领域训练任务设计、包括强化学习在内的后训练优化等 -数据合成优化:面向文本、多模态数据合成方案设计与落地,涵盖图像、复杂背景视频、跨模态对齐数据等合成任务,解决真实场景数据稀缺性问题 - 算法研究与创新:关注学术/工业界前沿进展,积极追踪最新技术进展,并推动相关算法落地实际业务 - 跨团队协作:与数据科学团队、架构工程团队等紧密合作,确保技术方案高效落地
团队介绍: 我们是京东科技云事业部基础云业务部AI Infra团队,致力于大模型核心技术的前沿创新与应用。我们专注于业界领先的大模型创新算法及框架研发,构建极致高效的基础大模型训练、推理与渲染一体化平台,提供高吞吐高可用、低成本低延迟的大模型服务。我们的核心使命是高效支持京东自研和业界主流开源基础模型的训练、推理与渲染服务,驱动京东集团内外部的智能体/具身/全模态等大模型业务生态及应用。我们团队秉承技术驱动、创新为本的理念,为每一位成员提供广阔的成长空间和富有挑战性的项目。 岗位职责: 1. 大语言模型/多模态大模型SFT微调、指令跟随、后训练RLHF精调与偏好对齐; 2. 大语言模型/多模态大模型强化学习Reasoning模型算法、Reward模型、Verifier等算法研发; 3. 大语言模型/多模态强化Reasoning大模型长CoTs效率效果优化与RL Scaling-law研究; 4. 大语言/多模态大模型Agent算法研发; 5. 大语言/多模态大模型强化学习Test-time Compute在线推理算法研发。