小红书强化学习后端研发实习生

实习兼职大模型2025-07-25地点：北京状态：招聘

扫码手机上打开

任职要求

1.重点院校硕士及以上学历(或特别优秀的本科生)，计算机、软件工程、人工智能等相关专业优先
2.熟悉Linux开发环境，具备良好扎实的算法基础、良好的编程风格和系统设计能力
3…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.小红书大模型强化学习基础设施的开发，接入并维护强化学习工程环境，加快模型训练速度
2.进行大模型强化学习的相关研究，探索如何在开放领域任务(Code，web search，computer use)上高效的进行 RL Scaling，参与研究奖励模型和强化学习模型的泛化性，持续提升模型 Post-Train 能力

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Linux+

算法+

系统设计+

Go+

还有更多 •••

登录查看完整学习资料

相关职位

AI Agent研发实习生-智能创作

实习A07601A

ByteIntern：面向2026届毕业生（2025年9月-2026年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：智能创作团队是字节跳动创作场景业务中台，负责了抖音、剪映等产品的技术和业务研发，涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域，并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案，同时通过火山引擎为企业客户提供服务。 1、设计和实现基于LLM的智能体架构，包括任务规划、对话管理、意图识别、流程工程等； 2、设计和实现多模态Agent，支持文本、语音、图像等多种输入/输出形式的处理； 3、推动AI Agent在架构和性能上的持续优化，提升Agent对用户理解能力和响应的准确性； 4、开发和维护智能体的后端服务，确保系统的稳定性和可扩展性； 5、跟踪并研究行业前沿AI算法，持续提升AI Agent的技术水平； 6、编写必要的技术文档，包括API接口说明、核心算法设计与代码开发。

更新于 2024-03-13北京

智能驾驶强化学习算法实习生【行泊一体方向】

实习算法序列

智能驾驶系统产品线大规控部门负责城区、高速、停车场等全场景高阶辅助驾驶系统的规控和预测算法开发，同时搭建完善的仿真评测体系提升研发质量和效率。开发理念：打破惯性思维，根据问题本质寻找答案和设计解决方案；不技术自嗨，守住性能底线后再做技术创新，用实车效果说话；用数据驱动的思维做开发，做好数据闭环，注重评测迭代；不做简单的规则堆叠，传统方法要提炼简洁优雅的“解析解”；重视工具开发，提升研发效率，打开算法黑盒，尽量做解释性强的方案。精益求精，打磨产品细节，做出亮点，提升产品体验。 1. 负责轨迹预测、行为决策、路径规划和运动控制等算法开发，并完成嵌入式量产平台部署； 2. 基于海量数据进行道路参与者行为预测算法研发，设计高性能、高准召、高稳定的预测模块； 3. 开发交互式决策和预测模型，改善自动驾驶车辆在复杂环境中的应对能力； 4. 负责自动驾驶系统产品级仿真引擎的架构设计，仿真平台自动化测试及可视化工具链的构建； 5. 构建可扩展的云端仿真框架，以在集群环境中运行批量仿真模拟，减少云端部署和运行成本； 6. 构建完善仿真场景库替代大部分路测，同时生成挑战性的场景增广路测能力； 7. 建立数据自动标注、难例批量挖掘和分析机制工具链，通过数据闭环持续提升算法能力。

更新于 2025-11-27上海

智能驾驶强化学习算法实习生【行泊一体方向】

校招算法序列

更新于 2025-11-27上海

【实习】视频大模型数据工程师

实习程序&技术类

1负责视频生成强化学习的数据处理管线搭建、日常运营、与优化。通过与研发，数据湖后端紧密合作，确定视频数据管线和流程，建立关键工具，确保日常运营的高质量和高效数据生成和管理。核心职责： 1、从数据需求出发，完成数据处理管线的方案设计，规范化数据处理流程； 2、开发与优化脚本工具实现管线处理的关键步骤，提升数据处理效率，； 3、进行日常运营，维护数据管线，把控数据的质量，保证各版本数据的高质量交付； 4、分析数据分布，优化数据采样收集流程，持续提升数据交付质量；

上海