小红书强化学习后端研发实习生
任职要求
1.重点院校硕士及以上学历(或特别优秀的本科生),计算机、软件工程、人工智能等相关专业优先 2.熟悉Linux开发环境,具备良好扎实的算法基础、良好的编程风格和系统设计能力 3…
工作职责
1.小红书大模型强化学习基础设施的开发,接入并维护强化学习工程环境,加快模型训练速度 2.进行大模型强化学习的相关研究,探索如何在开放领域任务(Code,web search,computer use)上高效的进行 RL Scaling,参与研究奖励模型和强化学习模型的泛化性,持续提升模型 Post-Train 能力
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动创作场景业务中台,负责了抖音、剪映等产品的技术和业务研发,涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域,并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。 1、设计和实现基于LLM的智能体架构,包括任务规划、对话管理、意图识别、流程工程等; 2、设计和实现多模态Agent,支持文本、语音、图像等多种输入/输出形式的处理; 3、推动AI Agent在架构和性能上的持续优化,提升Agent对用户理解能力和响应的准确性; 4、开发和维护智能体的后端服务,确保系统的稳定性和可扩展性; 5、跟踪并研究行业前沿AI算法,持续提升AI Agent的技术水平; 6、编写必要的技术文档,包括API接口说明、核心算法设计与代码开发。

智能驾驶系统产品线大规控部门负责城区、高速、停车场等全场景高阶辅助驾驶系统的规控和预测算法开发,同时搭建完善的仿真评测体系提升研发质量和效率。 开发理念: 打破惯性思维,根据问题本质寻找答案和设计解决方案; 不技术自嗨,守住性能底线后再做技术创新,用实车效果说话; 用数据驱动的思维做开发,做好数据闭环,注重评测迭代; 不做简单的规则堆叠,传统方法要提炼简洁优雅的“解析解”; 重视工具开发,提升研发效率,打开算法黑盒,尽量做解释性强的方案。 精益求精,打磨产品细节,做出亮点,提升产品体验。 1. 负责轨迹预测、行为决策、路径规划和运动控制等算法开发,并完成嵌入式量产平台部署; 2. 基于海量数据进行道路参与者行为预测算法研发,设计高性能、高准召、高稳定的预测模块; 3. 开发交互式决策和预测模型,改善自动驾驶车辆在复杂环境中的应对能力; 4. 负责自动驾驶系统产品级仿真引擎的架构设计,仿真平台自动化测试及可视化工具链的构建; 5. 构建可扩展的云端仿真框架,以在集群环境中运行批量仿真模拟,减少云端部署和运行成本; 6. 构建完善仿真场景库替代大部分路测,同时生成挑战性的场景增广路测能力; 7. 建立数据自动标注、难例批量挖掘和分析机制工具链,通过数据闭环持续提升算法能力。

智能驾驶系统产品线大规控部门负责城区、高速、停车场等全场景高阶辅助驾驶系统的规控和预测算法开发,同时搭建完善的仿真评测体系提升研发质量和效率。 开发理念: 打破惯性思维,根据问题本质寻找答案和设计解决方案; 不技术自嗨,守住性能底线后再做技术创新,用实车效果说话; 用数据驱动的思维做开发,做好数据闭环,注重评测迭代; 不做简单的规则堆叠,传统方法要提炼简洁优雅的“解析解”; 重视工具开发,提升研发效率,打开算法黑盒,尽量做解释性强的方案。 精益求精,打磨产品细节,做出亮点,提升产品体验。 1. 负责轨迹预测、行为决策、路径规划和运动控制等算法开发,并完成嵌入式量产平台部署; 2. 基于海量数据进行道路参与者行为预测算法研发,设计高性能、高准召、高稳定的预测模块; 3. 开发交互式决策和预测模型,改善自动驾驶车辆在复杂环境中的应对能力; 4. 负责自动驾驶系统产品级仿真引擎的架构设计,仿真平台自动化测试及可视化工具链的构建; 5. 构建可扩展的云端仿真框架,以在集群环境中运行批量仿真模拟,减少云端部署和运行成本; 6. 构建完善仿真场景库替代大部分路测,同时生成挑战性的场景增广路测能力; 7. 建立数据自动标注、难例批量挖掘和分析机制工具链,通过数据闭环持续提升算法能力。