千问智能信息-大模型训练优化专家-强化学习

社招全职1年以上2025-11-30地点：北京 | 杭州 | 广州状态：招聘

扫码手机上打开

任职要求

1. 3年及以上大模型训练工程经验，有扎实的深度学习算法基础，精通各类大模型常用训练框架，熟练掌握各种编译、调试、性能分析工具；
2. 熟悉强化学习算法PPO、DPO、GRPO、DAPO等以及相应的高效工程实现，有大模型强化学习工程支持经验和效果优化经验；
3. 精通ray分布式计算框架开发实现，掌握一种或多种分布式训练框架（…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责千卡以上规模文本及多模态大模型强化学习训练框架建设；为Quark、通义等过亿用户，提供大模型后训练能力，持续优化模型效果；
2、负责调研和实现业界先进的强化学习方法，并探索算法工程结合的训练方法创新设计，实现模型性能和训练效率的双提升；
3、负责训练效率极致优化，通过前沿技术的调研、引入，以及机制创新，实现业界领先的训练吞吐能力。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

深度学习+

算法+

强化学习+

还有更多 •••

登录查看完整学习资料

相关职位

元宝—面向开放域信息获取与推理的大模型智能体研究

校招青云计划-实习生

北京

智能信息-移动开发工程师-大阅读

社招2年以上技术类-开发

1、负责UC浏览器基础功能，以及小说、短剧、故事等内容型业务开发； 2、负责UC浏览器上技术优化和难点攻关，包括基础性能、Web体验、小说引擎、音视频播放等； 3、在理解产品业务的基础上，提升产品的用户体验，技术驱动业务的发展； 4、关注移动端前沿技术研究，通过新技术促进业务发展。

更新于 2025-12-23广州

智能信息-Android高级开发工程师-北京

社招3年以上技术类-开发

1.参与/负责书旗小说APP产品的研发； 2.参与/负责承担业务架构设计并能主导项目，确定关键技术解决方案； 3.独立解决业务中的疑难杂症，提高客户端的性能和稳定性； 4.对安卓应用开发新技术进行跟踪调研，并负责新技术产品化落地

更新于 2025-11-21北京

智能信息-夸克-前端Leader

社招5年以上技术类-前端

1、负责夸克App上创新产品的前端研发工作，负责跟业务方对接需求，对需求的技术方案拆解、方案评审和上下游的协调推进，带领团队在项目周期内高效、高质量交付； 2、负责前端业务的架构设计、性能体验优化、技术攻坚和业务需要的技术调研工作； 3、主动识别业务重难点和用户使用痛点，能够利用自身技术能力提升业务效果，帮助业务达成目标； 4、理解业务战略，根据业务整体规划和目标，制定相关的技术规划和团队发展规划，培养团队并拓展业务和技术边界；

更新于 2025-10-10杭州