小红书【Dots】多模posttrain算法研究员-Reasoning

社招全职大模型2026-06-10地点：北京 | 上海 | 杭州状态：招聘

扫码手机上打开

任职要求

任职资格
1、扎实的机器学习与多模态基础：具备扎实的机器学习与深度学习基础，熟练使用至少一种主流深度学习框架（如 PyTorch、JAX、TensorFlow 等），并在生成模型或多模态模型中有较深入的实践经验。
2、生成模型 / 对齐方向相关经验：对监督学习、强化学习、偏好学习、表示学习等方法有深入理解；在图像生成、图像编辑、多模态理解或相关方向中，有过模型训练、对齐或系统优化的实际经验。
3、优秀的实验设计与问题拆解能力：能够从复杂生成现象中抽象问题、设计实验、分析…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

探索 RL Scaling Law,提升模型 general 的真实推理与反思能力(而非仅在特定任务或 Benchmark 上的表现)
在人类智能密度最高的领域(如顶尖数学、竞赛编程、前沿科学等)持续突破,向达到乃至超过人类顶尖水平的方向迈进。
推动推理与工具使用、真实环境的结合，并提升模型思考效率及 adaptive thinking 的能力。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

机器学习+

深度学习+

PyTorch+

JAX+

TensorFlow+

强化学习+

ICML+

还有更多 •••

登录查看完整学习资料