logo of xiaohongshu

小红书【Dots】多模posttrain算法研究员-Reasoning

社招全职大模型地点:北京 | 上海 | 杭州状态:招聘

任职要求


任职资格
1、扎实的机器学习与多模态基础:具备扎实的机器学习深度学习基础,熟练使用至少一种主流深度学习框架(如 PyTorchJAXTensorFlow 等),并在生成模型或多模态模型中有较深入的实践经验。
2、生成模型 / 对齐方向相关经验:对监督学习、强化学习、偏好学习、表示学习等方法有深入理解;在图像生成、图像编辑、多模态理解或相关方向中,有过模型训练、对齐或系统优化的实际经验。
3、优秀的实验设计与问题拆解能力:能够从复杂生成现象中抽象问题、设计实验、分析…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


探索 RL Scaling Law,提升模型 general 的真实推理与反思能力(而非仅在特定任务或 Benchmark 上的表现)
在人类智能密度最高的领域(如顶尖数学、竞赛编程、前沿科学等)持续突破,向达到乃至超过人类顶尖水平的方向迈进。
推动推理与工具使用、真实环境的结合,并提升模型思考效率及 adaptive thinking 的能力。
包括英文材料
机器学习+
深度学习+
PyTorch+
JAX+
TensorFlow+
强化学习+
ICML+
还有更多 •••