腾讯混元大语言模型后训练算法工程师-模型合版方向（北京/深圳）

社招全职1年以上混元-模型算法技术2026-04-16地点：北京状态：招聘

扫码手机上打开

任职要求

1.计算机科学、数学、人工智能等相关专业硕士及以上学历，具备良好的数理基础；
2.具备良好的工程实现能力，熟练使用 PyTroch、Megatraon、vLLM 等常见大模型训练和推理框架；
3.具备良好的技术视野，深入理解大模型相关技术原理，熟悉大模型 SFT、RL 及 reward 建模等训练范式，对 RL/OPD 等有深入的实践和研究经验；
…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.深度参与混元大模型后训练（包括 SFT、RL ）及模型合版的研发和相关算法策略研究，提升模型泛化性、能力边界和上限；
2.后训练策略和生产范式的研究，探索更加敏捷、普适和可扩展的训练范式，提升训练和生产效率；
3.相关前沿后训练技术方向探索，包括但不限于 Reasoning/Agentic 能力增强和 Scaling， RL/OPD 等收敛性和可扩展性研究；
4.将研究成果转化为实际的模型能力或生产效率，并撰写高水平技术报告或论文，提升技术影响力。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

vLLM+

大模型+

SFT+

还有更多 •••

登录查看完整学习资料