腾讯混元大模型训练框架研发工程师-（北京/深圳）

社招全职5年以上公共技术2026-06-26地点：北京状态：招聘

扫码手机上打开

任职要求

1.熟练使用PyTorch框架，可对DDP训练的代码进行性能分析和优化；
2.熟练使用主流大模型训练框架DeepSpeed、Megatron，掌握3D并行、ZeRO机制、Flash-Attn等的原理、使用场景、优劣势以及可优化方向；
3.有V…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.参与开发优化大模型训练框架，支持单任务万卡以上规模高效稳定训练；
2.参与NLP、多模态大模型结构设计，并联合业务进行模型训练效率和效果验证；
3.参与文生图、文生视频、文生3D等业务的训练性能加速；
4.参与低精度训练性能优化和业务推广、参与大窗口训练性能优化。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

混元多模态大模型强化学习后训练框架研发工程师（北京）

社招3年以上AI技术

1.负责混元多模态大模型的RL后训练框架研发； 2.设计和开发高效的框架和算子，以支持各种硬件加速器； 3.参与强化学习算法的优化和实现，提高训练和推理性能； 4.跨团队协作，与算法、软件、硬件团队密切合作，提高框架性能和稳定性。

更新于 2026-04-03深圳

混元-新一代大模型分布式训练基础框架研究

校招青云计划-实习生

北京|上海

混元大语言模型后训练算法工程师（深圳/北京/上海）

社招3年以上混元-模型算法技

1.负责大语言模型后训练（Post-Training）阶段的核心技术研发，构建和优化高质量的奖励系统（Reward System），通过Reward Modeling (RM) 和强化学习（RL）算法持续提升模型在复杂指令遵循、逻辑推理及价值观对齐方面的能力； 2.深入研究和优化 RLHF 等后训练算法，提升模型训练的稳定性和最终效果； 3.负责大模型个性化（Personalization）与长期记忆（Memory）机制的算法研发，构建精准的“千人千面”用户建模体系，探索模型如何理解、提取、记忆并动态适应不同用户的长期偏好，持续提升个性化交互体验； 4.负责后训练阶段的数据合成与管理，设计高效的数据飞轮机制，利用SFT、Self-Instruct等技术合成高质量训练数据，并负责建立从用户多维反馈（User Feedback）到模型迭代的闭环信号建模体系； 5.负责后训练模型的全维度评测与分析，制定科学的评价指标，跟进前沿技术动态，将最新研究成果快速转化为业务价值。

更新于 2026-06-30深圳

混元大语言模型后训练算法工程师-垂域方向（北京/深圳/上海）

社招1年以上混元-模型算法技

1.专业领域智能体架构升级：负责面向金融、法务、医疗等专业领域的大模型智能体体系建设，利用 Agentic RAG 架构实现从基础检索问答到深度分析、专业研判与复杂任务执行的演进； 2.深度推理与规划：针对复杂专业任务指令，设计并实现基于推理类模型的任务拆解、多步规划（Planning）与流程编排策略，提升系统处理专业分析、跨文档归纳、决策支持等复杂问题的能力； 3.事实核查与结果可靠性：建立可靠的事实核查（Fact-checking）与结果校验机制，通过证据溯源、多源信息比对、结构化校验等手段，解决大模型在专业场景中的幻觉与失真问题，确保生成结果的真实性、严谨性与可追溯性； 4.前沿技术转化：探索推理类模型在专业领域 Agent 的落地，包括基于过程监督的思维链（CoT）优化、面向专业任务反馈的强化学习（RL）策略，以及搜索、数据分析、文件处理等多工具协同能力的持续演进。

更新于 2026-07-21北京