logo of tencent

腾讯混元大语言模型后训练算法工程师(深圳/北京/上海)

社招全职3年以上混元-模型算法技术地点:深圳状态:招聘

任职要求


1.计算机科学/软件工程/人工智能等相关专业硕士及以上学历;
2.深入理解 Transformer 架构及大语言模型训练原理,在 LLM Alignment、RLHF、Reward Modeling、**个性化大模型(Personalized LLM)、记忆机制(Memory/RAG)**等后训练领域之一有深入的研究和实践经验;
3.在用户画像建模、推荐系统大模型结合、或超长上下文/长期记忆模型优化方面有丰富实战经验者优先;
4.具备扎实的算法基础和工程实现能力,熟练掌握 Pytho…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责大语言模型后训练(Post-Training)阶段的核心技术研发,构建和优化高质量的奖励系统(Reward System),通过Reward Modeling (RM) 和强化学习(RL)算法持续提升模型在复杂指令遵循、逻辑推理及价值观对齐方面的能力;
2.深入研究和优化 RLHF 等后训练算法,提升模型训练的稳定性和最终效果;
3.负责大模型个性化(Personalization)与长期记忆(Memory)机制的算法研发,构建精准的“千人千面”用户建模体系,探索模型如何理解、提取、记忆并动态适应不同用户的长期偏好,持续提升个性化交互体验;
4.负责后训练阶段的数据合成与管理,设计高效的数据飞轮机制,利用SFT、Self-Instruct等技术合成高质量训练数据,并负责建立从用户多维反馈(User Feedback)到模型迭代的闭环信号建模体系;
5.负责后训练模型的全维度评测与分析,制定科学的评价指标,跟进前沿技术动态,将最新研究成果快速转化为业务价值。
包括英文材料
学历+
Transformer+
大模型+
RLHF+
RAG+
推荐系统+
算法+
Python+
PyTorch+
还有更多 •••
相关职位

logo of tencent
社招3年以上AI技术

1.负责语音/音频大模型研发,包括语音对话(语音交互/音视频对话)、音频理解(ASR/音频caption)、音频生成(TTS/视频配音)等模型研发; 2.负责语音/音频大模型的预训练、后训练、强化学习(文本和音频强化)相关的数据和算法工作; 3.负责语音对话/音频理解/音频生成的模型开源以及产品落地(比如语音对话产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化、语音合成在播报/闲聊/游戏/社交等场景的优化)。

更新于 2025-12-12深圳
logo of tencent
社招3年以上AI技术

1.负责TTS、ASR、声学前处理、自然语言处理、多模态大模型等AI系统的工程开发(包括训练工具和推理引擎的开发、优化、交付等); 2.负责AI系统最新算法的集成、工程化、实际场景效果验证、优化、上线; 3.负责AI相关业务、产品的工程支持,在效果和性能上更好的落地。

更新于 2025-09-12深圳
logo of tencent
社招3年以上TEG技术

1.负责大语言模型后台系统的性能优化、流程建设、稳定性和研效提升; 2.负责建设混元大模型的研发体系后端; 3.参与新技术调研及实际业务场落地,不断提升业务指标。

更新于 2025-06-17深圳
logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力; 2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。

更新于 2025-10-31深圳