logo of tencent

腾讯混元大语言模型算法工程师-大模型推理能力方向-深圳/北京

社招全职3年以上混元-模型算法技术地点:深圳状态:招聘

任职要求


1.有过大模型代码/数学/reasoning方向的研发经历;
2.在post-training方向有一定研究基础,熟悉SFT/DPO/PPO/Reward Model等pipeline;
3.较强的工程实现能力,熟练使用Python语言,有实际编程项…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力;
2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。
包括英文材料
大模型+
SFT+
Python+
DeepSpeed+
还有更多 •••
相关职位

logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型后训练(Post-Training)阶段的核心技术研发,构建和优化高质量的奖励系统(Reward System),通过Reward Modeling (RM) 和强化学习(RL)算法持续提升模型在复杂指令遵循、逻辑推理及价值观对齐方面的能力; 2.深入研究和优化 RLHF 等后训练算法,提升模型训练的稳定性和最终效果; 3.负责大模型个性化(Personalization)与长期记忆(Memory)机制的算法研发,构建精准的“千人千面”用户建模体系,探索模型如何理解、提取、记忆并动态适应不同用户的长期偏好,持续提升个性化交互体验; 4.负责后训练阶段的数据合成与管理,设计高效的数据飞轮机制,利用SFT、Self-Instruct等技术合成高质量训练数据,并负责建立从用户多维反馈(User Feedback)到模型迭代的闭环信号建模体系; 5.负责后训练模型的全维度评测与分析,制定科学的评价指标,跟进前沿技术动态,将最新研究成果快速转化为业务价值。

更新于 2026-04-03深圳
logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型(LLM)代码理解和生成相关的技术研究,提升大模型的代码基础能力; 2.跟进大模型代码领域的前沿技术,将其应用于研发生产中,持续提升大模型的代码能力; 3.负责大模型的代码相关的数据构建、训练调优及评测迭代,推进大模型技术在代码补全,Text2SQL,代码问答,代码Agent等业务场景落地。

更新于 2026-01-15深圳
logo of tencent
社招3年以上TEG技术

1.负责混元大模型相关研发工作,包括文本创作、文本理解、数学、翻译、Agent FunctionCalls等专项; 2.负责混元在公司内相关业务场景落地,根据业务需求优化混元模型,提升业务效果; 3.负责跟踪和探索大语言模型的前沿问题,结合实际场景,提供全面的技术解决方案,参与前沿算法与应用的研究。

更新于 2025-06-19北京
logo of tencent
社招3年以上AI技术

1.负责大语言模型在人机语音交互、音视频对话能力上的算法设计优化; 2.调研业界前沿算法,追踪最前沿的技术动态,并应用在相关的项目中; 3.参与产品讨论,基于技术对产品提出改进建议。

更新于 2025-11-11深圳