logo of tencent

腾讯混元大模型交互算法工程师(北京/上海)

社招全职3年以上AI技术地点:深圳状态:招聘

任职要求


1.有大语言模型应用经验优先,包括精调(SFT)、强化(DPO,PPO)等技术的落地;
2.熟悉PytorchMegatron, DeepSpeed等模型训练框架;
3.熟悉自然语言处理方向常用的理论和方法,熟悉阅读理解、问答、对话、语言模型、预训练等核心技术;
4…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责大语言模型在人机语音交互、音视频对话能力上的算法设计优化;
2.调研业界前沿算法,追踪最前沿的技术动态,并应用在相关的项目中;
3.参与产品讨论,基于技术对产品提出改进建议。
包括英文材料
SFT+
PyTorch+
Megatron+
DeepSpeed+
NLP+
NeurIPS+
还有更多 •••
相关职位

logo of tencent
社招3年以上AI技术

1.负责语音/音频大模型研发,包括语音对话(语音交互/音视频对话)、音频理解(ASR/音频caption)、音频生成(TTS/视频配音)等模型研发; 2.负责语音/音频大模型的预训练、后训练、强化学习(文本和音频强化)相关的数据和算法工作; 3.负责语音对话/音频理解/音频生成的模型开源以及产品落地(比如语音对话产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化、语音合成在播报/闲聊/游戏/社交等场景的优化)。

更新于 2025-12-12深圳
logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型后训练(Post-Training)阶段的核心技术研发,构建和优化高质量的奖励系统(Reward System),通过Reward Modeling (RM) 和强化学习(RL)算法持续提升模型在复杂指令遵循、逻辑推理及价值观对齐方面的能力; 2.深入研究和优化 RLHF 等后训练算法,提升模型训练的稳定性和最终效果; 3.负责大模型个性化(Personalization)与长期记忆(Memory)机制的算法研发,构建精准的“千人千面”用户建模体系,探索模型如何理解、提取、记忆并动态适应不同用户的长期偏好,持续提升个性化交互体验; 4.负责后训练阶段的数据合成与管理,设计高效的数据飞轮机制,利用SFT、Self-Instruct等技术合成高质量训练数据,并负责建立从用户多维反馈(User Feedback)到模型迭代的闭环信号建模体系; 5.负责后训练模型的全维度评测与分析,制定科学的评价指标,跟进前沿技术动态,将最新研究成果快速转化为业务价值。

更新于 2026-04-03深圳
logo of tencent
社招2年以上混元助手-其他技

1.跟踪业界最新的语音生成算法研究,探索下一代语音、音频生成新范式,拓展语音生成边界能力; 2.探索多模态语音大模型的前沿技术,结合文本、语音、视觉等技术提升语音交互体验; 3.负责语音大模型的技术研发工作,推动模型性能提升与创新应用。

更新于 2025-11-17北京
logo of tencent
社招3年以上公共技术

1.设计具备多模态联合感知、推理、记忆与生成能力的统一大模型架构(视觉/音频/文本); 2.构建支持持续学习、多级记忆、主动探索和自演进的大模型系统; 3.推进 agent化方向,使模型具备自主任务规划、跨模态交互、工具使用和自我优化能力; 4.深度参与通用表征、音视频同频建模、世界模型、稀疏建模等关键模块的设计与实现; 5.跟踪并研究前沿技术趋势,推动创新技术在项目中的应用。

更新于 2026-01-23深圳