logo of tencent

腾讯微信-基座大模型后训练算法专家

社招全职2年以上WXG公共技术地点:北京状态:招聘

任职要求


1.计算机科学、数学、人工智能等相关专业硕士及以上学历;
2.具备良好的数理基础和 NLP 技术基础,能够熟练使用 Megatron,HuggingFace,DeepSpeedPyTorch 等框架至少一种,深入理解 TransformerGPT 等模型架构;
3.在 Post-training 方向有一定研究基础,熟悉 SFT/DPO/PPO/GRPO/Reward Model 等;
4.具备良好的分析和解决问题的能力…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.基座大模型(LLM)推理能力和通用能力的核心技术研发,包括数学推理、代码、逻辑推理、知识推理、创作、多轮对话、问答、翻译等任务的算法研发、优化,突破模型智力上限;
2.提升基座大模型在复杂场景的高阶处理能力,如多轮交互(复杂指令遵循、多轮对话、角色扮演等)、Agent 能力( 融合“思考模式”与“非思考模式”,实现自主、精准的函数与工具调用);
3.跟踪前沿技术,参与前沿算法研究,如研发更高效的强化学习(RL)训练算法、探索自适应思考深度的模型优化算法、探索提升思维链的 “智能密度” 的方法等,推动研究成果在业务场景的落地应用;
4.对于探索前沿技术有很好的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力。
包括英文材料
学历+
NLP+
Megatron+
DeepSpeed+
PyTorch+
Transformer+
GPT+
还有更多 •••
相关职位

logo of tencent
社招1年以上WXG公共技术

1.基座大模型的训练性能优化和高稳定性训练框架开发; 2.大模型应用的后台系统设计与开发、推理性能优化,确保系统高性能和高可用性; 3.大模型相关业务功能开发,基础框架与工具建设等; 4.跟踪前沿技术,推动研究成果在业务场景的落地。

更新于 2026-06-11北京
logo of tencent
社招1年以上WXG公共技术

负责微信视觉基座模型的核心技术研发与业务落地,构建统一的视觉理解与解析能力,支持在微信C端及视频号、公众号、微信小店等业务场景中的规模化应用。

更新于 2026-03-25深圳
logo of tencent
社招微信基础AI探索

1.负责社交大模型方向的记忆检索、Agent函数调用、风格化基座模型等方向的算法突破; 2.紧密贴合业务,通过后训练(SFT&RL)提升模型的专项问题解决能力; 3.基于微信场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化。

更新于 2026-02-10北京
logo of tencent
社招1年以上WXG公共技术

参与微信自研多模态生成基座的全链路研发,包括但不限于图片生成和编辑、视频生成、理解生成统一模型、可控生成、模型压缩等方向,参与构建高效的多模态数据引擎、探索下一代生成模型架构、设计全流程训练策略、构建高质量的评测体系等,打造符合微信业务生态的多模态生成AI系统。

更新于 2026-03-25深圳