logo of tencent

腾讯微信-大模型后训练算法专家

社招全职1年以上WXG技术地点:北京状态:招聘

任职要求


1.计算机科学、数学、人工智能等相关专业硕士及以上学历;
2.具备良好的数理基础和 NLP 技术基础,能够熟练使用 HuggingFace,MegatronDeepSpeedPyTorch 等框架至少一种,深入理解TransformerGPT等模型架构;
3.在Post-training方向有一定研究基础,熟悉SFT/DPO/PPO/GRPO/Reward Model等;
4.具备良好的分析和解决问题的能力,针对具体的应用场景能合理设计…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责大语言模型(LLM)推理能力的核心技术研发,包括数学推理、逻辑推理、知识推理和通用任务(如问答、翻译等)的算法研发、优化与创新,提升大模型在复杂场景下的高阶推理能力;
2.跟踪推理领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用。
包括英文材料
学历+
NLP+
Megatron+
DeepSpeed+
PyTorch+
Transformer+
GPT+
还有更多 •••
相关职位

logo of tencent
社招2年以上微信交易平台技术

1.探索大模型在电商场景的应用; 2.利用大模型优化电商推荐效果,包括但不限于召回、排序等环节; 3.跟踪大模型的前沿进展,研究数据合成、后训练等方法,推动模型在实际场景中的效果优化。

更新于 2025-09-08广州
logo of tencent
社招微信基础AI探索

1.负责社交大模型方向的记忆检索、Agent函数调用、风格化基座模型等方向的算法突破; 2.紧密贴合业务,通过后训练(SFT&RL)提升模型的专项问题解决能力; 3.基于微信场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化。

更新于 2025-10-07北京
logo of tencent
社招WXG技术

1.负责多模态大模型(图文、视频)在红点推送、本地生活推荐等业务场景中的技术探索与落地应用,提升内容生成精准度和用户转化效率; 2.结合业务数据特点,优化多模态模型的后训练、领域微调、生成控制等技术,实现文案创意生成、个性化推荐、分发策略联动的闭环优化; 3.深入理解用户行为和场景需求,探索多模态生成模型与推荐系统的深度融合,提升内容触达的实时性和相关性。

更新于 2025-04-23广州
logo of tencent
社招2年以上视频号短视频技术

1.负责多模态大模型(图文、视频)在红点推送、本地生活推荐等业务场景中的技术探索与落地应用,提升内容生成精准度和用户转化效率; 2.结合业务数据特点,优化多模态模型的后训练、领域微调、生成控制等技术,实现文案创意生成、个性化推荐、分发策略联动的闭环优化; 3.深入理解用户行为和场景需求,探索多模态生成模型与推荐系统的深度融合,提升内容触达的实时性和相关性。

更新于 2025-11-24广州