腾讯微信-大模型后训练算法专家
社招全职1年以上WXG技术地点:北京状态:招聘
任职要求
1.计算机科学、数学、人工智能等相关专业硕士及以上学历; 2.具备良好的数理基础和 NLP 技术基础,能够熟练使用 HuggingFace,Megatron,DeepSpeed,PyTorch 等框架至少一种,深入理解Transformer、GPT等模型架构; 3.在Post-training方向有一定研究基础,熟悉SFT/DPO/PPO/GRPO/Reward Model等; 4.具备良好的分析和解决问题的能力,针对具体的应用场景能合理设计…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责大语言模型(LLM)推理能力的核心技术研发,包括数学推理、逻辑推理、知识推理和通用任务(如问答、翻译等)的算法研发、优化与创新,提升大模型在复杂场景下的高阶推理能力; 2.跟踪推理领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用。
包括英文材料
学历+
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
DeepSpeed+
https://www.youtube.com/watch?v=pDGI668pNg0
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
GPT+
https://www.youtube.com/watch?v=kCc8FmEb1nY
We build a Generatively Pretrained Transformer (GPT), following the paper "Attention is All You Need" and OpenAI's GPT-2 / GPT-3.
还有更多 •••
相关职位
社招1年以上WXG公共技术
1.负责大语言模型(LLM)推理能力的核心技术研发,包括数学推理、逻辑推理、知识推理和通用任务(如问答、翻译等)的算法研发、优化与创新,提升大模型在复杂场景下的高阶推理能力; 2.跟踪推理领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用。
更新于 2026-01-30北京
社招1年以上WXG公共技术
1.基座大模型的训练性能优化和高稳定性训练框架开发; 2.大模型应用的后台系统设计与开发、推理性能优化,确保系统高性能和高可用性; 3.大模型相关业务功能开发,基础框架与工具建设等; 4.跟踪前沿技术,推动研究成果在业务场景的落地。
更新于 2026-03-23北京
社招2年以上微信交易平台技术
1.探索大模型在电商场景的应用; 2.利用大模型优化电商推荐效果,包括但不限于召回、排序等环节; 3.跟踪大模型的前沿进展,研究数据合成、后训练等方法,推动模型在实际场景中的效果优化。
更新于 2025-12-24广州