腾讯混元大语言模型后训练算法工程师-模型合版方向(北京/深圳)
社招全职1年以上混元-模型算法技术地点:北京状态:招聘
任职要求
1.计算机科学、数学、人工智能等相关专业硕士及以上学历,具备良好的数理基础; 2.具备良好的工程实现能力,熟练使用 PyTroch、Megatraon、vLLM 等常见大模型训练和推理框架; 3.具备良好的技术视野,深入理解大模型相关技术原理,熟悉大模型 SFT、RL 及 reward 建模等训练范式,对 RL/OPD 等有深入的实践和研究经验; …
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.深度参与混元大模型后训练(包括 SFT、RL )及模型合版的研发和相关算法策略研究,提升模型泛化性、能力边界和上限; 2.后训练策略和生产范式的研究,探索更加敏捷、普适和可扩展的训练范式,提升训练和生产效率; 3.相关前沿后训练技术方向探索,包括但不限于 Reasoning/Agentic 能力增强和 Scaling, RL/OPD 等收敛性和可扩展性研究; 4.将研究成果转化为实际的模型能力或生产效率,并撰写高水平技术报告或论文,提升技术影响力。
包括英文材料
学历+
vLLM+
https://www.newline.co/@zaoyang/ultimate-guide-to-vllm--aad8b65d
vLLM is a framework designed to make large language models faster, more efficient, and better suited for production environments.
https://www.youtube.com/watch?v=Ju2FrqIrdx0
vLLM is a cutting-edge serving engine designed for large language models (LLMs), offering unparalleled performance and efficiency for AI-driven applications.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
还有更多 •••