logo of tencent

腾讯元宝-大模型后训练算法工程师

社招全职3年以上元宝技术地点:深圳状态:招聘

任职要求


1.研究生及以上学历,计算机、人工智能、数学等相关专业(有数学、编程竞赛加分);
2.多年NLP/深度学习研发经验,至少1年大模型应用相关实战经验;
3.深入理解LLM技术栈(如SFT、RM、RLHF、数据合成等…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.面向AI应用场景的大模型微调,优化PostTraining (SFT/RM/RL) 算法的训练效率和实际用户体验效果;
2.研究各领域高质量数据的自动化合成方法,建设高效的线上数据飞轮链路;
3.配合产品和工程,探索LLM在创作、教育、金融、代码等场景下的创新应用。
包括英文材料
学历+
NLP+
深度学习+
大模型+
SFT+
Python+
还有更多 •••
相关职位

logo of tencent
社招3年以上元宝技术

1.面向AI应用场景的大模型微调,优化PostTraining (SFT/RM/RL) 算法的训练效率和实际用户体验效果; 2.研究各领域高质量数据的自动化合成方法,建设高效的线上数据飞轮链路; 3.配合产品和工程,探索LLM在创作、教育、金融、代码等场景下的创新应用。

更新于 2026-02-10北京
logo of tencent
社招3年以上搜索-元宝技术

1.负责AI搜索中大模型后训练方向的核心技术研发、优化与创新,优化Post-training 算法的训练效率和回复效果; 2.研究各领域高质量数据的自动化合成方法,建设高效的线上数据飞轮链路; 3.跟踪AI搜索领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用; 4.参与产品讨论,基于技术对产品提出改进建议。

更新于 2026-01-24北京
logo of tencent
社招3年以上搜索-元宝技术

1.负责AI搜索中大模型后训练方向的核心技术研发、优化与创新,优化Post-training 算法的训练效率和回复效果; 2.研究各领域高质量数据的自动化合成方法,建设高效的线上数据飞轮链路; 3.跟踪AI搜索领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用; 4.参与产品讨论,基于技术对产品提出改进建议。

更新于 2026-02-04北京
logo of tencent
社招2年以上元宝技术

1.负责语音大模型post-training (SFT和RL),针对业务需求进行优化,提升模型的特定能力(如共情能力、知识准确性); 2.负责后训练数据挖掘,分析,清洗和构建,建立数据驱动优化闭环,持续提升模型能力; 3.负责业务侧相关评估方法的开发,研发能够反映产品真实体感的评测体系标准与自动化评测技术,指导后训练优化方向; 4.探索多模态大模型的前沿技术,如端到端语音对话,情感交互等,并落地到业务产品。

更新于 2025-09-04深圳