logo of tencent

腾讯元宝-大模型后训练算法工程师

社招全职3年以上元宝技术地点:北京状态:招聘

任职要求


1.研究生及以上学历,计算机、人工智能、数学等相关专业(有数学、编程竞赛加分);
2.多年NLP/深度学习研发经验,至少1年大模型应用相关实战经验;
3.深入理解LLM技术栈(如SFT、RM、RLHF、数据合成等);
4.熟悉Python/PyTorch,以及Transformer、MoE等核心网络架构;具备扎实的代码能力(Python/C++);
5.在ACL/EMNLP/NeurIPS等顶会发表LLM相关论文者加分。

工作职责


1.面向AI应用场景的大模型微调,优化PostTraining (SFT/RM/RL) 算法的训练效率和实际用户体验效果;
2.研究各领域高质量数据的自动化合成方法,建设高效的线上数据飞轮链路;
3.配合产品和工程,探索LLM在创作、教育、金融、代码等场景下的创新应用。
包括英文材料
学历+
NLP+
深度学习+
大模型+
SFT+
Python+
PyTorch+
Transformer+
C+++
NeurIPS+
相关职位

logo of tencent
社招3年以上元宝技术

1.面向AI应用场景的大模型微调,优化PostTraining (SFT/RM/RL) 算法的训练效率和实际用户体验效果; 2.研究各领域高质量数据的自动化合成方法,建设高效的线上数据飞轮链路; 3.配合产品和工程,探索LLM在创作、教育、金融、代码等场景下的创新应用。

更新于 2025-08-02
logo of tencent
社招2年以上元宝技术

1.负责语音大模型post-training (SFT和RL),针对业务需求进行优化,提升模型的特定能力(如共情能力、知识准确性); 2.负责后训练数据挖掘,分析,清洗和构建,建立数据驱动优化闭环,持续提升模型能力; 3.负责业务侧相关评估方法的开发,研发能够反映产品真实体感的评测体系标准与自动化评测技术,指导后训练优化方向; 4.探索多模态大模型的前沿技术,如端到端语音对话,情感交互等,并落地到业务产品。

更新于 2025-09-04
logo of tencent
社招5年以上搜索-元宝技术

1.负责AI搜索中大模型后训练方向的核心技术研发,包括SFT、偏好学习、强化学习等算法研发、优化与创新,提升AI搜索的回复效果; 2.跟踪AI搜索领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用; 3.参与产品讨论,基于技术对产品提出改进建议。

更新于 2025-09-22
logo of 360
实习售前交付类

1、负责大模型RAG知识文档整理与优化工作,需要与公司各产线团队核对文档完整和正确性,系统化收集、整理、归档并验证大模型知识库有效性等; 2、负责对一线产生的非结构化数据转化为标准化知识条目(含技术指标、操作规范等); 3、负责数据统计、报告总结等知识工程相关文档撰写工作; 4、完成上级领导及客户交办的临时性工作。

更新于 2025-04-23