logo of tencent

腾讯混元大语言模型精调算法工程师-代码方向-深圳/北京

社招全职混元-模型算法技术地点:深圳状态:招聘

任职要求


1.自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士以上学历;
2.在NLPLLM深度学习强化学习方面有一定研究基础,熟悉主流模型和算法,并有一定的实践经验;
3.较强的工程实现能力,熟练掌握C/C++Python等至少一种语言,有实际编程项目经验,熟悉DeepSpeedMegatron等分布式训练框架,熟练使用至少一种深度学习框架(如tensorflowpytorch等);
4.有高质量论文发表者优先(如ACL、EMNLP、NeurIPSICMLICLR等);
5.具备强烈的进取心、自驱力及团队合作精神,热衷于追求技术创新。

工作职责


1.负责大语言模型(LLM)代码理解和生成相关的技术研究,提升大模型的代码基础能力;
2.跟进大模型代码领域的前沿技术,将其应用于研发生产中,持续提升大模型的代码能力;
3.负责大模型的代码相关的数据构建、训练调优及评测迭代,推进大模型技术在代码补全,Text2SQL,代码问答,代码Agent等业务场景落地。
包括英文材料
NLP+
机器学习+
模式识别+
学历+
大模型+
深度学习+
强化学习+
算法+
C+
C+++
Python+
DeepSpeed+
Megatron+
TensorFlow+
PyTorch+
NeurIPS+
ICML+
相关职位

logo of tencent
社招TEG技术

1.负责大语言模型在知识问答能力上的算法设计优化及实现工; 2.建设RAG体系,对RAG链路中的重要模块进行优化,提升模型的性能效果; 3.调研业界前沿算法,追踪最前沿的技术动态,并应用在相关的项目中; 4.参与产品讨论,基于技术对产品提出改进建议。

更新于 2025-05-09
logo of tencent
社招TEG技术

1.负责大语言模型在知识问答能力上的算法设计优化及实现工; 2.建设可信RAG体系,包括全网站、号一体化可信内容理解,建设质量&权威体系,优化内容索引、排序、RAG效果; 3.调研业界前沿算法,追踪最前沿的技术动态,并应用在相关的项目中; 4.参与产品讨论,基于技术对产品提出改进建议。

更新于 2025-04-22
logo of tencent
社招3年以上TEG技术

1.负责大语言模型后台系统的性能优化、流程建设、稳定性和研效提升; 2.负责建设混元大模型的研发体系后端; 3.参与新技术调研及实际业务场落地,不断提升业务指标。

更新于 2025-06-17
logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力; 2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。

更新于 2025-07-26