logo of tencent

腾讯混元大模型交互算法工程师(北京/上海)

社招全职3年以上AI技术地点:深圳状态:招聘

任职要求


1.有大语言模型应用经验优先,包括精调(SFT)、强化(DPO,PPO)等技术的落地;
2.熟悉PytorchMegatron, DeepSpeed等模型训练框架;
3.熟悉自然语言处理方向常用的理论和方法,熟悉阅读理解、问答、对话、语言模型、预训练等核心技术;
4…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责大语言模型在人机语音交互、音视频对话能力上的算法设计优化;
2.调研业界前沿算法,追踪最前沿的技术动态,并应用在相关的项目中;
3.参与产品讨论,基于技术对产品提出改进建议。
包括英文材料
SFT+
PyTorch+
Megatron+
DeepSpeed+
NLP+
NeurIPS+
还有更多 •••
相关职位

logo of tencent
社招2年以上混元助手-其他技

1.跟踪业界最新的语音生成算法研究,探索下一代语音、音频生成新范式,拓展语音生成边界能力; 2.探索多模态语音大模型的前沿技术,结合文本、语音、视觉等技术提升语音交互体验; 3.负责语音大模型的技术研发工作,推动模型性能提升与创新应用。

更新于 2025-11-17北京
logo of tencent
社招3年以上TEG技术

1.负责混元大模型相关研发工作,包括文本创作、文本理解、数学、翻译、Agent FunctionCalls等专项; 2.负责混元在公司内相关业务场景落地,根据业务需求优化混元模型,提升业务效果; 3.负责跟踪和探索大语言模型的前沿问题,结合实际场景,提供全面的技术解决方案,参与前沿算法与应用的研究。

更新于 2025-06-19北京
logo of tencent
社招TEG技术

1.基于大模型训练对于数据的需求进行互联网数据抓取,对提供给大模型训练/搜索等场景的语料进行清洗,提升语料纯度; 2.建设对标业内前沿的大模型训练数据集和数据清洗能力,提升数据质量和多样性,并验证数据价值和效果。

更新于 2025-06-18北京
logo of tencent
社招3年以上TEG技术

1.负责大语言模型后台系统的性能优化、流程建设、稳定性和研效提升; 2.负责建设混元大模型的研发体系后端; 3.参与新技术调研及实际业务场落地,不断提升业务指标。

更新于 2025-06-17深圳