logo of tencent

腾讯 混元大模型强化学习研究员

社招全职1年以上混元助手-其他技术地点:北京状态:招聘

任职要求


1.全球高校计算机科学、机器学习、人工智能等相关专业博士;
2.有大模型前沿技术领域全球领先企业的工作经验;
3.精通Python编程语言,具有基于PyTorch或TensorFlow等深度学习工具的技术开发经验;
4.具备丰富的学术研究经验,…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.带领团队开展前沿算法研究,重点攻克大模型中强化学习算法设计与优化,研究方向包括但不限于:强化学习算法、奖励建模、世界模型等;
2.强化学习算法要在大模型的复杂推理等方向自主探索与学习等场景进行大规模实验验证,推动研究成果在行业内落地,并发表有影响力论文;
3.负责探索大模型的前沿技术,结合未来实际应用场景,提供技术解决方案;
4.与业界同行进行交流与合作,跟踪并分析大模型强化学习领域的最新研究动态。
包括英文材料
机器学习+
大模型+
Python+
PyTorch+
还有更多 •••
相关职位

logo of tencent
社招3年以上混元助手-平台技

1.带领团队进行前沿算法研究,专注于大模型中强化学习算法的设计与优化,涵盖强化学习算法、奖励建模、世界模型等多个方向; 2.在大模型的复杂推理等自主探索与学习等场景中进行大规模实验验证,推动研究成果在行业内的实际应用,并发表具有影响力的学术论文; 3.探索大模型的前沿技术,结合未来实际应用场景,提供创新的技术解决方案; 4.与跨职能团队合作,确保项目进展顺利,并在技术突破方面发挥领导作用。

更新于 2025-10-27深圳
logo of tencent
社招3年以上公共技术

1.设计具备多模态联合感知、推理、记忆与生成能力的统一大模型架构(视觉/音频/文本); 2.构建支持持续学习、多级记忆、主动探索和自演进的大模型系统; 3.推进 agent化方向,使模型具备自主任务规划、跨模态交互、工具使用和自我优化能力; 4.深度参与通用表征、音视频同频建模、世界模型、稀疏建模等关键模块的设计与实现; 5.跟踪并研究前沿技术趋势,推动创新技术在项目中的应用。

更新于 2025-12-19深圳
logo of tencent
社招3年以上AI技术

1.研发新一代3D资产生成大模型,突破生成质量、速度与可控性的技术边界; 2.构建工业级3D AI生成管线,解决几何拓扑优化、材质贴图生成、物理合理性等核心问题。

更新于 2026-01-10深圳
logo of ke
社招0-3年XYZ

各类大模型算法岗位:包括不限于 ✓大模型应用(Rag、Agent的研究等) ✓大模型技术研究 (指令微调、强化学习、推理等) ✓多模态理解与生成研究(文本、图像、视频、音频等)

更新于 2025-02-18北京