logo of tencent

腾讯 混元大模型强化学习研究员

社招全职1年以上混元助手-其他技术地点:北京状态:招聘

任职要求


1.全球高校计算机科学、机器学习、人工智能等相关专业博士;
2.有大模型前沿技术领域全球领先企业的工作经验;
3.精通Python编程语言,具有基于PyTorchTensorFlow深度学习工具的技术开发经验;
4.具备丰富的学术研究经验,在世界顶尖会议NeurIPsICLRICML、ACL、EMNLP等发表过文章,有深度学习学术或工程项目经验;
5.具备良好的沟通能力以及团队协作精神,能够与跨职能团队共同推进项目进展与突破;
6.对技术充满热情,具有创新思维,能独立解决问题。

工作职责


1.带领团队开展前沿算法研究,重点攻克大模型中强化学习算法设计与优化,研究方向包括但不限于:强化学习算法、奖励建模、世界模型等;
2.强化学习算法要在大模型的复杂推理等方向自主探索与学习等场景进行大规模实验验证,推动研究成果在行业内落地,并发表有影响力论文;
3.负责探索大模型的前沿技术,结合未来实际应用场景,提供技术解决方案;
4.与业界同行进行交流与合作,跟踪并分析大模型强化学习领域的最新研究动态。
包括英文材料
机器学习+
大模型+
Python+
PyTorch+
TensorFlow+
深度学习+
ICML+
NeurIPS+
相关职位

logo of tencent
社招3年以上混元助手-平台技

1.带领团队进行前沿算法研究,专注于大模型中强化学习算法的设计与优化,涵盖强化学习算法、奖励建模、世界模型等多个方向; 2.在大模型的复杂推理等自主探索与学习等场景中进行大规模实验验证,推动研究成果在行业内的实际应用,并发表具有影响力的学术论文; 3.探索大模型的前沿技术,结合未来实际应用场景,提供创新的技术解决方案; 4.与跨职能团队合作,确保项目进展顺利,并在技术突破方面发挥领导作用。

更新于 2025-10-03
logo of tencent
社招AI技术

1.研发新一代3D资产生成大模型,突破生成质量、速度与可控性的技术边界; 2.构建工业级3D AI生成管线,解决几何拓扑优化、材质贴图生成、物理合理性等核心问题。

更新于 2025-07-23
logo of ke
社招0-3年XYZ

各类大模型算法岗位:包括不限于 ✓大模型应用(Rag、Agent的研究等) ✓大模型技术研究 (指令微调、强化学习、推理等) ✓多模态理解与生成研究(文本、图像、视频、音频等)

更新于 2025-02-18
logo of tencent
社招混元-模型算法技

1.负责大语言模型(LLM)代码理解和生成相关的技术研究,提升大模型的代码基础能力; 2.跟进大模型代码领域的前沿技术,将其应用于研发生产中,持续提升大模型的代码能力; 3.负责大模型的代码相关的数据构建、训练调优及评测迭代,推进大模型技术在代码补全,Text2SQL,代码问答,代码Agent等业务场景落地。

更新于 2025-06-26