腾讯多模态模型架构和训练方案探索

校招全职青云计划-实习生地点：深圳状态：招聘

扫码手机上打开

任职要求

加分项
此课题同时招聘应…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

相关职位

【北斗】基座大模型算法研究员（大模型下一代技术研究）

校招核心本地商业-基

1.面向高效训练和推理的模型架构设计，包括但不限于MoE架构和稀疏注意力机制，模型编辑和合并，模型压缩和推理加速方法等。 2.面向复杂的多模态推理交互场景，研究突破多模态推理强化、多模态奖励模型、test time scaling和全模态COT等，提升模型处理复杂多模态任务的能力和全模态交互水平。 3.探索多模态预训练新范式，包括多模态能力早期融合（Early-Fusion）、理解和生成的统一建模、研究多模态扩展定律（Scaling Law）指导数据和训练方案、扩展超长上下文机制支持全模态场景等，突破模态融合瓶颈，推动全模态能力跃迁。

更新于 2025-05-23北京|上海

【北斗】基座大模型算法研究员（数据与训练/后训练）

校招核心本地商业-基

数据与训练方向： 1.大模型数据体系建设：构建多语言和多模态的数据处理流程和实验链路，优化数据的筛选与配比策略，探索动态数据调整、多阶段训练和课程学习等方法提升数据质量和多样性，优化大模型的训练效果。 2.合成数据探索：探索大规模合成数据方法，应用于复杂任务、推理、代码和多模态等场景。制定合成数据在预训练、强化学习等不同训练阶段的应用策略，并深入研究数据扩展规模定律、数据多样性和模型坍塌等基础问题，推动数据驱动的性能突破。 3.多模态学习与推理：探索多模态预训练的新范式，突破模态融合瓶颈。具体包括实现多模态能力的早期融合、理解与生成的统一建模，研究多模态扩展定律以指导数据与训练方案，扩展超长上下文机制以支持全模态场景等。同时，面向复杂的多模态推理与交互场景，探索多模态强化学习、多模态奖励模型、推理阶段扩展（test-time scaling）以及全模态链式思维（CoT）等方法，提升模型处理复杂任务和全模态交互的能力。 4.高效模型架构设计：设计高效的大模型架构以提升训练和推理效率。探索 MoE（混合专家）、稀疏注意力、线性注意力等高效模型结构，以及模型编辑与合并等技术，研发能够显著提升推理速度和资源利用率的新型模型架构。 5.推理效率与性能优化：推动算法与系统的协同优化，实现模型性能与效率的最大化平衡。基于对硬件计算潜力的深度挖掘，开发高效的模型推理方案和算法，包括模型压缩、剪枝、量化、稀疏化等，降低模型应用部署成本。后训练方向： 1.后训练数据与流程建设，从指令数据生产、合成、进化、配比等方面提升数据质量，优化指令微调、强化学习、奖励模型等训练pipeline，提升模型综合能力； 2.后训练关键能力建设，包括但不限于优化模型创意生成、多语言、逻辑推理、复杂指令遵循、代码生成、工具调用等能力，提升模型可控性和安全性，拓展模型能力边界； 3.面向准确性、多模信息、最优路径等方向，探索奖励模型的新范式，构建统一模型学习环境，实现模型的价值对齐和能力对齐； 4.面向推理规划能力、多智能体系统、模型自进化等方向，探索下一代强化学习算法，持续提升大模型的智能水平和在真实复杂场景效果； 5.前沿探索：动态推理计算优化（Test-time Compute Optimization）、多智能体协同进化架构、大规模强化学习系统优化等。

更新于 2025-05-23北京|上海

多模态训推引擎研发工程师

校招J1020

1、基础设施与模型融合研究：紧密关注新一代基础设施的迭代，如高性能的新一代网卡、超节点服务器以及先进的集群拓扑结构等，结合多模态任务下多模型（涵盖visual tokenizer、diffusion、LLM 等）长 pipeline 特点，探索更先进、更高效的多模态模型架构以及训推解决方案； 2、分布式系统优化：运用分布式系统迭代、系统算法codesign等手段，针对模型规模、集群规模、context length持续scaling up过程中出现的诸多挑战展开深入研究。具体包括但不限于解决训练过程中的MFU与稳定性问题，优化推理环节的时延与吞吐，以及应对超长序列带来的训推显存压力等难题； 3、卓越系统打造：通过持续的创新与优化实践，致力于打造业界卓越的分布式训推系统，推动相关技术在实际应用场景中的高效落地，提升整体系统性能与竞争力，为kling等核心模型发展提供坚实支撑。

更新于 2025-08-08上海|北京

【快Star-X】多模态训推引擎研发工程师

校招J1020

1、基础设施与模型融合研究：紧密关注新一代基础设施的迭代，如高性能的新一代网卡、超节点服务器以及先进的集群拓扑结构等，结合多模态任务下多模型（涵盖 visual tokenizer、diffusion、LLM 等）长 pipeline 特点，探索更先进、高效的多模态模型架构以及训推解决方案； 2、分布式系统优化：运用分布式系统迭代、系统算法 codesign 等手段，针对模型规模、集群规模、context length 持续 scaling up 过程中出现的诸多挑战展开深入研究。具体包括但不限于解决训练过程中的 MFU 与稳定性问题，优化推理环节的时延与吞吐，以及应对超长序列带来的训推显存压力等难题； 3、卓越系统打造：通过持续的创新与优化实践，致力于打造业界卓越的分布式训推系统，推动相关技术在实际应用场景中的高效落地，提升整体系统性能与竞争力，为 kling 等核心模型发展提供坚实支撑。

更新于 2025-06-26上海|北京