腾讯混元多模态算法应用工程师

社招全职TEG技术2025-05-30地点：深圳状态：招聘

扫码手机上打开

任职要求

1.熟悉掌握MLLM、RLHF、Diffusion等相关技术；
2.熟练掌握python、C++等至少一门编程语言，掌握tf、pytorch等至少一种深度学习框架；…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.多模态驱动引擎开发,通过对文本/语音/视觉等信息，构建虚拟人表情、动作的驱动大模型；
2.设计多模态条件生成框架，实现语音、表情、镜头、肢体动作的联合优化；
3.开发多模态特征同步技术：语音-表情时序对齐、文本语义-镜头运动关联建模。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Python+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

混元数据算法工程师（北京）

社招2年以上AI技术

1.数据特征算法：负责海量文本&多模态数据（图像，视频，音频，3D）的内容理解（如分类标签体系、embedding表征、Caption生成等），质量检测（低质识别检测、优质美学评价等），去重/聚类分析，数据合成等算法； 2.数据pipeline建设：负责数据采集、筛选清洗、标注与质量评估pipeline的建设。与模型业务团队紧密配合，充分分析挖掘数据资源，建立自动化数据处理流程与机制，支持模型持续迭代； 3.数据实验分析：对模型训练数据进行详细分析，建立科学数据实验机制，识别样本不足、质量问题、配比不均衡等潜在问题，驱动数据优化提升数据覆盖、质量、多样性需求，最终带来大模型生成效果的持续提升。

更新于 2025-10-15深圳

算法工程师/研究员(J65868)

社招0-3年XYZ

各类大模型算法岗位：包括不限于 ✓大模型应用（Rag、Agent的研究等） ✓大模型技术研究 (指令微调、强化学习、推理等) ✓多模态理解与生成研究（文本、图像、视频、音频等）

更新于 2025-02-18北京

混元-太极大模型平台产品经理

社招3-5年TEG产品

1.业务需求洞察与转化：； 2.深入对接业务线（如算法团队、司内业务部门），理解大模型在应用场景中的业务痛点，输出产品需求文档并推动优先级共识； 3.深入分析行业痛点（如客服、内容生成、3D建模等），输出定制化解决方案，推动产品适配性优化； 4.平台能力构建与体验提升：； 5.主导设计大模型全生命周期管理功能，涵盖数据标注、模型训练、效果评测、部优化等环节的核心模块，构建大模型全生命周期管理闭环，重点突破高并发训练、分布式推理、多模态模型兼容等能力； 6.设计面向开发者的低门槛工具链（如可视化Prompt编排、一键式模型微调），提升平台DAU/留存率； 7.端到端功能交付与落地； 8.独立负责功能从PRD设计到上线的全流程管理，协调研发、测试、算法团队资源，确保技术方案与业务目标的强对齐； 9.建立关键指标（如模型迭代周期、资源利用率、用户满意度），通过数据验证功能价值； 10.主导交付后的用户培训、反馈收集及问题闭环； 11.跨团队协同与项目管理； 12.推动业务方、工程团队、算法团队三方协作； 13.推动太极在腾讯生态产品（如微信、腾讯文档、腾讯会议）中的深度合作与能力共建。

更新于 2025-05-30深圳

混元语音与音频理解方向研究员（语音生成方向）（北京/深圳/上海）

社招2年以上混元助手-其他技

1.跟踪业界最新的语音生成算法研究，探索下一代语音、音频生成新范式，拓展语音生成边界能力； 2.探索多模态语音大模型的前沿技术，结合文本、语音、视觉等技术提升语音交互体验； 3.负责语音大模型的技术研发工作，推动模型性能提升与创新应用。

更新于 2025-11-17北京