腾讯音视频通话大模型评测工程师

社招全职3年以上CSIG技术2025-06-04地点：北京状态：招聘

扫码手机上打开

任职要求

1.计算机或者相关专业硕士或者以上学历，三年以上工作经验，熟悉LLM和音视频端到端大模型基本原理，有大模型相关背景；
2.有大模型评测集设计经验，有良好的沟通能力和团队协作能力；
3.熟悉AI产品典型交互模式（对话式/指令…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.负责AI产品在音视频通话场景下，大模型对话效果的评测体系构建，包括评测标准和验证机制建设，对齐评测标准和用户主观体感；
2.负责开源音视频评测集的调研、特定任务下内部评测集的设计和迭代；
3.探索验证机制的优化和提效，主观客观评估方案持续迭代；
4.内外部的音视频通话大模型产品对比评测能力的建设和维护。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大模型+

Android+

还有更多 •••

登录查看完整学习资料

相关职位

音视频通话大模型评测工程师

社招3年以上CSIG技术

1.负责AI产品在音视频通话场景下，大模型对话效果的评测体系构建，包括评测标准和验证机制建设，对齐评测标准和用户主观体感； 2.负责开源音视频评测集的调研、特定任务下内部评测集的设计和迭代； 3.探索验证机制的优化和提效，主观客观评估方案持续迭代； 4.内外部的音视频通话大模型产品对比评测能力的建设和维护。

更新于 2025-06-04深圳

多模态大模型负责人

社招5年以上

1. 负责Soul社交垂域多模态基座大模型的研发和应用支撑，作为基座支持包括但不限于多模态理解、多模态生成、多模态对话、实时双工音视频通话、多Agent对话、aigc内容供给、大模型推荐、内容理解、大模型安全等的技术探索 2. 负责Soul个性化大模型的研发，做到面向用户偏好建模的千人千面大模型，从而更适配Soul AI业务落地场景，提升业务落地效率 3. 协助建设AI中台+数据体系，沉淀技术和数据资产，赋能公司AI相关业务

更新于 2024-11-12上海|北京

服务端研发工程师（音视频方向）-豆包

社招5年以上A96187

1、负责豆包实时通话、Ola Friend耳机等产品后端服务的设计开发和优化，支持基于RTC/WebSocket的对话式AI业务； 2、负责系统稳定性建设和产品体验提升，包括系统并发能力提升、音质画质优化、全链路延迟优化、程序性能优化等。

更新于 2025-05-20北京

多模态大模型应用算法实习生-Seed

实习A246011A

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、多模态大模型Post-Training全链路优化：参与SFT、RL、Agent训练等核心算法的调优与创新，围绕搜索、教育、医疗等业务场景进行定向能力打磨，提升模型在真实任务中的效果与稳定性； 2、视频通话AI体验与多模态融合：参与视频通话基础AI能力的优化，包括视觉理解、长多轮对话、逻辑推理、联网搜索等；同时参与创新特性研发，如视频Memory、智能主动响应、音视频双工等，并推动多模态推理、智能体等技术在产品中的落地； 3、可穿戴硬件端AI能力与端云协同：协同优化端侧执行链路与服务端多模态模型的适配效果，打通端云协同流程，提升视频通话及硬件联动场景下的端到端体验； 4、手机助手基础体验与智能特性研发：参与手机助手的视觉理解、工具调用、跨应用任务规划等基础能力优化；同时参与手机Memory、GUI Agent、Intent理解等新特性的研究与落地，提升整体交互体验。

更新于 2026-01-26北京