logo of tencent

腾讯音视频通话大模型评测工程师

社招全职3年以上CSIG技术地点:北京状态:招聘

任职要求


1.计算机或者相关专业硕士或者以上学历,三年以上工作经验,熟悉LLM和音视频端到端大模型基本原理,有大模型相关背景;
2.有大模型评测集设计经验,有良好的沟通能力和团队协作能力;
3.熟悉AI产品典型交互模式(对话式/指令…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责AI产品在音视频通话场景下,大模型对话效果的评测体系构建,包括评测标准和验证机制建设,对齐评测标准和用户主观体感;
2.负责开源音视频评测集的调研、特定任务下内部评测集的设计和迭代;
3.探索验证机制的优化和提效,主观客观评估方案持续迭代;
4.内外部的音视频通话大模型产品对比评测能力的建设和维护。
包括英文材料
学历+
大模型+
Android+
还有更多 •••
相关职位

logo of tencent
社招3年以上CSIG技术

1.负责AI产品在音视频通话场景下,大模型对话效果的评测体系构建,包括评测标准和验证机制建设,对齐评测标准和用户主观体感; 2.负责开源音视频评测集的调研、特定任务下内部评测集的设计和迭代; 3.探索验证机制的优化和提效,主观客观评估方案持续迭代; 4.内外部的音视频通话大模型产品对比评测能力的建设和维护。

更新于 2025-06-04深圳
logo of soul
社招5年以上

1. 负责Soul社交垂域多模态基座大模型的研发和应用支撑,作为基座支持包括但不限于 多模态理解、多模态生成、多模态对话、实时双工音视频通话、多Agent对话、aigc内容供给、大模型推荐、内容理解、大模型安全等的技术探索 2. 负责Soul个性化大模型的研发,做到面向用户偏好建模的千人千面大模型,从而更适配Soul AI业务落地场景,提升业务落地效率 3. 协助建设AI中台+数据体系,沉淀技术和数据资产,赋能公司AI相关业务

更新于 2024-11-12上海|北京
logo of bytedance
社招5年以上A96187

1、负责豆包实时通话、Ola Friend耳机等产品后端服务的设计开发和优化,支持基于RTC/WebSocket的对话式AI业务; 2、负责系统稳定性建设和产品体验提升,包括系统并发能力提升、音质画质优化、全链路延迟优化、程序性能优化等。

更新于 2025-05-20北京
logo of bytedance
实习A246011A

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、多模态大模型Post-Training全链路优化:参与SFT、RL、Agent训练等核心算法的调优与创新,围绕搜索、教育、医疗等业务场景进行定向能力打磨,提升模型在真实任务中的效果与稳定性; 2、视频通话AI体验与多模态融合:参与视频通话基础AI能力的优化,包括视觉理解、长多轮对话、逻辑推理、联网搜索等;同时参与创新特性研发,如视频Memory、智能主动响应、音视频双工等,并推动多模态推理、智能体等技术在产品中的落地; 3、可穿戴硬件端AI能力与端云协同:协同优化端侧执行链路与服务端多模态模型的适配效果,打通端云协同流程,提升视频通话及硬件联动场景下的端到端体验; 4、手机助手基础体验与智能特性研发:参与手机助手的视觉理解、工具调用、跨应用任务规划等基础能力优化;同时参与手机Memory、GUI Agent、Intent理解等新特性的研究与落地,提升整体交互体验。

更新于 2026-01-26北京