字节跳动智能视频云国际产品实习生-音视频技术

实习兼职A2474722026-01-13地点：深圳状态：招聘

扫码手机上打开

任职要求

1、2027届本科及以上学历在读，计算机科学、数字媒体技术、人工智能、软件工程、产品设计等相关专业优先；
2、有互联网及音视频产品、运营实习经验优先，对音视频、大语言模型、计算机视觉等前沿技术及其应用有强烈兴趣和一定的认知；
3、具备良好…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。
团队介绍：视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台，支持了字节全系产品，如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展，同时将业务发展过程中沉淀下来的技术能力和工具，通过火山引擎对外输出，面向各行各业用户提供视频云产品和服务，愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案，助力业务伙伴降本提效实现持续增长。

1、负责音视频相关的产品功能及体验的设计和优化；
2、参与市场趋势、用户需求、音视频及AI技术发展的调研工作，收集和整理相关信息，挖掘产品优化点，为产品决策规划提供支持；
3、完成需求分析、产品设计工作，确保功能与体验符合市场需求，并具有竞争力的领先性；
4、协助制定项目计划，跟踪项目进度，参与跨部门沟通协调工作，协助推进项目高效迭代。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

OpenCV+

相关职位

智能视频云国际产品运营实习生-音视频技术

实习A184267

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台，支持了字节全系产品，如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展，同时将业务发展过程中沉淀下来的技术能力和工具，通过火山引擎对外输出，面向各行各业用户提供视频云产品和服务，愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案，助力业务伙伴降本提效实现持续增长。 1、经营管理与专项驱动：参与业务商业目标的拆解与过程管理；通过专项机制识别并解决经营风险，确保业务指标按期达成； 2、数据基建与分析：迭代业务经营分析体系，完善数据基建；通过数据洞察业务健康度，为资源规划与关键经营决策提供支撑； 3、商业化流程支持：优化To B商业化落地全流程，协助制定重点产品的Go-To-Market策略，协同销售与产品研发团队提升流转效率； 4、运营驱动增长：利用数字化手段对从线索到转化的全链路进行精细化管理，提升转化效率，协助挖掘新的业务增长空间。

更新于 2026-01-13深圳

ATH-MaaS-AI Agent全栈工程师-视频智能评测-广州

社招3年以上云智能集团

岗位定位你将作为AI视频生产产品智能评测体系的核心建造者。我们既评测视频生成、图片生成等多模态模型的能力边界，也评测产品在真实业务场景下的端到端产出质量——从模型选型到生产链路放行，每一环都需要可量化、可解释、可复现的评判依据。你要建造的智能评测体系，能自主理解评测目标、调度多模态模型诊断、给出可解释判分、驱动生产链路的重试与放行；同时与生成大模型形成双向飞轮——评测产出反哺大模型微调与偏好对齐，大模型跃迁驱动视频生成产品及评测能力演进。核心职责 1. 评测Agent架构设计 ● 主导设计"视频评测Agent"的能力边界、工具集与决策协议，使其具备任务规划、模型选型、自动重试、异常归因、人工介入点设计等自主能力。 ● 与视频生产链路上下游的Agent打通，将评测Agent作为生产链路中的智能质检与自纠错节点，形成"生成→质检→修复→放行"的闭环。 ● 设计评测Agent的可观测体系，让每一次决策都可追溯、可复盘、可改进。 2. 跨模型Benchmark体系建设 ● 构建覆盖视频生成、图片生成等多模态生成模型的Benchmark评测基准，定义能力地图与质量基线。 ● 建立模型选型、版本对比、回归验证的数据化决策链路，让模型选型从经验驱动走向证据驱动。 ● 攻关"跨模型可比性"工程难题：评测样本设计、风格归一化、置信区间标注、人工抽样补评机制。 3. 评测Prompt工程与VLM调优 ● 系统性构建面向视频评测各环节的Prompt工程体系：分层结构化、多模态对齐、领域知识注入、置信度自评等精细化设计。 ● 建立Prompt版本管理、A/B评测、自动优化机制，让VLM评分在跨模型对比语境下持续逼近人工裁判的一致性。 ● 探索结合人类反馈与Benchmark交叉验证的评测Prompt偏好对齐，让智能评测"打分像一个有审美的人"。 4. 评测与生成大模型的协同进化 ● 设计评测产物的结构化沉淀方案，把每一次评测都转化为可检索、可复用、可再加工的数据资产，作为视频生成大模型微调（SFT/DPO）与偏好对齐的高质量信号源。 ● 与算法侧协同建立"评测→反哺→生成→再评测"的双向闭环：评测识别出的Bad Case与Hard Case定向输入生成模型的迭代训练，生成模型每一次能力跃迁又驱动评测维度的扩展、Benchmark的扩容与评分基线的重标定。 ● 建设case库管理与质量回归机制，保障评测体系自身能跟上生成模型的迭代节奏。 5. 评测全栈工程能力 ● 端到端打通"任务提交→视频处理（抽帧/转码/格式适配）→多模态推理→评分聚合→报告生成→数据可视化"的自动化流水线。 ● 独立完成评测控制台、Benchmark对比看板、case库管理等前端功能，保障评测系统具备可用性与可维护性。 ● 保障长链路评测任务的稳定性：断点续传、局部重试、并发调度、容错降级等核心工程难题。

更新于 2026-07-13北京|杭州|广州

ATH-MaaS-AI Agent全栈工程师-视频智能创作-杭州/北京/广州

社招3年以上云智能集团

岗位定位我们正在把 Studio 从视频创作"工具"进化成"AI 创作平台"。这里不止一种创作方式，而是覆盖多种创作模式的完整创作体系。你将作为 Studio 创作体系的核心研发，负责把创作、编辑、智能生成、3D 可视化、多人协作等能力做成稳定、流畅、智能的产品，并能扎进不同创作模式持续做深、打磨。每一种创作模式都在走向 Agentic 化——每一次用户操作背后，都有 AI 在参与理解、生成与迭代。核心职责 1. 创作模式能力建设 ● 负责 Studio 多种创作模式的核心能力研发与工程建设，扎进各创作模式持续做深、做好，打磨极致的用户创作体验，构建产品的核心竞争力。 ● 覆盖从故事板、自由画布到 Agent创作、智能剪辑等多种创作模式的建设，能根据方向重点灵活切入，把不同创作模式都做到好用、易用。 2. 让各创作模式更 Agentic ● 推动 AI Agent 深度融入每一种创作模式，让创作从"人操作工具"走向"人与 Agent 协同创作"，把各创作模式整体带向更 Agentic 的形态。 ● 设计 Agent 参与创作的交互方式，让 AI 的理解、生成与调整过程对用户清晰可见、可控可干预，把不确定的生成过程做成顺畅、可信赖的创作体验。 3. 图形渲染、音视频与 3D 能力建设 ● 基于 Canvas / WebGL / WebGPU / OffscreenCanvas / WebAssembly / WebCodecs 等技术，建设高性能渲染与实时预览能力。 ● 负责音视频基础能力，包括播放、剪辑、转码、封装格式、字幕、音轨、流媒体协议、解码与处理链路。 ● 参与 3D 资产预览、空间编辑、镜头控制、实时渲染等方向的能力建设，探索 Mesh / 点云 / NeRF / 3D Gaussian Splatting 等新型 3D 表达在创作场景的落地。 4. 多端适配与多站点 ● 支持浏览器端、桌面端（Electron / Tauri）等多种运行环境，保障不同设备、分辨率、浏览器和网络条件下的一致体验。 ● 参与国际化、多语言等基础能力建设，支撑国内站 / 国际站 / 海外独立站等多站点的统一技术架构。 5. 性能与体验保障 ● 从用户体验出发，持续提升各终端的性能与创作流畅度，优化加载速度、交互响应、渲染稳定性与弱网体验，让复杂创作也能顺滑好用。 ● 建设产品质量与稳定性保障，覆盖监控、异常定位、自动化测试等能力，保障产品长期稳定迭代。

更新于 2026-07-13北京|杭州|广州

ATH事业群-AI Agent全栈工程师-视频智能创作-杭州/北京/广州

社招3年以上云智能集团

更新于 2026-07-21北京|杭州|广州