字节跳动视频处理和增强算法实习生-视频与边缘-筋斗云人才计划

实习兼职A861122025-03-06地点：上海状态：招聘

扫码手机上打开

任职要求

1、2026届及之后毕业，博士在读，人工智能、计算机、数学等相关专业优先；
2、精通常见的图像、视频处理算法，掌握常见视觉算法，如分类、检测、分割等；
3、具有扎实的编程功底，良好的设计能力和编程习惯；
4、熟悉Diffusion、LLM等大模型相关算法和技术，熟悉大模型…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台，支持了字节全系产品的点播、直播、实时通信、图片等多媒体业务发展，同时将业务发展过程中沉淀下来的技术能力和工具，通过火山引擎对外输出，面向各行各业用户提供视频云产品和服务，愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案，助力业务伙伴降本提效实现持续增长。

课题介绍：随着4K、HDR等技术成为主流标准，消费者对视频画质的要求日益提升。然而，视频在拍摄、传输和压缩过程中，画质往往受损，影响观看体验。多模态大模型的出现为视频分析、理解、画质评估、及画质增强提供了新的可能性，因此希望能够探索多模态大模型在多媒体场景的应用可行性，发掘基座大模型在大规模业务视频内容应用的潜力，建立业内领先的多媒体场景的多模态大模型解决方案。
画质分析以及人眼感知：利用多模态大模型，深入分析视频内容及画质退化问题，研究人眼对色彩、帧率、清晰度等画质维度的感知能力，从而使得画质评估更为准确，画质增强对退化的处理更为智能，增强的结果更符合人眼主观。生成式画质增强：利用生成式大模型的先验信息，大幅提升画质增强的效果天花板，并且解决生成伪像、生成保真度、生成稳定性等当前生成式算法存在的问题。视频时域任务：研究画质理解和增强在视频上的拓展，包括时域信息表征建模，时域退化理解，时域画质增强连续性，时域推理加速等。用户视角的验证：在大规模用户环境中，从用户的实际观看体验出发，验证画质增强算法的有效性和用户满意度。

1、支持研发基于大模型的多媒体算法，包括但是不限于视频理解，质量评价、视频处理和增强以及视频压缩；
2、支持多模态大模型相关算法的性能优化以及加速；
3、支持多模态大模型的算法在多媒体业务中落地，在图文、点播、直播等业务中发掘应用场景；
4、支持多模态大模型相关的前沿学术研究，在国际顶级会议与期刊中发表成果。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

编程规范+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

模型技术-算法工程师/专家-AI技术部

社招3年以上大模型

【职位描述】 1、负责小红书搜广推多场景排序模型优化，提升时长、互动、留存等核心指标； 2、分析海量用户行为数据，挖掘用户兴趣，优化排序模型； 3、通过超大规模机器学习模型和系统，使用先进的排序算法优化推荐效果。

上海|北京

广告引擎工程师-召回引擎TechLead

社招D10191

1、负责广告统一召回引擎架构演进，支撑百亿流量亿级物料，保障系统的高可用、高性能； 2、负责支撑短视频广告、直播广告等多种业务高速迭代，提升系统的研发效率和资源效率； 3、负责指导团队成员工作，带领初中级工程师完成项目目标。

更新于 2025-04-03北京

检索引擎研发工程师

社招D2867

1、参与快手搜索引擎研发工作，服务数亿海量用户； 2、参与搜索引擎核心架构设计与开发，涵盖的方向包括：（1）负责前沿ANN算法与引擎的研发，实现大容量、高吞吐、高精度、低成本的向量检索引擎，持续构建业界领先的技术能力；（2）负责自研百亿规模的视频、网页，商品等多类资源的检索系统研发，包括且不限于高效的建库系统，高性能的检索引擎；（3）面向搜广推业务，建设统一的检索平台，有机融合ANN，倒排等多类检索引擎，提供极致效率的建库，服务，运维体验。 3、探索AI检索新技术、新思想的应用和落地。

更新于 2025-04-03北京

搜索架构业务引擎架构师

社招5年以上D2867

负责快手搜索系统的业务引擎架构方向，面向短视频、电商、本地、搜索增长等多业务场景构建大规模业务引擎，支持算法业务的高效迭代。具体职责包括： 1、构建面向各个搜索业务的全链路业务引擎模块，包括策略服务、统一特征服务，排序服务等，支持算法和产运的迭代需求； 2、构建面向在线引擎的全图化引擎架构，提升全链路算法迭代效率和系统优化效率； 3、构建在线混部，动态算力等技术在高可用基础上提升在线引擎算力供给； 4、探索AI智能搜索、AI对话等新业务，探索大模型在搜索的应用落地。

更新于 2025-04-03北京