哔哩哔哩算法实习生(视频理解)【2027届】
实习兼职技术类地点:上海状态:招聘
任职要求
1.具备多模态大模型的相关知识,熟悉VLM、video VLM以及长视频内容理解,了解主流的开源模型。
2.熟悉VLM、video VLM的预训练、中训练、后训练等关键流程,具备数据…登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.探索视频多模态大模型的前沿技术,负责数据建设、模型训练与评测框架搭建。 2.深入研究并实践视频多模态大模型的全套训练流程,包括pretraining、mid-training、SFT、RL、on-policy distillation等。 3.跟踪并复现主流的开源视频多模态模型,进行前沿论文的调研、复现与创新。 4.协助优化视频内容理解、dense video caption、视频生成/编辑中的用户意图理解等相关任务上的模型效果,持续提高算法的性能与效率。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
Swift+
[英文] A Swift Tour
https://docs.swift.org/swift-book/documentation/the-swift-programming-language/guidedtour/
Explore the features and syntax of Swift.
https://www.hackingwithswift.com/learn
Free Swift and iOS tutorials
https://www.youtube.com/watch?v=8Xg7E9shq0U
Learn the Swift programming language in this full tutorial for beginners.
相关职位
实习技术类
工作职责: 1.探索视频多模态大模型(video VLM)的前沿技术,负责数据建设、模型训练与评测框架搭建。 2.深入研究并实践视频多模态大模型的全套训练流程,包括预训练、继续预训练以及后训练。 3.跟踪并复现主流的开源视频多模态模型,进行前沿论文的调研、复现与创新。 4.协助优化视频内容理解、dense video caption等相关任务上的模型效果,持续提高算法的性能与效率。
更新于 2025-10-31上海

实习技术
1、探索多模态大模型在视频、图像、文本内容的理解能力,构建场景化模型,提升风险识别准召率; 2、研究UGC文本/图像拒绝理由的可解释性归因方法,推动人机协同审核应用落地; 3、构建大模型在风险防控等场景的垂类内容理解能力,优化模型对抗性及迭代效率; 4、开发视频、图文向量化表征技术,提升跨模态检索能力(如视频索引、图文相似性检索); 5、推动大模型在业务系统中的落地。
北京

实习TA
1.编写shader实现美术相关需求、配合美术组提升现有项目技术在产品中的实际表现; 2.辅助图形程序落地并推进新效果,协助美术组完成新技术的效果验证; 3.根据美术要求进行3dsMax,Maya,Unity及其他生产软件的工具及插件开发; 4.根据项目及美术生产需求编写工具,优化生产管线; 5.分析游戏中的性能问题,测试并给出优化标准和方案。 6.根据项目开发中策划、美术和程序的变化,不断性维护各类工具开发流程、规范,以及引擎工具的使用。
更新于 2025-11-27上海