哔哩哔哩算法实习生(视频生成)【2027届】
实习兼职技术类地点:上海状态:招聘
任职要求
1. 掌握机器学习、深度学习核心基础知识,熟悉常见的神经网络结构(如Transformer、扩散模型等); 2. 了解视频生成基座模型的基本研发流程,了解针对视频生成的数据清洗链路和构建; 3. 在计算机视觉一个或多个领域的研究和实践经验,包括但不限于以下方向: a)图片/视频生成扩散模型; b)视觉自监督学习/表…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 开展视频生成相关技术调研,跟踪行业前沿技术(如扩散模型、生成式AI在视频领域的应用); 2. 进行视频生成基座模型研发迭代,参与模型训练、调参、性能优化等核心环节。配合完成模型训练数据的构建和生成,确保训练数据的准确性和有效性; 3. 整理研发过程中的技术文档、实验记录,确保文档的完整性和规范性; 4. 沉淀技术文档,投稿领域的顶会顶刊。
包括英文材料
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
还有更多 •••
相关职位
实习技术类
1.探索视频多模态大模型的前沿技术,负责数据建设、模型训练与评测框架搭建。 2.深入研究并实践视频多模态大模型的全套训练流程,包括pretraining、mid-training、SFT、RL、on-policy distillation等。 3.跟踪并复现主流的开源视频多模态模型,进行前沿论文的调研、复现与创新。 4.协助优化视频内容理解、dense video caption、视频生成/编辑中的用户意图理解等相关任务上的模型效果,持续提高算法的性能与效率。
更新于 2026-05-13上海
实习MEG
-协助团队进行视频生成技术研发和业务落地探索 -参与项目的算法效果验证和优化,确保算法的效率和准确性 -协助进行文献调研,总结最新的技术趋势和研究进展 -参与团队内部的技术交流和分享会议
更新于 2025-08-13北京
实习MEG
1、协助团队进行视频生成技术研发和业务落地探索 2、参与项目的算法效果验证和优化,确保算法的效率和准确性 3、协助进行文献调研,总结最新的技术趋势和研究进展 4、参与团队内部的技术交流和分享会议
更新于 2026-03-25北京