vivoAIGC/多模态算法工程师-实习
实习兼职地点:杭州状态:招聘
任职要求
1、硕士及以上学历,计算机、人工智能相关专业在校生; 2、有扎实的数学功底,熟练掌握矩阵论、随机过程以及各类生成式AI模型理论基础,精通包括T2I、T2V、I2I、I2V、V2V等多模态大模型算法,并熟练掌握这些技术在计算机视觉/神经渲染领域的应用; 3、熟练掌握Python/C++语言,熟练掌握深度学习、生成式AI、渲染原理以及Pytorch模型训练框架,具备优秀的数学、计算机基础; 4、实习时间六个月及以上的优先。
工作职责
1、跟进最新的文生图、文生视频、编辑大模型、Agent等方向,输出论文调研报告; 2、参与AIGC(例如文生图、文生视频、图像编辑、视频编辑等)相关大模型训练、算法研发等工作; 3、不断优化现有算法,提高效果、性能和稳定性,确保技术在各种设备和平台上的高效运行,发布研究成果,积极参与行业会议,与学术界和工业界建立并维护良好的合作与交流关系; 4、负责各类影像AIGC前沿研究与算法应用,打造极致且有趣的影像产品,持续迭代优化核心算法模型及整体技术框架,支撑前沿技术产业落地。
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
相关职位
实习
1.前沿算法研发 •主导计算机视觉与AIGC核心算法研发(检测/分割/生成/多模态等),推动超分、修复、美化等技术在业务场景落地,实现效果与效率双优化。 •探索Stable Diffusion等生成式模型的应用创新,结合业务需求优化图像生成、智能编辑(如文本驱动编辑、语义修复)等关键技术。 2.工程化落地 •完成算法从原型到产品的全链路开发,解决模型压缩(量化/剪枝)、推理加速(TensorRT/MNN部署)、跨平台适配等工程挑战。 •构建高精度、低延迟的CV pipeline,覆盖图像矫正、去噪、OCR等实际需求。 3.技术前瞻性研究 •跟踪CVPR/ICML等顶会技术动态,针对性研发Diffusion Models、Vision Transformer等前沿模型,建立技术壁垒。
更新于 2025-08-21
实习
1、负责vivo影像“AI视效”及各类影像创作类生成式影像前沿研究与算法应用,打造极致且有趣的影像产品,持续迭代优化核心算法模型及整体技术框架,支撑前沿技术产业落地; 2、与产品团队紧密合作,将最新的生成式AI技术融入公司产品和服务中,显著提升用户体验和满意度; 3、不断优化现有算法,提高效果、性能和稳定性,确保技术在各种设备和平台上的高效运行,发布研究成果,积极参与行业会议,与学术界和工业界建立并维护良好的合作与交流关系。
更新于 2025-02-27
实习信息技术类
岗位职责: 1.在芯片设计、验证、制造、测试环节中定义 AI 算法能解决的业务边界,为业务赋能 ; 2.负责CV/多模态/AIGC相关模型优化和迭代,包含图像理解、生成等前沿技术; 3.评估先进的AI模型,包括模型的训练,技术指标的评测和算法的调优工作; 4.跟踪算法发展的新趋势和新技术,并能不断应用于算法开发过程中,优化算法效果。
更新于 2025-10-17