vivo图像AIGC算法工程师/专家
社招全职5-10年研发类地点:上海 | 杭州 | 北京状态:招聘
任职要求
1、熟悉计算机视觉和图像处理基本算法和常用的深度学习算法,并在如下一个或者多个方向有较为深入的研究:文生图大模型、图生图、可控生成技术(controlnet)、图像质量评估、强化学习(RLHF,DPO等)等。 2、具备扎实的编程功底,熟悉Pytorch等主流深度学习框架。 3、具备良好的分析和解决问题的能力,工作积极主动,自驱力强。 4、有文生图大模型或者图像相关的强化学习(RLHF | RLAIF | DPO)经验者优先。 5、有图像质量评估,图像美学评估经验者优先。
工作职责
1、负责基于AIGC技术、多模态技术和强化学习技术打造移动影像下一代计算成像算法架构,对最终效果竞争力负责。 2、负责基于上述架构的核心图像算法的规划、预研与商用落地。负责核心数据资产的构建。 3、跟踪和探索AIGC方向研究前沿,识别学术界/业界优秀研究资源,进行技术合作,实现图像内容生成和增强方向上关键新技术的长期布局和突破。
包括英文材料
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
图像处理+
https://opencv.org/blog/computer-vision-and-image-processing/
This fascinating journey involves two key fields: Computer Vision and Image Processing.
https://www.geeksforgeeks.org/python/image-processing-in-python/
Image processing involves analyzing and modifying digital images using computer algorithms.
https://www.youtube.com/watch?v=kSqxn6zGE0c
In this Introduction to Image Processing with Python, kaggle grandmaster Rob Mulla shows how to work with image data in python!
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
相关职位
社招3年以上研发类
作为核心算法成员,参与AI图像相关算法研发,主要服务于下一代智能相册系统。主要工作包括: 一、图像理解方向: 1)开发基于多模态语义的图像理解算法:人物识别、事件聚类、情绪识别、场景识别等;构建个性化的图像语义标签体系; 2)设计图像内容质量评估模型(重复、模糊、人脸表情等)提升用户体验; 3)探索RAG、多模态图像大模型、文本大模型联动下,agent能力建设和开发。 二、 图像AIGC方向(创作与编辑): 1)研究并实现图像生成与编辑算法,如背景替换、人像美化、风格迁移、文生图,图生图等; 2)参与基于 Diffusion基础模型训练; 3)参与ControlNet、Inpainting、aigc编辑大模型等前沿应用模型的业务开发和落地;
社招5-10年研发类
1、预研和研发具有行业竞争力的人像算法产品,聚焦在AIGC、图像生成、图像超分、图像增强等核心AI算法的技术构建和模型开发; 2、深入研究图像处理算法问题,设计并优化算法以满足产品需求,主导项目上线; 3、跟进业界最新论文和技术,对算法进行产品化预研和技术突破。
更新于 2025-03-21
社招TVVV
1、负责3D能力与图像/视频生成结合的算法研发与优化,跟进三维视觉领域的前沿技术研究; 2、支持字节跳动各个产品线3D相关的业务需求; 3、跟进生成领域的新技术; 4、负责推动3D能力与视频生成相关技术落地于特效、视频编辑、商业化等领域的应用; 5、根据团队的整体目标和规划,进行相关的研发工作。
更新于 2021-12-07