夸克千问C端事业群-图像生成&编辑算法专家-杭州
社招全职1年以上技术类-算法地点:北京 | 杭州状态:招聘
任职要求
1.1年以上计算机视觉的实践经验,有以下研究方向优先: -多模态生成和理解:如文本/图像/视频/3D生成和编辑,以及其他相关的多模态经验; -熟悉前言多模态大模型技术,包括但不限于LLaVA、QwenVL、InternVL等; -熟练掌握SFT和RL训练策略,熟悉ms-swift、LLaMA-Factory等代码框架; -熟…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、利用SD、VLLM、LLM等AIGC相关技术参与图文生成、视频生成、智能化编辑,包括但不限于海报生成、动态海报、数字人等; 2、负责AI算法的架构设计与优化,针对不同业务场景提出通用性或定制化的解决方案; 3、结合实际业务需求,探索和解决新问题,并通过创新和改进推动团队整体能力提升。
包括英文材料
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
Swift+
[英文] A Swift Tour
https://docs.swift.org/swift-book/documentation/the-swift-programming-language/guidedtour/
Explore the features and syntax of Swift.
https://www.hackingwithswift.com/learn
Free Swift and iOS tutorials
https://www.youtube.com/watch?v=8Xg7E9shq0U
Learn the Swift programming language in this full tutorial for beginners.
LLaMA-Factory+
https://llamafactory.readthedocs.io/en/latest/
LLaMA Factory is an easy-to-use and efficient platform for training and fine-tuning large language models.
还有更多 •••
相关职位
社招2年以上运营类-内容运营
1、搭建图片数据策略流程和产出数据策略方案,搭建图片数据建设Pipeline 2、系统化生产单图生图、图生视频等数据,通过多种途径生产满足要求的训练数据。 3、构建自动化+人工的数据采集链路,构建多模态数据标注体系 4、建设模型迭代评测的标准和链路,辅助算法进行模型迭代
更新于 2025-12-29杭州
社招5年以上技术类-开发
1. 负责夸克智能视觉相关业务服务,负责深度学习算法服务的流程设计及研发工作 2. 深入理解业务(扫描滤镜、文字服务、图像编辑、图像生成等),和算法紧密合作,对已有服务进行全链路的改进和优化 3. 技术预研和技术难点攻关,引入业界新技术和系统化方法,提升服务迭代效率,保障服务的稳定性、高性能和可扩展性
更新于 2025-12-25杭州
社招3年以上产品类-平台型
1、负责多模态生成模型建设的长期策略和效果优化,搭建图像/视频生成模型的效果评估体系,输出评测需求,驱动数据生产和模型训练,打造行业有竞争力、且有特色的模型,并供给实现更大的业务价值。 2、有强业务视角和高内容Sense,深入调研和了解对模型的实际需求,针对不同场景,提出并推动模型优化、效果提升等改进策略,将模型能力与业务发展深度融合。 3、跟踪最前沿的技术和产品形态,判断行业发展趋势,评估潜在价值和应用可行性。
更新于 2025-12-29北京