夸克智能信息-图像生成&编辑算法专家-杭州
社招全职1年以上技术类-算法地点:北京 | 杭州状态:招聘
任职要求
1.1年以上计算机视觉的实践经验,有以下研究方向优先: -多模态生成和理解:如文本/图像/视频/3D生成和编辑,以及其他相关的多模态经验; -熟悉前言多模态大模型技术,包括但不限于LLaVA、QwenVL、InternVL等; -熟练掌握SFT和RL训练策略,熟悉ms-swift、LLaMA-Factory等代码框架; -熟…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、利用SD、VLLM、LLM等AIGC相关技术参与图文生成、视频生成、智能化编辑,包括但不限于海报生成、动态海报、数字人等; 2、负责AI算法的架构设计与优化,针对不同业务场景提出通用性或定制化的解决方案; 3、结合实际业务需求,探索和解决新问题,并通过创新和改进推动团队整体能力提升。
包括英文材料
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
Swift+
[英文] A Swift Tour
https://docs.swift.org/swift-book/documentation/the-swift-programming-language/guidedtour/
Explore the features and syntax of Swift.
https://www.hackingwithswift.com/learn
Free Swift and iOS tutorials
https://www.youtube.com/watch?v=8Xg7E9shq0U
Learn the Swift programming language in this full tutorial for beginners.
LLaMA-Factory+
https://llamafactory.readthedocs.io/en/latest/
LLaMA Factory is an easy-to-use and efficient platform for training and fine-tuning large language models.
还有更多 •••
相关职位
社招1年以上运营-产品运营
1、深度参与大模型前沿方向的数据工作,重点负责文生图模型的数据寻源、数据标注与管理,模型效果评估; 2、设计各技术方案下阶段的数据方案与策略,建设文生图大模型的数据生产和质量提升流程,管理高效高质的数据生产pipeline,建设起行业领先的数据生产标准; 3、建立科学的模型效果评估方案与策略,给出模型优化建议,助力模型效果达到业内一流; 4、深入理解业务场景、市场动态和大模型技术趋势,牵引数据团队和算法团队的深度融合。
更新于 2025-09-26北京|杭州|上海
社招1年以上技术类-算法
1.负责基于开源或内部基础大模型,进行文生图、文生视频、图像/视频编辑等AIGC技术能力的精调、优化,持续提升用户体验。 2.深入探索Agent在智能创作等业务场景的应用,负责构建大规模Multi-Agent系统,并对视觉语言模型(VLM)进行高效的定制与微调,以驱动业务创新。 3.进行前沿AI应用方向的技术预研,跟踪并评估最新研究成果,主动探索其在业务场景中的可行性,并负责将有潜力的技术迅速落地为核心业务能力,驱动产品创新与运营效率提升。
更新于 2025-11-28北京|杭州
社招2年以上技术类-前端
1、负责夸克PC浏览器图像&视频AIGC前端业务开发,包括但不限于图像/视频生成、编辑以及AI工具等前端业务; 2、负责夸克浏览器前端架构设计工作,推进整体方案拉通及实现落地,并且在理解产品业务的基础上,通过技术手段提升产品的用户体验; 3、主导或参与前端/客户端技术优化和难点攻关,包括但不限于复杂编辑器、工作流、页面性能优化、用户关键漏斗、稳定性建设等; 4、关注前端前沿技术研究,通过新技术服务团队和业务;
更新于 2025-10-29广州