logo of quark

夸克智能信息-图像生成&编辑算法专家-杭州

社招全职1年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1.1年以上计算机视觉的实践经验,有以下研究方向优先:
-多模态生成和理解:如文本/图像/视频/3D生成和编辑,以及其他相关的多模态经验;
-熟悉前言多模态大模型技术,包括但不限于LLaVA、QwenVL、InternVL等;
-熟练掌握SFT和RL训练策略,熟悉ms-swiftLLaMA-Factory等代码框架;
-熟悉扩散模型,GAN,等用于生成任务的转换器;
-有大规模训练经验、AIGC, LLM和RLHF等;
2、动手能力强, 具有熟练的算法和编程能力,熟悉C/C++Python编程;
3、工作积极主动, 能与团队融洽合作相处,同时能够独立完成研究工作;
4、具有行业影响力高质量论文, 或者顶尖竞赛经历的优先(e.g., ACM)。

工作职责


1、利用SD、VLLM、LLM等AIGC相关技术参与图文生成、视频生成、智能化编辑,包括但不限于海报生成、动态海报、数字人等;
2、负责AI算法的架构设计与优化,针对不同业务场景提出通用性或定制化的解决方案;
3、结合实际业务需求,探索和解决新问题,并通过创新和改进推动团队整体能力提升。
包括英文材料
OpenCV+
大模型+
SFT+
Swift+
LLaMA-Factory+
算法+
C+
C+++
Python+
相关职位

logo of quark
社招1年以上运营-产品运营

1、深度参与大模型前沿方向的数据工作,重点负责文生图模型的数据寻源、数据标注与管理,模型效果评估; 2、设计各技术方案下阶段的数据方案与策略,建设文生图大模型的数据生产和质量提升流程,管理高效高质的数据生产pipeline,建设起行业领先的数据生产标准; 3、建立科学的模型效果评估方案与策略,给出模型优化建议,助力模型效果达到业内一流; 4、深入理解业务场景、市场动态和大模型技术趋势,牵引数据团队和算法团队的深度融合。

更新于 2025-09-26
logo of quark
社招1年以上技术类-算法

1.负责基于开源或内部基础大模型,进行文生图、文生视频、图像/视频编辑等AIGC技术能力的精调、优化,持续提升用户体验。 2.深入探索Agent在智能创作等业务场景的应用,负责构建大规模Multi-Agent系统,并对视觉语言模型(VLM)进行高效的定制与微调,以驱动业务创新。 3.进行前沿AI应用方向的技术预研,跟踪并评估最新研究成果,主动探索其在业务场景中的可行性,并负责将有潜力的技术迅速落地为核心业务能力,驱动产品创新与运营效率提升。

更新于 2025-09-26
logo of quark
社招5年以上技术类-开发

1. 负责夸克智能视觉相关业务服务,负责深度学习算法服务的流程设计及研发工作 2. 深入理解业务(扫描滤镜、文字服务、图像编辑、图像生成等),和算法紧密合作,对已有服务进行全链路的改进和优化 3. 技术预研和技术难点攻关,引入业界新技术和系统化方法,提升服务迭代效率,保障服务的稳定性、高性能和可扩展性

更新于 2025-10-16
logo of quark
社招3年以上产品类-平台型

1、负责多模态生成模型建设的长期策略和效果优化,搭建图像/视频生成模型的效果评估体系,输出评测需求,驱动数据生产和模型训练,打造行业有竞争力、且有特色的模型,并供给实现更大的业务价值。 2、有强业务视角和高内容Sense,深入调研和了解对模型的实际需求,针对不同场景,提出并推动模型优化、效果提升等改进策略,将模型能力与业务发展深度融合。 3、跟踪最前沿的技术和产品形态,判断行业发展趋势,评估潜在价值和应用可行性。

更新于 2025-09-15