logo of quark

夸克千问C端事业群-图像生成&编辑算法专家-杭州

社招全职1年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1.1年以上计算机视觉的实践经验,有以下研究方向优先:
-多模态生成和理解:如文本/图像/视频/3D生成和编辑,以及其他相关的多模态经验;
-熟悉前言多模态大模型技术,包括但不限于LLaVA、QwenVL、InternVL等;
-熟练掌握SFT和RL训练策略,熟悉ms-swiftLLaMA-Factory等代码框架;
-熟…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、利用SD、VLLM、LLM等AIGC相关技术参与图文生成、视频生成、智能化编辑,包括但不限于海报生成、动态海报、数字人等;
2、负责AI算法的架构设计与优化,针对不同业务场景提出通用性或定制化的解决方案;
3、结合实际业务需求,探索和解决新问题,并通过创新和改进推动团队整体能力提升。
包括英文材料
OpenCV+
大模型+
SFT+
Swift+
LLaMA-Factory+
还有更多 •••
相关职位

logo of quark
社招5年以上技术类-开发

1. 负责夸克智能视觉相关业务服务,负责深度学习算法服务的流程设计及研发工作 2. 深入理解业务(扫描滤镜、文字服务、图像编辑、图像生成等),和算法紧密合作,对已有服务进行全链路的改进和优化 3. 技术预研和技术难点攻关,引入业界新技术和系统化方法,提升服务迭代效率,保障服务的稳定性、高性能和可扩展性

更新于 2025-12-09杭州
logo of quark
社招3年以上产品类-平台型

1、负责多模态生成模型建设的长期策略和效果优化,搭建图像/视频生成模型的效果评估体系,输出评测需求,驱动数据生产和模型训练,打造行业有竞争力、且有特色的模型,并供给实现更大的业务价值。 2、有强业务视角和高内容Sense,深入调研和了解对模型的实际需求,针对不同场景,提出并推动模型优化、效果提升等改进策略,将模型能力与业务发展深度融合。 3、跟踪最前沿的技术和产品形态,判断行业发展趋势,评估潜在价值和应用可行性。

更新于 2025-12-09北京
logo of quark
社招3年以上技术类-开发

致力于构建高质量的大规模视觉训练数据集,支持图像、视频等多模态模型的研发。主导数据基础设施的设计与优化,确保数据具备良好的质量、多样性与可扩展性。 1. 开发并维护可扩展的数据基础设施,支持大规模图像和视频数据的采集、存储与管理; 2. 应用并部署机器学习模型用于数据清洗、预处理与格式标准化; 3. 实现可扩展且高效的工具,用于可视化、聚类以及深度理解数据; 4. 优化和并行化数据处理流程,以高效处理上亿级别的数据集; 5. 评估并提升训练数据的质量、多样性及标注准确性(包括但不限于caption生成); 6. 与模型研发团队紧密协作,根据训练效果和模型反馈持续迭代数据策略。

更新于 2025-12-09北京|杭州
logo of quark
社招3年以上技术类-算法

1. 负责CV内容安全防控体系搭建,建立CV内容审核能力、大模型安全评测能力、大模型可控生成能力,保证业务安全及大模型应用安全,利用视觉大模型解决业务安全风控需求; 2. 视觉大模型:参与视觉大模型风控的数据、算法、策略等完整体系建设,负责CV分类all-in-one、图像特征检索、开集OCR、视觉理解等算法研发,在业务场景打造行业一流的视觉大模型安全风控体系; 3、岗位特色:应对全风险问题,快速提升综合算法能力,与大模型时代发展同步,深耕大模型安全领域,持续积累安全领域业务经验; 4、业务支持:保障夸克AI、通义千问ToC、UC浏览器、书旗小说、超级汇川等产品的内容安全及大模型安全; 5、部门特色:作为综合型安全中台,包含法务、GA、公关、数安、内安、商安等职能,协同共建为业务提供全面安全保障。

更新于 2025-12-11北京