logo of quark

夸克智能信息-千问/夸克-VLM训练与应用数据工程师-杭州/北京

社招全职2年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1.扎实的编程能力,精通数据结构、并发/异步编程,熟悉高效文件I/O与分布式文件系统
2.熟练使用图像与视频处理工具及常用文本处理库,具备复杂场景下的数据工程实战经验;
3.熟悉多模态数据(图像-文本、视频-文本等更多模态)对齐策略、模态融合机制和处理规范;
4.熟悉数…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们致力于构建支持通用人工智能发展的高质量、多模态大规模训练数据集,服务于图像、视频、文本等复杂模态融合下的大模型研发。该岗位将主导多模态数据基础设施的设计、处理流程的智能化优化,并深度参与高价值数据(如推理类任务数据、领域权威知识数据)的构建与增强,为模型的理解力、泛化能力与推理能力提供坚实数据支撑。
你将与算法工程师、数据产品经理紧密合作,共同推动数据与模型的正反馈闭环,包括数据构建策略共创、实验验证、产品化数据标准制定等,在万卡集群的充足算力支持下,实现“数据即能力”的宏大目标。

主要职责:
1.设计与维护高扩展性、多模态数据基础设施
支持图像、视频、文本等模态数据的高效采集、存储、调度与版本化管理,满足大模型多轮训练与快速迭代需求。
2.构建推理能力导向的数据集
主导构建具备复杂因果关系、长链思维、多跳推理、模态融合推理、多语言对齐推理等能力评估或训练所需的数据集,服务大模型“理解-生成-决策”闭环。
3.高性能并行数据处理优化
在CPU/GPU集群或分布式环境中优化大规模图像/视频/文本混合数据的处理性能,提升数据准备效率与稳定性。
4.构建可视化与分析工具,辅助数据理解与反馈闭环
实现多模态数据分布可视化、异常聚类检测与质量诊断,服务于模型训练前/中/后的数据决策优化。
5.与算法工程师深度协同,提升模型性能与数据对齐度
基于模型效果与损失分析,共同制定数据增强策略、采样分布设计、多轮训练数据构造方法,实现数据与模型迭代的高效协同。
6.与数据产品团队合作,推进数据标准化与平台化建设
参与数据标签体系、任务定义、多模态对齐协议等的标准制定,推动数据处理工具、标注平台、数据质量评估体系的产品化落地。
包括英文材料
数据结构+
算法+
相关职位

logo of quark
社招3年以上技术类-算法

岗位描述: 全面负责夸克大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建,驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展,打造世界一流的模型效果,并定义其在未来 AI 应用中的核心价值。 工作职责: ● 【战略规划与技术引领】 制定并执行大模型 Post-training 的中长期技术路线图,预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向,确保技术路径与公司业务战略高度协同。 ● 【核心能力与壁垒构建】 领导团队进行体系化的数据驱动实验,不仅局限于日常迭代,更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题,构建技术壁垒。 ● 【前沿算法研究与创新】 深入探索并推动 Post-training 领域的前沿算法创新,包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。 ● 【多模态与未来探索】 从统一多模态模型的战略视角出发,您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略,确保模型在图文问答、视频对话 等复杂场景下实现无缝、精准的理解与生成。 ● 【团队领导与效能提升】 负责 Post-training 算法团队的组建、培养与管理,打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架,实现研发效能的倍增。

更新于 2025-12-02北京|杭州
logo of quark
社招2年以上技术类-算法

团队亮点: 1、技术前沿性:主导下一代多模态搜索技术体系构建,探索大模型与搜索的深度融合 2、业务影响力:直接服务亿级用户,优化夸克、千问APP、AI眼镜等核心产品的搜索体验 3、数据与场景优势:基于百亿级图文/视频库及海量用户真实场景需求,攻克多模态对齐与检索难题 核心职责: 您将负责构建面向千问APP、夸克APP、AI眼镜等产品的统一多模态搜索技术体系,覆盖全网图文检索、图视检索、图图检索等核心能力,支撑全网搜索、智能拍搜、多模态RAG等关键场景 1、构建多模态内容理解-语义检索-语义匹配全链路技术方案,涵盖在线侧多模态query理解、embedding模型、Rerank模型,以及离线侧图片/视频/商品等内容理解和图文对齐能力建设 2、依托海量用户query和百亿图片/视频库,大模型驱动的建模范式持续创新,持续优化提升检索性能 3、核心技术攻坚:在细粒度检索、指令化检索、海量图文对齐、视频语义对齐等难点任务上的能力突破

更新于 2025-11-28北京|杭州
logo of quark
社招3年以上技术类-算法

核心职责: 构建新一代AI相机与智能眼镜的核心交互能力,应用在千问/夸克APP和夸克眼镜,覆盖图片识别、商品识价、学习办公、生活健康、文本创作等全场景。包括: 1、多模态PlannCoT,理解用户图文query并规划合理的工具调用路径,为生成提供多模态内容供给 2、通过VLM post-training技术提升模型在行业知识、多轮对话、RA引用、偏好对齐等专项能力 3、构建多模态数据生产体系,提升模型在数字化内容理解、图文对齐、图表理解等内化能力 4、探索强化学习在复杂交互场景中的应用,尤其是多模态planning、视觉reasoning

更新于 2025-11-28北京|杭州
logo of quark
社招2年以上技术类-算法

核心职责: 构建新一代AI相机与智能眼镜的核心交互能力,应用在千问/夸克APP和夸克眼镜,覆盖图片识别、商品识价、学习办公、生活健康、文本创作等全场景。包括: 1、多模态PlannCoT,理解用户图文query并规划合理的工具调用路径,为生成提供多模态内容供给 2、通过VLM post-training技术提升模型在行业知识、多轮对话、RA引用、偏好对齐等专项能力 3、构建多模态数据生产体系,提升模型在数字化内容理解、图文对齐、图表理解等内化能力 4、探索强化学习在复杂交互场景中的应用,尤其是多模态planning、视觉reasoning

更新于 2025-12-05北京|杭州