logo of quark

夸克千问C端事业群-大模型数据专家-图文多模方向

社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1、具备扎实的数据结构与并发编程能力,熟悉高效文件I/O与分布式文件系统;
2、熟练使用主流图像与视频处理工具和库(如 OpenCV、FFmpeg、PyAV),具备复杂场景下的处理经验;
3、具备在 CPU 和 GPU 上优化及并行化数据处理流程的能力;
4、熟悉用于机器学习训练数据的数据标注与caption流程;
5、熟悉大规模图像/视频数据清洗和…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


致力于构建高质量的大规模视觉训练数据集,支持图像、视频等多模态模型的研发。主导数据基础设施的设计与优化,确保数据具备良好的质量、多样性与可扩展性。
1. 开发并维护可扩展的数据基础设施,支持大规模图像和视频数据的采集、存储与管理;
2. 应用并部署机器学习模型用于数据清洗、预处理与格式标准化;
3. 实现可扩展且高效的工具,用于可视化、聚类以及深度理解数据;
4. 优化和并行化数据处理流程,以高效处理上亿级别的数据集;
5. 评估并提升训练数据的质量、多样性及标注准确性(包括但不限于caption生成);
6. 与模型研发团队紧密协作,根据训练效果和模型反馈持续迭代数据策略。
包括英文材料
数据结构+
算法+
NLP+
大模型+
后端开发+
Java+
C+++
还有更多 •••
相关职位

logo of quark
社招3年以上技术类-开发

1、参与境内外互联网网页、文档、代码等文本数据的发现、采集、处理及标注工作,完善相应平台和架构能力; 2、为文本大模型训练供给语料数据,为AI toC应用供给领域优质内容数据; 3、评估并提升训练数据的质量、多样性及标注准确性; 4、通过AI能力来赋能数据建设,提升数据效果及生产效率; 5、与模型及业务研发团队紧密协作,根据训练效果和业务指标反馈持续迭代数据策略。

更新于 2025-12-26北京|杭州
logo of quark
社招3年以上技术类-开发

1、参与设计并实现高性能、可扩展、分布式大数据处理平台,通过数据驱动模型训练,支撑夸克智能语音相关业务算法生产与高效迭代; 2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与前沿模型研究中数据解决方案的设计、开发和维护; 3、通过AI能力来赋能数据建设,持续提升平台数据生产效率、易用性、降低算法使用成本

更新于 2026-01-07杭州|北京
logo of quark
社招3年以上技术类-算法

1.负责大模型应用算法相关的产品研发工作; 2.负责大模型应用场景及算法选型,进行算法模型训练与调优,优化产品性能,解决实际问题; 3.负责分析和挖掘用户使用数据,设计个性化推荐策略; 4.参与产品需求分析,设计、开发与评审。

更新于 2026-01-13北京
logo of quark
社招1年以上技术类-算法

1. 跟进大模型的前沿进展,负责大模型在百亿级流量搜索和信息流广告客户侧的应用和优化; 2. 跟进和研究前沿AI Agent技术,负责效果广告系统AI Assistant、投放AI Agent的研究和落地; 3. 构建商业Agent生态基础技术平台能力,包括Prompt、RAG、LLMs(预训练、微调、RLHF等)、数据、评测、agent框架等;

更新于 2026-01-19北京