logo of quark

夸克千问C端事业群-千问/夸克-VLM训练与应用数据工程师-杭州/北京

社招全职2年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1.扎实的编程能力,精通数据结构、并发/异步编程,熟悉高效文件I/O与分布式文件系统
2.熟练使用图像与视频处理工具及常用文本处理库,具备复杂场景下的数据工程实战经验;
3.熟悉多模态数据(图像-文本、视频-文本等更多模态)对齐策略、模态融合机制和处理规范;
4.熟悉数…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们致力于构建支持通用人工智能发展的高质量、多模态大规模训练数据集,服务于图像、视频、文本等复杂模态融合下的大模型研发。该岗位将主导多模态数据基础设施的设计、处理流程的智能化优化,并深度参与高价值数据(如推理类任务数据、领域权威知识数据)的构建与增强,为模型的理解力、泛化能力与推理能力提供坚实数据支撑。
你将与算法工程师、数据产品经理紧密合作,共同推动数据与模型的正反馈闭环,包括数据构建策略共创、实验验证、产品化数据标准制定等,在万卡集群的充足算力支持下,实现“数据即能力”的宏大目标。

主要职责:
1.设计与维护高扩展性、多模态数据基础设施
支持图像、视频、文本等模态数据的高效采集、存储、调度与版本化管理,满足大模型多轮训练与快速迭代需求。
2.构建推理能力导向的数据集
主导构建具备复杂因果关系、长链思维、多跳推理、模态融合推理、多语言对齐推理等能力评估或训练所需的数据集,服务大模型“理解-生成-决策”闭环。
3.高性能并行数据处理优化
在CPU/GPU集群或分布式环境中优化大规模图像/视频/文本混合数据的处理性能,提升数据准备效率与稳定性。
4.构建可视化与分析工具,辅助数据理解与反馈闭环
实现多模态数据分布可视化、异常聚类检测与质量诊断,服务于模型训练前/中/后的数据决策优化。
5.与算法工程师深度协同,提升模型性能与数据对齐度
基于模型效果与损失分析,共同制定数据增强策略、采样分布设计、多轮训练数据构造方法,实现数据与模型迭代的高效协同。
6.与数据产品团队合作,推进数据标准化与平台化建设
参与数据标签体系、任务定义、多模态对齐协议等的标准制定,推动数据处理工具、标注平台、数据质量评估体系的产品化落地。
包括英文材料
数据结构+
算法+
相关职位

logo of aligenie
社招2年以上技术类-算法

我们致力于构建支持通用人工智能发展的高质量、多模态大规模训练数据集,服务于图像、视频、文本等复杂模态融合下的大模型研发。该岗位将主导多模态数据基础设施的设计、处理流程的智能化优化,并深度参与高价值数据(如推理类任务数据、领域权威知识数据)的构建与增强,为模型的理解力、泛化能力与推理能力提供坚实数据支撑。 你将与算法工程师、数据产品经理紧密合作,共同推动数据与模型的正反馈闭环,包括数据构建策略共创、实验验证、产品化数据标准制定等,在万卡集群的充足算力支持下,实现“数据即能力”的宏大目标。 主要职责: 1.设计与维护高扩展性、多模态数据基础设施
支持图像、视频、文本等模态数据的高效采集、存储、调度与版本化管理,满足大模型多轮训练与快速迭代需求。 2.构建推理能力导向的数据集
主导构建具备复杂因果关系、长链思维、多跳推理、模态融合推理、多语言对齐推理等能力评估或训练所需的数据集,服务大模型“理解-生成-决策”闭环。 3.高性能并行数据处理优化
在CPU/GPU集群或分布式环境中优化大规模图像/视频/文本混合数据的处理性能,提升数据准备效率与稳定性。 4.构建可视化与分析工具,辅助数据理解与反馈闭环
实现多模态数据分布可视化、异常聚类检测与质量诊断,服务于模型训练前/中/后的数据决策优化。 5.与算法工程师深度协同,提升模型性能与数据对齐度
基于模型效果与损失分析,共同制定数据增强策略、采样分布设计、多轮训练数据构造方法,实现数据与模型迭代的高效协同。 6.与数据产品团队合作,推进数据标准化与平台化建设
参与数据标签体系、任务定义、多模态对齐协议等的标准制定,推动数据处理工具、标注平台、数据质量评估体系的产品化落地。

更新于 2026-04-01北京|杭州
logo of quark
社招2年以上技术类-算法

1. 跨模态长程预训练:设计并实现文本、图像、视频等多模态对齐与融合的长程训练策略,操控万卡级 GPU 集群,协同 Pretrain / CPT / SFT / RLVR / RLHF 全链路,对超大参数基座模型进行高效分布式优化。 2. 前沿技术攻坚:深入探索 MoE 稀疏化、训练算法与对齐范式创新、可解释性与质量监控、多模态推理、mRAG、百万 Token 级长文处理、Agent&工具链机制等底层原理与技术。 3. 高性能训练框架持续升级:与系统团队共建张量并行、流水并行、混合精度等高性能训练框架,持续提升训练吞吐与稳定性。 4. 学术与行业影响力打造:快速跟踪 NeurIPS / CVPR / ACL 等顶会成果及开源项目,输出专利与论文,树立行业技术标杆 5. 高速驱动夸克AI相关业务:赋能夸克 AI 相机、AI 搜索·深度思考、DeepResearch、创意写作、AI 助手等核心产品,实现多模态能力的快速迭代与落地。 加入我们,你将获得    1. 顶尖资源:与行业专家并肩作战,万卡算力与海量数据随手可用,持续挑战技术天花板。    2. 高速成长:极具竞争力的薪酬福利与纯粹的工程师文化,为你的职业加速。    3. 时代机遇:亲历 AGI 关键技术的诞生与规模化应用,在智能时代留下你的名字。 如果你渴望驰骋于大模型与 AGI 的蓝海,这里就是你的最佳舞台。立即加入我们,共创智能新时代!

更新于 2025-12-16北京|杭州
logo of amap
社招2年以上技术类-开发

1、负责高德出行场景(驾车,骑行,步行)的大模型应用框架开发,构建高可用、低延迟的分布式系统; 2、负责优化Agent决策引擎、任务调度、多模态数据处理等模块的性能与稳定性; 3、负责搭建Agent与外部系统(如数据库、API、第三方服务)的高效通信机制; 4、负责保障大模型应用系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性; 5、负责协调业务资源,与大模型算法和数据源服务等团队协作,保障项目有效落地和需求高效交付。

更新于 2025-12-02北京
logo of kuaishou
社招D4870

1、负责快手国际化Push相关的算法研发、优化工作,运用策略和算法手段促进用户增长; 2、负责Push推荐系统的搭建以及相关算法落地,面对亿级别的用户群体情况下实现Push的个性化匹配,做到千人千面; 3、负责Push的算法、策略的设计,并直接参与Push场景下推荐系统的全链路开发与优化,包括但不局限于触发、召回、粗排、精排、下发策略等阶段; 4、从海量数据中挖掘用户消费行为、社交关系网以及运营热点实现Push内容池的搭建。

更新于 2025-04-09北京