夸克千问C端事业群-视觉数据和系统研发专家-杭州
任职要求
1. 熟练掌握至少一种编程语言:Python / C++ / Java,具有扎实的基础算法和数据结构知识; 2. 有丰富的Linux后台开发经验,熟练掌握服务端架构设计、开发和调试…
工作职责
1. 负责夸克业务的离线流程开发与迭代,构建高效稳定的端到端数据处理流水线; 2. 深入优化数据采集、清洗、标注、报表等核心流程,提升整体处理效率; 3. 引入业界新技术,推动流程架构升级,实现业务性能、系统稳定性和成本效益的持续提升。
1. 跨模态长程预训练:设计并实现文本、图像、视频等多模态对齐与融合的长程训练策略,操控万卡级 GPU 集群,协同 Pretrain / CPT / SFT / RLVR / RLHF 全链路,对超大参数基座模型进行高效分布式优化。 2. 前沿技术攻坚:深入探索 MoE 稀疏化、训练算法与对齐范式创新、可解释性与质量监控、多模态推理、mRAG、百万 Token 级长文处理、Agent&工具链机制等底层原理与技术。 3. 高性能训练框架持续升级:与系统团队共建张量并行、流水并行、混合精度等高性能训练框架,持续提升训练吞吐与稳定性。 4. 学术与行业影响力打造:快速跟踪 NeurIPS / CVPR / ACL 等顶会成果及开源项目,输出专利与论文,树立行业技术标杆 5. 高速驱动夸克AI相关业务:赋能夸克 AI 相机、AI 搜索·深度思考、DeepResearch、创意写作、AI 助手等核心产品,实现多模态能力的快速迭代与落地。 加入我们,你将获得 1. 顶尖资源:与行业专家并肩作战,万卡算力与海量数据随手可用,持续挑战技术天花板。 2. 高速成长:极具竞争力的薪酬福利与纯粹的工程师文化,为你的职业加速。 3. 时代机遇:亲历 AGI 关键技术的诞生与规模化应用,在智能时代留下你的名字。 如果你渴望驰骋于大模型与 AGI 的蓝海,这里就是你的最佳舞台。立即加入我们,共创智能新时代!
致力于构建高质量的大规模视觉训练数据集,支持图像、视频等多模态模型的研发。主导数据基础设施的设计与优化,确保数据具备良好的质量、多样性与可扩展性。 1. 开发并维护可扩展的数据基础设施,支持大规模图像和视频数据的采集、存储与管理; 2. 应用并部署机器学习模型用于数据清洗、预处理与格式标准化; 3. 实现可扩展且高效的工具,用于可视化、聚类以及深度理解数据; 4. 优化和并行化数据处理流程,以高效处理上亿级别的数据集; 5. 评估并提升训练数据的质量、多样性及标注准确性(包括但不限于caption生成); 6. 与模型研发团队紧密协作,根据训练效果和模型反馈持续迭代数据策略。
-负责夸克相册产品全端(iOS/Android/Web/PC/iPad)体验设计,构建清晰流畅、融「智能管理」与「相片社交」于一体的用户体验流程。 -独立主导相册社交化功能从0到1的创新设计,深度定义用户场景、构建差异化交互模型、打造具有情感吸引力的视觉语言与体验。 -探索AI驱动的相册管理、内容生成与社交推荐等新交互范式,贴合年轻用户偏好,实现智能化和情感化的产品感知。 -深度分析用户反馈与行为数据,归纳设计洞察,输出高质量全链路设计方案,并推动落地验证。 -主动发现产品体验中的优化点和创新机会,跨团队协同推进,实现用户体验提升和业务目标协同。