logo of antgroup

蚂蚁金服蚂蚁集团-大模型数据研发专家-杭州【AI Force】

社招全职技术类-数据地点:杭州状态:招聘

任职要求


1、熟练掌握ODPS SQL和至少一种主流编程语言(Python/Java 等),具备扎实的编程功底与代码优化能力。
2、精通大数据技术,熟练使用ODPS、SparkFlinkKafkaHive 等工具,拥有大规模数据处理与分析实战经验者优先。
3、具备数据中台、机器学习相关系统平台开发或深度使用经验,熟悉数据全生命周期管理流程。
4、对大模型技术架构、产品生态有深入理解,熟悉模型训练对数据的需求特点者优先。
5、具备强烈的技术探索热情,拥有独立解决复杂问题的能力,具备出色的学习能力与创新思维,能快速适应技术发展与业务需求变化。

工作职责


1、大规模预训练数据处理链路设计与开发,涵盖多源数据自动化采集抓取和解析,为基座模型预训练筑牢高质量数据根基。
2、深入探索前沿模型,构建先进的数据合成方案与框架,融合大模型与创新算法,生成海量、高质量且多样化的合成数据,有效拓展数据规模与维度,满足大模型训练对数据的需求。
3、深度剖析大模型训练数据特性,提高模型训练数据的可解释性,提升大模型算法工程师的数据处理消费效率,加速模型研发迭代进程。
4、建设基于业务体系的数据资产模型,通过合理高效全面的数据资产储备来提升运营迭代和算法迭代效率。
5、搭建数据质量监控体系,保障数据真实、准确、合规。
6、跟踪行业前沿技术,推动数据处理技术在大模型研发中的深度应用与创新落地。
包括英文材料
SQL+
Python+
Java+
大数据+
Spark+
Kafka+
Hive+
机器学习+
大模型+
系统设计+
相关职位

logo of antgroup
社招5年以上项目管理-业务项

【职位亮点】 ★ 主导前沿AI技术商业化落地 | 深度参与大模型创新项目; ★ 统筹跨领域资源协作 | 打造AI项目交付标杆。 【职位描述】 1.全生命周期管理:主导AI产品研发及大模型项目交付,建立敏捷化项目管理机制,通过需求拆解、里程碑管控、风险预警等体系保障项目目标达成; 2.效能持续优化:基于业务视角实施项目健康度诊断,识别资源调配、流程效率、质量管控等优化机会,推动PDCA闭环改进(项目周期平均缩短15%+); 3.复杂协同破局:搭建跨部门(算法/工程/产品/客户)协作框架,运用Scrum/Kanban等专业方法,确保多方利益平衡与项目高质量交付; 4.客户价值深耕:深度理解AI技术应用场景,通过需求预判和方案预研,将技术能力转化为可量化的商业价值(NPS≥85%)。

更新于 2025-10-14
logo of antgroup
社招技术类-算法

我们正在寻找一位充满激情的多模态算法专家,加入我们的前沿AI团队。你将专注于构建和训练先进的视觉语言大模型(Multimodal Large Models),推动技术在图像/视频内容理解与生成领域的创新。 【职位描述】 1.核心研发:负责视觉语言大模型的核心算法研发,主攻图像/视频描述生成 (Image/Video Captioning)、视觉问答 (VQA) 等关键任务。 2.模型训练:主导或深度参与多模态大模型的完整训练流程,包括数据构建、模型架构设计(如 Vision Encoder + LLM)、预训练与指令微调 (Instruction-Tuning)。 3.技术落地:负责模型性能的评估、优化与迭代,探索量化、蒸馏等技术,并推动模型在实际业务场景中的部署与应用。

更新于 2025-06-27
logo of alibaba
社招

1、负责核心业务域数据体系的规划和建设,通过数据产品和数据服务等方式,高效支撑业务场景的数据需求 2、深度理解业务,通过对业务策略和痛点的分析,制定系统性端到端的数据解决方案并落地 3、负责数据资产建设、数据质量与稳定性管理,构建共享融通的数据平台,让数据标准更规范、数据获取更高效 4、探索Data for AI以及AI数据产品,利用大模型提升全链路数据应用效率

更新于 2025-07-24
logo of xiaohongshu
社招3年以上数据引擎

1.负责模型预训练、微调、部署及推理过程中的数据准备、模型和数据加速、数据集存储及管理,为大模型提供高效稳定的多模态数据预处理能力,构建高质量的AI数据迭代链路。 2.探索AI Native的多模数据存储格式,支持AI数据高效存储、读取和分析,提升数据的使用价值。 3.跟进LLM、多模态大模型的前沿发展,探索数据如何更好驱动模型迭代。