logo of antgroup

蚂蚁金服蚂蚁集团-大模型数据研发专家-杭州【AI Force】

社招全职技术类-数据地点:杭州状态:招聘

任职要求


1、熟练掌握ODPS SQL和至少一种主流编程语言(Python/Java 等),具备扎实的编程功底与代码优化能力。
2、精通大数据技术,熟练使用ODPS、Spark、Flink、Kafka、Hive 等工具,拥有大规模数据处理与分析实战经验者优先。
3、具备数据中台、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、大规模预训练数据处理链路设计与开发,涵盖多源数据自动化采集抓取和解析,为基座模型预训练筑牢高质量数据根基。
2、深入探索前沿模型,构建先进的数据合成方案与框架,融合大模型与创新算法,生成海量、高质量且多样化的合成数据,有效拓展数据规模与维度,满足大模型训练对数据的需求。
3、深度剖析大模型训练数据特性,提高模型训练数据的可解释性,提升大模型算法工程师的数据处理消费效率,加速模型研发迭代进程。
4、建设基于业务体系的数据资产模型,通过合理高效全面的数据资产储备来提升运营迭代和算法迭代效率。
5、搭建数据质量监控体系,保障数据真实、准确、合规。
6、跟踪行业前沿技术,推动数据处理技术在大模型研发中的深度应用与创新落地。
包括英文材料
SQL+
Python+
Java+
大数据+
Spark+
还有更多 •••
相关职位

logo of antgroup
社招5年以上项目管理-业务项

【职位亮点】 ★ 主导前沿AI技术商业化落地 | 深度参与大模型创新项目; ★ 统筹跨领域资源协作 | 打造AI项目交付标杆。 【职位描述】 1.全生命周期管理:主导AI产品研发及大模型项目交付,建立敏捷化项目管理机制,通过需求拆解、里程碑管控、风险预警等体系保障项目目标达成; 2.效能持续优化:基于业务视角实施项目健康度诊断,识别资源调配、流程效率、质量管控等优化机会,推动PDCA闭环改进(项目周期平均缩短15%+); 3.复杂协同破局:搭建跨部门(算法/工程/产品/客户)协作框架,运用Scrum/Kanban等专业方法,确保多方利益平衡与项目高质量交付; 4.客户价值深耕:深度理解AI技术应用场景,通过需求预判和方案预研,将技术能力转化为可量化的商业价值(NPS≥85%)。

更新于 2025-10-14杭州
logo of antgroup
社招技术类-算法

我们正在寻找一位充满激情的多模态算法专家,加入我们的前沿AI团队。你将专注于构建和训练先进的视觉语言大模型(Multimodal Large Models),推动技术在图像/视频内容理解与生成领域的创新。 【职位描述】 1.核心研发:负责视觉语言大模型的核心算法研发,主攻图像/视频描述生成 (Image/Video Captioning)、视觉问答 (VQA) 等关键任务。 2.模型训练:主导或深度参与多模态大模型的完整训练流程,包括数据构建、模型架构设计(如 Vision Encoder + LLM)、预训练与指令微调 (Instruction-Tuning)。 3.技术落地:负责模型性能的评估、优化与迭代,探索量化、蒸馏等技术,并推动模型在实际业务场景中的部署与应用。

更新于 2025-06-27杭州
logo of antgroup
社招5年以上BD-业务拓展

1. 负责物流、文旅&跨境贸易等行业的业务拓展工作,基于蚂蚁数字蚂力能力提供客户服务、营销服务、端应用开发、AI应用开发、大模型部署的解决方案,达成业务收入目标; 2. 深入洞察目标行业客户在降本增效、数字化转型、大模型应用方面的趋势和痛点,能够建联到客户运营、客服、营销、技术负责人; 3. 将客户需求和痛点与我们的产品及解决方案相结合,挖掘项目机会,推动签约、项目上线,对重点项目进行管理、包括统筹资源进行业务交流、技术测试、商务谈判、管控项目风险,为公司在客户的目标结果及价值呈现负责; 4. 根据公司及部门的业务发展需求和规划,寻找挖掘生态合作伙伴(科技方向),并提出有效的商务合作模式及方案。

更新于 2025-11-04北京|上海|杭州
logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。

更新于 2026-03-28上海|北京