logo of tongyi

通义通义实验室-多模态大模型数据处理工程师-通义百聆

社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1、熟练掌握数据处理工具(SQL/maxcompute/spark/UDF等),有数据标注、清洗、评估等实战经验。
2、熟悉数据仓库架构,数据仓库建模和ETL流程,在数据治理上有一定实战经验。
3、掌握Python及主流数据处理工具库,理解数据清洗技术;熟悉数…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责多模态数据数据pipeline建设、数据版本管理、数据处理、数据算子开发集成等工作。
2、开发自动化数据处理工具与脚本,优化数据清洗、标注及质量评估的效率和规模化能力。
3、参与多模态大模型训练数据的构建与管理,参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源,设计有效的数据分布策略,支持模型持续迭代;
4、与算法团队紧密协作,根据模型训练需求定制数据策略,提升训练效果。
5、参与模型推理与部署、模型蒸馏、推理服务服务化,能够支持tagging及服务优化工作。
包括英文材料
SQL+
Spark+
数据仓库+
还有更多 •••
相关职位

logo of aliyun
社招7年以上云智能集团

您将作为阿里云模型即服务(MaaS)百炼平台及通义系列模型(通义千问、通义万相)模型的的核心技术专家。您的核心使命是指导我们的客户,深度应用AI的力量,解决其复杂的业务难题,加速企业的创新与数字化转型。 核心职责 1. AI解决方案设计与售前支持 - 与核心企业客户深度合作,精准洞察其业务目标,并基于阿里云MaaS平台,为其量身定制创新的AI解决方案。 - 主导并设计针对复杂应用场景的POC项目,包括但不限于:检索增强生成(RAG)、模型微调、多模态生成、以及基于智能体(Agent)的复杂系统。 - 负责将客户需求转化为稳健、可扩展且安全的架构设计,以支持AI Models在阿里云上的高效部署与管理。 2. 技术布道与战略影响 - 扮演AI专家的角色,挑战现有模式,为客户与内部团队带来前瞻性的创新理念。 - 面向C-level级别高管到核心工程师等关键决策者,提供具有高度影响力的技术演讲、产品演示和深度研讨会。 - 持续追踪并分析快速演进的生成式AI技术趋势与市场动态,为我们的AI MaaS解决方案发掘市场机会,并构筑独特的竞争优势。 3. 客户成功与技术咨询 - 全方位指导客户完成AI应用的完整生命周期,从初期的概念构思、模型选型,到最终的部署、监控与持续优化(MLOps)。 - 作为客户信赖的技术顾问,确保项目成功落地,并围绕模型生命周期管理、成本优化及安全合规等方面提供最佳实践。 - 负责解决客户遇到的复杂技术难题,并有效协调产品、研发等内部团队资源,全力保障客户成功。 4. 生态赋能与知识沉淀 - 构建并沉淀高价值的技术资产库,包括AI解决方案蓝图、最佳实践指南、以及有说服力的客户案例等。 - 开发并提供专业培训材料,赋能内部销售团队与生态合作伙伴,帮助他们更有效地定位并销售我们的AI MaaS产品。 - 收集并提炼来自客户与市场的关键反馈,以直接影响并推动阿里云AI产品与服务的发展路线图的演进。

更新于 2025-10-31杭州
logo of aliyun
社招3年以上云智能集团

深入重点客户业务场景,快速识别其对大模型技术的需求场景,例如知识问答、办公提效、内容生成、智能研发、辅助编程、多模态识别和生成等,端到端完成需求分析、总体方案设计、架构设计、组件研发、数据集成、系统集成等工作,推动通义千问系列模型在行业场景的落地; 主导大模型项目落地的关键技术工作,包括场景需求收集、数据解析与处理、知识抽取与向量化、RAG开发、Agent 流程编排等,协助客户完成模型选型、系统对接、用量监控、成本优化与效果迭代,确保客户可直观感知模型价值; 开发辅助工具代码降低客户接入门槛,例如测试工具、效果评测工具、数据处理工具、API 调用示例及 Demo 应用; 输出大模型落地方法论与最佳实践,包括 Prompt 模板库、RAG 优化策略、Agent 设计模式等,支持客户自主运营与规模化复制。

更新于 2026-02-13北京|深圳|杭州
logo of aliyun
社招3年以上云智能集团

深入重点客户业务场景,快速识别其对大模型技术的需求场景,例如知识问答、办公提效、内容生成、智能研发、辅助编程、多模态识别和生成等,端到端完成需求分析、总体方案设计、架构设计、组件研发、数据集成、系统集成等工作,推动通义千问系列模型在行业场景的落地; 主导大模型项目落地的关键技术工作,包括场景需求收集、数据解析与处理、知识抽取与向量化、RAG开发、Agent 流程编排等,协助客户完成模型选型、系统对接、用量监控、成本优化与效果迭代,确保客户可直观感知模型价值; 开发辅助工具代码降低客户接入门槛,例如测试工具、效果评测工具、数据处理工具、API 调用示例及 Demo 应用; 输出大模型落地方法论与最佳实践,包括 Prompt 模板库、RAG 优化策略、Agent 设计模式等,支持客户自主运营与规模化复制。

更新于 2026-04-02北京|深圳|杭州
logo of aligenie
社招3年以上

深入重点客户业务场景,快速识别其对大模型技术的需求场景,例如知识问答、办公提效、内容生成、智能研发、辅助编程、多模态识别和生成等,端到端完成需求分析、总体方案设计、架构设计、组件研发、数据集成、系统集成等工作,推动通义千问系列模型在行业场景的落地; 主导大模型项目落地的关键技术工作,包括场景需求收集、数据解析与处理、知识抽取与向量化、RAG开发、Agent 流程编排等,协助客户完成模型选型、系统对接、用量监控、成本优化与效果迭代,确保客户可直观感知模型价值; 开发辅助工具代码降低客户接入门槛,例如测试工具、效果评测工具、数据处理工具、API 调用示例及 Demo 应用; 输出大模型落地方法论与最佳实践,包括 Prompt 模板库、RAG 优化策略、Agent 设计模式等,支持客户自主运营与规模化复制。

更新于 2026-04-02北京|深圳|杭州