
智能互联阿里云智能-Data+AI大数据平台技术专家-MaxCompute
任职要求
1. 具备扎实的计算机基础和分布式系统研发经验,并对操作系统原理,计算机网络等系统领域知识有较好的理解和项目应用经验。
2. 熟悉主流面向对象编程语言,具备优秀的系统 Debug/Profiling 能力。
3. 工程实践方面,能够熟练使用Pyt…工作职责
1. 参与大数据+AI一体化产品MaxFrame的设计、开发与技术演进,支撑阿里集团内部和公有云上的Data+AI一体化计算场景; 2. 能够独立完成项目需要的系统分析、设计,编码,测试和上线部署任务,确保项目的进度、质量和稳定性要求; 3. 技术基础扎实,沟通和团队合作流畅,熟练使用AI工具,乐于分享,能够积极参与团队中的设计评审和代码评审工作,并能给出相关改进建议; 4. 有一定的技术前瞻性,可以对平台演进中的技术需求(如异构集群的数据处理加速)进行预研和设计,满足对大数据+AI平台快速发展过程中,对各项业务场景的客户需求; 5.该职位涉及值班响应的职责,在服务级别协议(SLA)时间内做出对客响应,推动客户问题的解决,改善客户体验。
1. 负责阿里云大数据开发治理平台DataWorks的产品规划、设计以及落地,重点在数据ETL产品工具链及“Data+AI”方向; 2. 调研各行业用户需求和国内外同类产品,提炼和规划产品迭代计划; 3. 负责产品商业模式设计与GTM,支持业务团队完成业务目标; 4. 负责产品布道,包括内外部培训,市场活动,数据分析等。关注用户反馈,分析用户行为,进行产品用户体验的持续优化。
1. 参与MaxCompute大数据+AI一体化框架和运行平台的设计、开发与技术演进,支撑阿里集团内部和公有云上的Data+AI一体化计算场景; 2. 能够独立完成项目需要的系统分析、设计,编码,测试和上线部署任务,确保项目的进度、质量和稳定性要求; 3. 技术基础扎实,沟通和团队合作流畅,乐于分享,能够积极参与团队中的设计评审和代码评审工作,并能给出相关改进建议; 4. 有一定的技术前瞻性,可以对平台演进中的技术需求(如AI训练中异构环境的数据处理加速)进行预研和设计,满足对大数据+AI平台快速发展过程中,对各项业务场景的客户需求; 5.该职位涉及值班响应的职责,在服务级别协议(SLA)时间内做出对客响应,推动客户问题的解决,改善客户体验。
1. MLOps平台开发打造一站式大模型开发平台,负责主流开源和闭源模型的训练、评测、蒸馏、压缩、部署全链路工具开发 ● 参与模型各种后训练如微调、蒸馏、强化学习的产品化,以及vLLM/sglang/自研推理引擎的优化,提供有竞争力的推理性能 ● 负责各种MLOps工具链开发,如AI资产管理、实验管理、血缘跟踪、评测对比等,帮助用户串联AI开发全流程,提升模型开发效率 ● 负责多模态数据自动标注和挖掘功能的开发,为智驾和具身智能客户提供新一代的数据工程解决方案 2. 企业级Agent开发平台建设 ● 建设具备全模态能力的agent开发平台,帮助客户构建RAG、chatbot、data agent、design agent、research agent等各种AI agent应用 ● 提供白盒化开发模式,建设全链路的可观测、可调试和监控能力,帮助用户构建同时具备高精度和高性价比的agent应用 ● 针对企业客户对安全隐私的强需求,构建全方位的安全防护能力,包括不限于模型安全护栏、工具沙箱、细粒度权限管控等 ● 与阿里云大数据、智能搜索等业务产品合作,建设阿里云agent工具生态
阿里云ApsaraMQ是行业一流的Serverless消息云服务,为客户提供一站式多场景的业界主流消息服务(包括Apache RocketMQ、Apache Kafka、RabbitMQ、MQTT、MNS、EventBridge),具备10倍成本优化、10倍弹性能力、异地多活、丰富集成生态等产品优势。目前AI时代已来,我们正在引领新一代AI MQ技术,为AI Agent提供事件驱动架构基础设施和实时AI Context服务,覆盖AI原生应用架构和一站式Agentic数据分析的场景。 1. 负责阿里云消息云服务AI MQ、Data+AI等特性研发,拓展消息、事件流在AI场景的落地规模; 2. 负责阿里云消息云服务稳定性建设,为AI Agent提供坚实、可靠的通信、数据流技术底座; 3. 负责阿里云消息技术性能优化、成本优化,持续降低Agent通信的延迟和成本; 4. 负责阿里云消息运维平台建设,基于大模型构建SRE Agent持续提升产研效率; 5. 负责Apache RocketMQ技术竞争力建设和开源社区运营,打造AI MQ心智,持续扩大开发者规模。