阿里云阿里云智能-Data Agent研发工程师-杭州
任职要求
1. 本科及以上学历,专业为计算机科学、人工智能、软件工程或相关领域; 2. 熟练掌握至少一种编程语言(如 TypeScript/JavaScript、Python、Go、Java 等),具备扎实的系统编程能力; 3. 对SQL语言语法、代码结构分析、自动化代码生成有深入理解,熟悉多智能体系统及智能体…
工作职责
加入DataWorks团队,一起构建下一代AI Native的大数据开发平台,包括但不限于以下工作: 1. 参与设计、开发和实现Data Agent,包括记忆模块、规划模块和工具调用模块; 2. 参与设计与开发基于大模型的可扩展的智能SQL编程助手,支持多轮推理、任务分解与上下文记忆; 3. 负责语言服务器协议(LSP)的实现与优化,支持主流SQL语言的智能提示、跳转、重构等功能; 4. 深入理解大数据开发者行为模式,通过日志分析与交互反馈,持续迭代提示策略,降低误触率、提升采纳率; 5. 支持高 QPS 下的低延迟响应,并建立完善的监控、告警与性能追踪体系,快速识别性能瓶颈、内存泄漏、连接堆积等问题; 6. 持续跟踪Data Agent、大模型、代码补全等前沿技术发展,推动团队技术水平提升。
1. 加入DataWorks 团队参与设计、开发和实现Data Agent,包括记忆模块、规划模块和工具调用模块。 2. 开发Data Agent的知识库管理系统,通过RAG技术提升大模型应用效果。 3. 构建具备代码理解、生成、调试和优化能力的SQL Coding能力,并能适应特定用例和环境。 4. 持续跟踪Data Agent、大模型、代码补全等前沿技术发展,推动团队技术水平提升。
1. 驱动阿里国际数字商业板块业务增长,构建 AIDC 分国家数据运营资产体系; 2. 建设本地化市场洞察和机会发现能力,帮助业务全方位了解行业动态,挖掘商业机会 3. 承担设计和建立产品/业务的指标体系,能够科学地跟踪和指导业务的发展 4. 参与构建海外电商用增、商品、商家、流量等行业的数据智能化应用解决方案,驱动业务获得增量价值; 5. 参与构建企业级 Data Agent,融合 LLM 与业务数据打造智能决策大脑;
负责阿里集团、阿里云战略级产品SLS研发,在日增数百PB级的超大规模实时数据之上,挑战从“经典可观测性”向“AI Native 基建”的跨越。通过实时采集、索引、存储、语义检索和分析等技术,实时处理每日数百PB海量数据,并针对AI应用场景进行特定优化,提供智能、自动化数据检索和分析服务。加入该岗位,您将有机会在国内超大规模的实时日志平台上,打造新一代的AI基础设施。 1. 定义下一代 AI 数据基座: 基于现有海量日志平台,重构面向 Agent Runtime 的数据基础设施,解决高吞吐写入与低延迟语义检索共存的工程难题; 2. 构建 Data + AI 飞轮: 研发高性能的数据清洗与向量化流水线,从数据中实时化萃取高质量数据,构建AI存储和检索系统,通过构建数据反馈回路,使模型和Agent持续进化; 3. 超大规模系统攻坚: 维护并演进日处理百 PB 级数据的实时平台,在极致的成本与性能约束下,探索存算分离、混合索引等前沿技术落地。
1. 立足AI Agent研发运维视角,贯穿整个技术栈,在稳定、体验、效率和成本这四个方面持续进行优化 2. 基于AI研发领域的MaaS/PaaS/IaaS,进行模型训练与推理的算力保障,并提升资源使用率 3. 统性地提升Agent研发、部署、运行阶段的稳定性,适应Agent QPS、模型推理TPM每年提升1个量级的发展速度 4. 主导解决Agent研发运维过程中各类疑难问题,并推进完善产品与平台的能力 5. 系统性构建故障节点、慢节点检测平台化能力,响应并解决日常大模型任务的故障问题 6. 负责LLM 后训练(SFT、RLHF/RLAIF 等)相关链路稳定性治理、规范建设:理解研发与优化 LLM + RL/HRF 相关训练框架,提升扩展性、稳定性与性能(吞吐、显存占用、收敛效率等)。结合分布式训练技术(如 tensor / pipeline / data parallel),优化多机多卡训练性能和资源利用率。 7. 平台稳定性与工程质量:建设训练平台的观测与运维体系,完善监控、告警、日志与故障排查工具;持续提升平台的稳定性、可调试性和可维护性,产出高质量技术文档与设计方案。