阿里云阿里云智能-测试开发专家-AI Coding 方向
任职要求
● 本科或以上学历,计算机软件或相关专业,5年以上测试开发/研发经验; ● 能结合AI Coding产品特性(如非确定性输出、长链路交互)设计针对性方案,并搭建对应的测试评估体系; ● 主导过复杂系统测试架构设计及测试平台开发或者在自动化测试、…
工作职责
一、职位描述 我们是一个专注于AI Coding方向的充满活力和创业精神的创新业务团队,致力于通过智能化代码生成和开发工具重新定义软件开发体验。随着AI Agent技术的快速发展,我们正在寻找优秀的AI Agent研发工程师加入团队,共同构建下一代智能编程助手和自主代码开发系统,一起在AI驱动的编程革命中创造历史! 二、岗位职责 ● AI产品质量保障体系构建:主导AI Coding产品(含Agent、模型服务等)的全生命周期质量保障,制定测试策略、设计测试方案与质量标准,推动研发流程优化; ● 效能提升与自动化:通过持续集成(CI/CD)、自动化测试平台及线上质量监控体系,提升团队测试效率与问题拦截能力; ● 复杂项目质量管控:主导中大型AI项目的质量保障,包括测试策略制定、流程优化、风险预警及质量复盘,确保关键节点交付质量; ● 技术驱动与协作:推动测试技术创新(如AI场景专项测试、自动化工具链),协同研发团队提升代码质量与交付效率。
阿里云PAI团队致力于打造业界一流的一站式AI工程化平台,拥有万卡级训练能力与超大规模异构资源调度技术,为复杂模型训练与推理任务构建坚实基座。PAI平台不仅是通义大模型研发与落地的核心基础设施,也作为公共云服务的关键载体,支撑众多行企业构建大模型核心业务。平台提供从数据标注、预处理、模型训练、推理服务到开发环境与工作流调度的全链路工程支持,全面覆盖AI项目从实验探索到规模化落地的完整价值链。作为Web前端工程师,您将深度参与平台前端体系的构建与持续演进,具体职责涵盖以下方面: 1. 协同产品与设计团队,负责AI平台控制台的前端开发,覆盖标注、训练、推理、编排、监控、开发环境等核心场景,打造专业、易用的交互体验。 2. 面向AI交互场景演进与算力资源类型升级,持续推动前端架构重构与性能优化,提升系统响应速度与操作流畅度。 3. 联合测试、运维与技术支持团队,确保前端系统稳定可靠、兼容性强、易于维护,并能快速响应与修复线上问题。 4. 参与AI Coding、WebIDE、智能Agent、AIGC等方向的前端预研与落地,积极探索下一代AI开发体验的创新路径。
我们是一个专注于Agentic Coding方向的充满活力和创业精神的创新业务团队,致力于通过智能化代码生成和开发工具重新定义软件开发和Devops体系。 随着Agentic Code技术的快速发展,我们正在寻找优秀的Agentic Code研发工程师/专家加入团队,共同构建下一代智能编程助手和自主代码开发系统,一起在LLM驱动的编程革命中创造历史! 负责基于大语言模型的Agentic Code产品核心能力的开发工作,实现代码续写、复杂问题分析与理解、代码生成与测试等功能,包括:代码补全、行间建议预测(NES - Next Edit Suggestion)、Agentic Code智能体等; 参与设计、开发和实现Agentic Code,构建具备代码理解、生成、调试和优化能力的自主编程代理系统,并能适应特定用例和环境; 从事AI领域相关算法研究及算法的工程化实现,以提升Agent能力(推理、规划、记忆、工具使用); 设计和实现高效的LLM算法,为代码自动生成、智能补全、bug检测等场景提供技术支撑; 参与设计多智能体协作架构,实现复杂编程任务拆解与分布式执行,提升Agentic Code的质量及效率; 持续跟踪Agentic Code、大模型、代码生成等前沿技术发展,推动团队技术水平提升。
1.技术方案设计 • 调研AI大模型训练及推理的前沿技术发展,分析前沿技术和网络的关联以及优化方向 • 分析客户需求,帮助客户使用我们的产品和解决方案,帮忙客户进行性能优化 2.技术实现 • 负责AI计算系统的通信库研发、测试、以及交付与支持 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 3.稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 4.技术预研 • 分析AI业务通信pattern和发展趋势,探索通信库的优化空间,以及AI计算系统全栈的协同设计,提升系统端到端的稳定性和性能 5.技术规划 • 理解业务战略及重点,基于业务需求作出高性能、高可用、高可靠、高拓展性的技术架构规划和落地。
1、技术方案设计 • 调研AI大模型训练及推理的前沿技术发展,分析前沿技术和网络的关联以及优化方向; • 分析客户需求,帮助客户使用我们的产品和解决方案,帮忙客户进行性能优化; 2、技术实现 • 负责AI计算系统的通信库研发、测试、以及交付与支持 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 4、技术预研 • 分析AI业务通信pattern和发展趋势,探索通信库的优化空间,以及AI计算系统全栈的协同设计,提升系统端到端的稳定性和性能 5、技术规划 • 理解业务战略及重点,基于业务需求作出高性能、高可用、高可靠、高拓展性的技术架构规划和落地。