logo of aligenie

智能互联阿里云智能-大模型工程链路测试开发专家/高级工程师-北京/杭州

社招全职3年以上地点:北京 | 杭州状态:招聘

任职要求


1. 计算机或相关专业硕士及以上学历,3年以上测试开发或质量保障经验,有大模型/AIGC项目经验者优先。
2. 精通Python/Java至少一种语言,熟悉主流测试框架(如PyTestJUnit)及自动化工具链。
3. 熟悉大模型基本原理(如Transformer、Prompt Engineering、RLHF等),了解训练/推理/部署流程。
4. 具备数据驱动思维,能设计…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责大模型训练、推理、评测、部署等核心链路的质量保障体系建设。
2. 设计并实现自动化评测框架,支持多维度(如准确性、一致性、安全性、推理速度等)的模型能力评估。
3. 构建高质量、可扩展的评测数据集,制定科学、可量化的评测标准与指标体系。
4. 推动CI/CD流程在大模型工程中的落地,保障模型迭代的稳定性与可回溯性。
5. 主导Bad Case分析闭环机制,联动算法、工程与业务团队优化模型表现。
包括英文材料
学历+
大模型+
AIGC+
Python+
Java+
pytest+
JUnit+
还有更多 •••
相关职位

logo of aliyun
社招3年以上云智能集团

1. 负责大模型训练、推理、评测、部署等核心链路的质量保障体系建设。 2. 设计并实现自动化评测框架,支持多维度(如准确性、一致性、安全性、推理速度等)的模型能力评估。 3. 构建高质量、可扩展的评测数据集,制定科学、可量化的评测标准与指标体系。 4. 推动CI/CD流程在大模型工程中的落地,保障模型迭代的稳定性与可回溯性。 5. 主导Bad Case分析闭环机制,联动算法、工程与业务团队优化模型表现。

更新于 2026-04-06北京|杭州
logo of aliyun
社招3年以上技术类-质量保证

构建面向智能计算时代的下一代AI质量保障体系,驱动专有云智算、大模型等核心AI产品的卓越质量交付,同时通过AI技术重塑软件测试范式,打造智能化、前瞻性的测试基础设施: 1、 负责专有云智算平台(含GPU资源调度、高性能存储/网络组件)、大模型服务产品的全链路质量体系建设 2、同时能够将AI技术深度融入软件测试全流程,通过AI技术驱动测试效率提升、质量优化和流程变革 3、主导AI测试工具研发、智能化测试体系建设,并为团队提供AI技术在测试领域的前沿解决方案。

更新于 2025-06-13北京|杭州
logo of aliyun
社招3年以上产品类-商业型

1. 产品规划与定义: 基于Flink开源技术演进趋势及用户需求,主导大数据引擎类产品的路标规划与功能设计,并对产品用户使用体验与市场价值负责。 2. 产品全生命周期管理: 负责Flink产品的全生命周期管理(从概念到退市),以用户价值为核心,交付安全、稳定、易用且具备成本效益的产品。有效协调并驱动研发、测试、运营、客服等多职能团队,确保达成产品业务目标。 3. 产品布道与用户洞察: 主导产品布道工作,包括内外部技术培训、市场活动推广及数据分析解读。深入关注用户反馈与行为数据,驱动产品用户体验的持续优化,对用户转化率、留存率、客户价值及满意度负责。 4. 市场与技术研究: 围绕实时计算领域(基于Flink),进行开源大数据技术深度分析、开源大数据市场动态研究及竞争对手调研,为产品战略决策提供洞察。

更新于 2025-07-02北京|杭州
logo of aliyun
社招5年以上云智能集团

Steam 部门设立于2025年1月,正如蒸汽机(Steam Engine)在工业革命 1.0 中所象征的创新开端,我们也希望以此之名,积极探索云与 AI 结合的产品方向。 在当前大模型能力日新月异的情况下,唯有坚持自己的核心价值主张和对未来的判断,且面向半年至一年后的大模型能力打造应用产品,才有一战的可能。对于大模型领域的未来进展,我们相信: 1) 大模型的智商会快速接近乃至与人类齐平; 2) 大模型的多模态理解能力,特别是视觉能力将得到长足发展; 3) 在1和2前提下,信息处理类工作将最终被 AI 接管,大量替代真人员工。 对于阿里云如何做到云+ AI,我们认为"云的最大客户会是 AI",我们的行动路径是让更多现实世界的工作量从“人类脑力劳动”转移到“云端 AI 消耗的计算资源”。 在这些认知下,我们确定了“高效完成重复任务,完整替代人类工作”的产品目标,如果你也相信这个未来,欢迎上船。 1、​AI产品质量保障体系构建​:主导AI产品(含Agent、模型服务等)的全生命周期质量保障,制定测试策略、设计测试方案与质量标准,推动研发流程优化; ​2、效能提升与自动化​:通过持续集成(CI/CD)、自动化测试平台及线上质量监控体系,提升团队测试效率与问题拦截能力; ​3、复杂项目质量管控​:主导中大型AI项目的质量保障,包括测试策略制定、流程优化、风险预警及质量复盘,确保关键节点交付质量; 4、​技术驱动与协作​:推动测试技术创新(如AI场景专项测试、自动化工具链),协同研发团队提升代码质量与交付效率。

更新于 2025-07-07上海