logo of aliyun

阿里云阿里云智能-AI产品评测专家/工程师-杭州/北京

社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


1、计算机、人工智能、统计学、数学或相关专业,本科及以上学历,3年(工程师)或5年(专家)以上相关工作经验;
2、熟悉业界主流评测工具集和评测集,有独立设计执行评测经验;
…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、构建科学高效的AI产品评测体系,能够识别现有评测体系的局限性,持续优化评测方法、指标和数据集;
2、熟悉评测方法论和工具链,能够搭建评测工具平台,执行评测方案并拿到评测结论;
3、具备AI模型和AI产品能力分析和迭代优化分析能力,根据评测结论提出优化建议,驱动优化落地;
4、关注业界前沿AI模型和产品发展,关注AI前沿评测方法发展,并转化为内部评测实践。
包括英文材料
学历+
Python+
相关职位

logo of aligenie
社招5年以上

1、构建科学高效的AI产品评测体系,能够识别现有评测体系的局限性,持续优化评测方法、指标和数据集; 2、熟悉评测方法论和工具链,能够搭建评测工具平台,执行评测方案并拿到评测结论; 3、具备AI模型和AI产品能力分析和迭代优化分析能力,根据评测结论提出优化建议,驱动优化落地; 4、关注业界前沿AI模型和产品发展,关注AI前沿评测方法发展,并转化为内部评测实践。

更新于 2026-04-08北京|杭州
logo of aliyun
社招3年以上云智能集团

1. 负责百炼平台大模型调优与部署等AI工具链产品化落地; 2. 负责百炼平台的调优模型推理、模型评测、模型调优、模型广场等的模块的架构设计和开发工作; 3. 了解技术使用场景和优缺点,能够就复杂技术问题,提供解决方案并执行落地,同时对上下游技术团队及技术架构有完整的了解; 4. 基于业务需求和技术洞察,在调优后模型的推理服务方面,进行技术规划并落地。

更新于 2025-12-25北京|杭州
logo of aligenie
社招2年以上技术类-质量保证

1. 负责 AI 应用的测试设计与自动化测试开发,确保功能正确、性能稳定、体验可靠。 2. 深入理解业务需求和 AI 应用场景,参与需求评审,识别风险点和测试重点。 3. 针对 AI 模型输出的正确性、稳定性、一致性、可用性设计测试策略与测试用例。 4. 跟踪线上质量问题,进行问题复现、日志分析和根因定位,推动问题闭环解决。 5. 持续优化测试策略与流程,总结测试经验,沉淀工具和平台,提高整体测试效率与质量。 6. 与产品、算法工程师、后端/前端工程师紧密合作,保障 AI 功能从需求到上线的质量。

更新于 2026-03-31北京|杭州
logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 Coder团队致力于构建能够执行、扩展并自我进化的自主系统,通过构建超智能的coding agent/digital agent,扩展数字世界,为迈向真实世界的智能奠定基础。 工作职责: 1. 负责通用模型 Qwen 的代码能力和代码专有模型 Qwen-Coder 的构建。 (1)包括但不限于数据收集、预训练、后训练(强化学习)、评测等方向上的探索。 (2)通过Large-scale Pre-training 和 Large-scaleRL来提升Code Reasoning能力,在专家级编程竞赛超越人类,并构建 Coding Agent 来解决真实世界软件开发任务; 2. 负责Computer-Use Agent (GUI-Agent)的建设,以最直观的方式—鼠标、键盘、编码等操作来代替人类执行数字世界任务。 (1)通过Scaling海量数字世界数据结合大规模合成数据,来提升Computer-Use Agent的Grouding能力。 (2)通过Long Horizon的方式进行强化训练,结合可扩展的多模态环境反馈来提升CU Agent的Reasoning的能力。

更新于 2025-08-22北京|杭州|上海