logo of honor

荣耀AI测试技术专家

社招全职5年以上研发类地点:北京 | 南京 | 深圳状态:招聘

任职要求


1、5年以上有AI领域评测工作经验,熟悉LLM、VLM、图像/视频生成编辑等领域最新测试技术研究和规划;
2、熟悉主流AI框架(如TensorFlowPyTorch)及测试工具链;
3、熟悉行业评测标准(如MMLU、HEIM、TextVQA等);
4、熟悉大模型相关原理和评估方法,有大模型算法评估经验优先,AI领域发表过高质量论文优先。

工作职责


1、洞察AI能力的技术发展方向与应用场景,制定最新测试技术研究规划;
2、制定AI能力相关算法模型的评测标准、测试方案,整体测试策略制定;
3、构建AI引擎关键测试能力,包括:测试数据集建设、数据标注能力、自动化测试能力等;
4、负责AI特性的行业横向测评,牵引模型能力优化与竞争力提升。
包括英文材料
大模型+
TensorFlow+
PyTorch+
算法+
相关职位

logo of transsion
校招

1、负责AI语音助手产品测试,参与最新语音交互技术产品的研究和规划,和领域技术专家一起打造更加人性化更便利的极致体验产品 2、负责大模型测试技术测试,参与业界大模型的前沿测试技术规划和研究,与行业领域一起工作,交流,构建更加智能化软件产品; 3、负责测试技术能力提升项目,能学习到全栈的测试技术能力(安全测试/自动化测试/测试设计/AI算法测试/云端服务测试等)

更新于 2025-08-18
logo of mi
社招A89902

1、负责AI算法的质量保障工作,负责算法效果的测试框架和测试标准的搭建; 2、分析业务产品需求、技术方案,负责测试方案的设计,制定合理高效的测试方案; 3、AI测试体系建设,构建AI原子能力、大语言模型、多模态感知、AIGC等算法的评测模型; 4、与产品经理、开发工程师、算法工程师等密切协作,参与产品的需求评审、设计评审与代码审查等环节,提前介入产品开发过程,提供测试视角的意见与建议,促进产品质量的前置保障。 5、编写详细、准确的测试报告,向项目团队、管理层及相关利益者汇报测试进展、发现的问题、质量状况及改进建议,确保各方对产品质量有清晰、全面的了解与认识

更新于 2025-03-03
logo of thead
社招8年以上技术-芯片

职位描述: 作为 AI 软件测试开发高级技术专家,您将参与平头哥 AI 芯片从硅前到硅后的研发过程并推动实现产品化. 您将负责构建高覆盖率的测试体系,确保框架的功能正确性、性能优化和稳定性。 主要职责: 参与 AI 芯片解决方案的系统测试工作,保证产品的交付质量; 参与 AI 领域推理框架,模型训练的测试策略,测试方法,测试工具以及测试用例设计。 参与 AI 领域软件基础框架,算子库,编译的测试策略,测试方法,测试工具以及测试用例设计。 参与设计、建立以及推动 AI 芯片软件质量持续提升流程。 与开发团队、项目管理团队一起制定软件需求开发计划,并且制定对应的测试开发计划, 参与平头哥整体软件质量流程建设,对软件开发的质量进行监控和追踪.

更新于 2025-09-22
logo of antgroup
社招技术类-质量保证

1.业务质量保障:负责芝麻信用场景的质量体系建设工作,包括信用/回收/租赁业务的全链路风险保障。深入理解业务逻辑和系统架构,设计并执行高效的质量策略和保障方案,确保业务功能的正确性、稳定性和用户体验,守护芝麻信用的核心价值; 2.搜推效果评测:负责构建和落地搜索/推荐效果评估体系,具备评测集构建、评测分析、问题归因的能力,根据业务场景选取合适的指标,挖掘badcase并给出优化建议,驱动迭代,提升用户满意度和业务目标达成; 3.大模型评测:负责构建和落地大语言模型(LLM)的评测能力,通过科学高效的评估手段,确保商家端和用户端智能助理在核心任务中的能力可靠性、用户体验和商业价值,为LLM迭代提供关键决策依据,驱动AI技术在信用领域的可信、高效落地。

更新于 2025-07-11