
智能互联千问C端事业群-大模型智能化评测专家-杭州/深圳/上海
任职要求
1. 3-5 年测试工作经验,有多模态算法/大模型/音视频/图像算法等之一工作背景,有服务端算法测试、大模型评测,数据集构造等测试经验; 2. 具有自然语言处理、计算机视觉、语言大模型、多模态大模型、大模型评测、AIGC等相关经验优先; 3. 能够主导大型项目的整体测试工作,包括测试分析、测试用例落地、…
工作职责
1. 负责智能互联多模态算法测试,熟悉算法工程全链路评测,可以独立设计如图像处理算法(如目标检测、图像识别、OCR等)的评测方案,数据集,评测工程等,确保算法精度与性能符合需求; 2. 建设通用的基于大模型场景下的模型评估体系、评测框架及基础评测能力的建设,包括评测集完备性,合理性建设,评测结果智能化判定,能够基于业务需求设计评测方案,开展多维度模型评估,输出专业评测报告; 3. 追踪大模型方向前沿进展,积极主动地学习和探索新的评测及分析的方法和技术。主导项目全链路质量保障和风险识别工作,搭建质量技术保障体系、制定质量保障规范、推进测试工作执行; 4. 协同项目中多角色、多合作团队形成积极有效的沟通和互动,驱动问题解决,保障交付质量。主动创新,通过技术手段解决质量保障工作中的复杂技术问题,提升测试效能、加深质量工作技术积累。
1. 负责智能互联多模态算法测试,熟悉算法工程全链路评测,可以独立设计如图像处理算法(如目标检测、图像识别、OCR等)的评测方案,数据集,评测工程等,确保算法精度与性能符合需求; 2. 建设通用的基于大模型场景下的模型评估体系、评测框架及基础评测能力的建设,包括评测集完备性,合理性建设,评测结果智能化判定,能够基于业务需求设计评测方案,开展多维度模型评估,输出专业评测报告; 3. 追踪大模型方向前沿进展,积极主动地学习和探索新的评测及分析的方法和技术。主导项目全链路质量保障和风险识别工作,搭建质量技术保障体系、制定质量保障规范、推进测试工作执行; 4. 协同项目中多角色、多合作团队形成积极有效的沟通和互动,驱动问题解决,保障交付质量。主动创新,通过技术手段解决质量保障工作中的复杂技术问题,提升测试效能、加深质量工作技术积累。
千问学习算法团队致力于使用AI技术重塑面向未来的学习体验。在这里您将与我们一起挑战前沿的产品技术问题,并收获服务千万级用户的成就感和影响力。 核心职责: 1. 主导教育场景下多模态大模型(文本/图像/视频)的全流程算法研发工作,包括数据构建、指令微调、RLVR、RLHF等关键环节 2. 针对教学场景设计专属后训练与微调方案(如解题步骤生成、作业批改、互动答疑等),提升核心模型的专业性与可用性 3. 跟进业界最新进展和SOTA模型和算法,并与教育场景特点进行深度结合,推动智能化教学和个性化学习落地

千问学习算法团队致力于使用AI技术重塑面向未来的学习体验。在这里您将与我们一起挑战前沿的产品技术问题,并收获服务千万级用户的成就感和影响力。 核心职责: 1. 主导教育场景下多模态大模型(文本/图像/视频)的全流程算法研发工作,包括数据构建、指令微调、RLVR、RLHF等关键环节 2. 针对教学场景设计专属后训练与微调方案(如解题步骤生成、作业批改、互动答疑等),提升核心模型的专业性与可用性 3. 跟进业界最新进展和SOTA模型和算法,并与教育场景特点进行深度结合,推动智能化教学和个性化学习落地