logo of liauto

理想汽车大模型评测工程师

校招全职软件测试地点:北京状态:招聘

任职要求


1.硕士及以上学历,计算机相关专业,1-3年测试/算法开发工作经验;
2.对大模型算法底层原理有一定的掌握,有语言大模型/AIGC相关类产品测试、研发、评测经验者优先;有算法开发经验者优先;
3.有极强的质量把控能力,对于质量是否过关进行准确及时的判断,能够快速总结,分析,归纳产品存在的问题。对于common case和corner case有极强的设定和测试能力;
4.精通至少一门开发语言,如Python/Java等,具备较好的开发能力;
5.思维敏捷,为人谦逊,有较强的问题定位、风险评估、质量分析能力,较好的推动能力,能协调各个角色进行问题解决,结果导向,自驱;

工作职责


1.负责大模型评测体系建设,包含评测集管理、评测流程建设、评测工具需求制定及开发落地;
2.负责大模型评测,包含制定测试方案、测试指标定义,测试集数据建设、测试执行并输出专业测试报告;
3.评测技术的持续迭代和优化,能通过Prompt工程或自训练算法模型等AI手段,建设提升大模型评测能力,并负责相关自动化测试工具开发及维护, 最大化提高测试效率
4.站在用户角度,对产品、研发提出建设性的意见,在测试参与的各个流程中以用户视角保证产品体验
5. 调研行业先进AI技术,并推动落地在实际项目中。
包括英文材料
学历+
算法+
大模型+
Python+
Java+
相关职位

logo of kuaishou
社招3-5年D13923

1、负责大模型(包括不限于T2V、I2V、MLLM模型)评测工作和评测体系建设,包括设计制定和完善评测方案、评测指标、评测数据收集和更新、评测执行,并输出专业评测报告; 2、参与评测相关自动化评测工具开发及维护,最大化提高评测效率; 3、以算法手段,对基座大模型和AI Native应用进行分阶段、端到端评测; 4、参与构建评测Agent工具链、对战平台、模型竞技场、模型效果判别模型、应用数据飞轮等工具链建设; 5、站在用户角度,对产品、算法发提出建设性的意见,在评测参与的各个流程中以用户视角保证产品体验。

更新于 2025-08-11
logo of kuaishou
社招3-5年D13923

1、以算法视角,参与快手大模型(包括不限于LLM,T2I,T2V、I2V、MLLM模型)评测工作和评测体系建设; 2、参与评测相关自动化评测工具开发及维护,最大化提高评测效率。

更新于 2025-08-11
logo of kuaishou
校招J1017

1、参与快手大模型(包括不限于大语言模型,文生图模型,文生视频模型和多模态大模型)日常评测工作和评测体系建设; 2、参与评测方案的持续迭代和优化,通过Prompt工程、自训练算法模型、NLP模型等手段,建设提升大模型评测能力; 3、参与快手大模型相关应用的迭代和效果优化,调研行业先进AI技术,并推动落地在实际项目中; 4、与相关上下游团队密切配合,评估模型效果、给出迭代建议、明确优化方向,从评测视角持续帮助模型能力提升。

更新于 2025-08-04
logo of kuaishou
社招3-5年D13923

1、负责大模型(包括不限于T2V、I2V、MLLM模型)评测工作和评测体系建设,包括设计制定和完善评测方案、评测指标、评测数据收集和更新、评测执行,并输出专业评测报告; 2、参与评测相关自动化评测工具开发及维护,最大化提高评测效率; 3、参与构建评测Agent工具链、对战平台、模型竞技场、模型效果判别模型、应用数据飞轮等工具链建设; 4、站在用户角度,对产品、算法发提出建设性的意见,在评测参与的各个流程中以用户视角保证产品体验。

更新于 2025-09-19