logo of liauto

理想汽车大模型评测工程师

校招全职软件测试地点:北京状态:招聘

任职要求


1.硕士及以上学历,计算机相关专业,1-3年测试/算法开发工作经验;
2.对大模型算法底层原理有一定的掌握,有语言大模型/AIGC相关类产品测试、研发、评测经验者优先;有算法开发经验者优先;
3.有极强的质量把控能力,对于质量是否过关进行准确及时的判断,能够快速总结,分析,归纳产品存在…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责大模型评测体系建设,包含评测集管理、评测流程建设、评测工具需求制定及开发落地;
2.负责大模型评测,包含制定测试方案、测试指标定义,测试集数据建设、测试执行并输出专业测试报告;
3.评测技术的持续迭代和优化,能通过Prompt工程或自训练算法模型等AI手段,建设提升大模型评测能力,并负责相关自动化测试工具开发及维护, 最大化提高测试效率
4.站在用户角度,对产品、研发提出建设性的意见,在测试参与的各个流程中以用户视角保证产品体验
5. 调研行业先进AI技术,并推动落地在实际项目中。
包括英文材料
学历+
算法+
还有更多 •••
相关职位

logo of ke
社招3年以上质量架构部

1.参与基于多模态大模型的GUI智能化能力的设计开发,实现多端(web/安卓/ios/鸿蒙/小程序)大模型手眼配套能力全覆盖; 2.跟踪业界前沿技术发展,参与大模型应用评测、企业内部场景化落地、GUI智能体建设等;

更新于 2025-03-27北京
logo of alibaba
社招3年以上技术类-前端

1.负责alibaba国际站 数字营销的前端架构设计及研发,保障系统的安全、可扩展以及质量和性能,与PD、UED、Java 工程师协作,完成设计交互实现、数据交互、动态信息展现 2.关注用户体验,与合作方一起不断改进产品的易用性;运用AI能力重塑 广告后台BP、广告前台创意 的产品形态,提升用户体验和客服效能 3.研究和探索创新的开发思路和新的前端技术,结合业务特点创新应用AI技术,解决前端团队开发过程中面临的各类问题,提升个人和团队的开发效能 4.参与跨境B类全球化创意中心的规划建设,包括可视化制作、可视化渲染、D2C、自动化审核、自动化生产、智能诊断等,推动协助相关团队并落地未来产品和系统规划

更新于 2025-04-02杭州
logo of baidu
社招MEG

-负责百度产品的测试工作和参与自动化测试服务平台开发 -根据产品需求对服务端系统进行测试,包括测试设计、执行、BUG提交和追踪,测试报告等 -开发测试工具和自动测试框架、自动测试脚本,进行自动化测试 -对项目开发流程和工具进行优化,提高RD和整个项目的交付效率 -为开发组开发和维护高效的持续集成、测试框架和工具,提高开发工作效率和提测代码质量,并参与代码评审 -协助开发定位问题 -根据项目过程中的体验对产品提出改进建议以提升用户感受,并进行竞品对比评测 -学习和研究新技术以提高测试的效率和质量,满足质量保证的需求

更新于 2025-04-10北京
logo of xiaohongshu
社招后端开发

1、参与大模型在公司效能领域的应用落地,包括使用开源模型或者API搭建大模型应用架构、评测体系建设、智能体建设、智能CR、智能问答、测试用例生成等; 2、学习跟踪业界大模型在效能领域的最新进展,并探索大模型在公司效能方向的机会点和提升改进落地效果;

上海|北京