logo of kuaishou

快手(大模型专项)大模型算法测试工程师

社招全职1年以上D2863地点:北京状态:招聘

任职要求


1、计算机/人工智能相关专业本科及以上学历; 
2、优秀的代码基础,至少掌握一门高级语言, 包括PythonC/C++、 Java、OC ;…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与生成式AI算法相关项目的算法效果评测,找出优化点引导算法改进;
2、负责算法工程平台、业务落地的质量保障工作,包括但不限于工程平台的功能测试、算法全链路服务的压力测试等; 
3、紧跟AI算法行业前沿,调研行业生成式算法评价方法,并根据项目实际情况持续优化已有的评测方案。
包括英文材料
学历+
Python+
C+
还有更多 •••
相关职位

logo of transsion
校招

1. 负责大模型算法测试工作,包括测算法指标制定、测试用例设计、测试数据管理、测试工具开发、测试流程回归等,大模型测评; 2. 构建测试大模型,应用通用大模型来做测试效率提升探索和应用; 3. 参与大模型应用整体架构设计与技术评审、测试方案的制定和测试执行; 4. 负责大模型应用相关的测试服务建设,包括自动化测试、各类质量专项、性能测试、高可用测试等;

更新于 2025-08-18上海
logo of transsion
社招8年以上

1. 负责搭建算法测试体系,建立规范化、制度化的测试流程及规范; 2. 负责AI算法、Al应用等研发过程中的测试工作,包括测算法指标制定、测试用例设计、测试数据管理、测试工具开发、测试流程回归等; 3. 参与大模型应用整体架构设计与技术评审、测试方案的制定和测试执行; 4. 负责大模型应用相关的测试服务建设,包括自动化测试、各类质量专项、性能测试、高可用测试等;

更新于 2025-02-08上海|重庆
logo of tencent
社招3年以上混元-模型算法技

1.协助理解大模型业务需求、场景边界及变更诉求,参与梳理核心质量指标,配合完成需求拆解与测试范围界定,保障测试工作贴合业务目标; 2.参与大模型测试用例设计,覆盖正常 / 异常 / 边界 / 高并发场景,配合完成测试策略梳理与执行计划落地; 3.负责大模型测试执行工作,包含 RL+agent 流程校验、链路质量、协议兼容、推理性能、模型效果等专项测试; 4.作为测试执行对接人,配合模型效果评估团队落实测试标准与数据对接,协同研发、产品、运维团队跟进问题定位、整改及闭环; 5.参与测试用例库、测试流程的沉淀与优化,协助推进测试自动化落地;跟进线上质量问题,配合完成根因分析与改进落地。

更新于 2026-04-02北京
logo of amap
实习高德研究型实习生

【高德交通智能部】寻找AI造梦师!加入极客天团,用代码重塑未来出行 ▍团队故事: 我们是高德地图的的硬核极客天团,过去四年连续解锁交通科技树: ✓ 2021年 全球首个分钟级交通事件检测引擎(让堵车预警快过刷朋友圈) ✓ 2022年 红绿灯倒计时黑科技(拯救千万路怒症的神级操作) ✓ 2023年 V2X车车对话系统(让汽车学会"社牛"沟通) ✓ 2024年 AI领航红绿灯(比驾校教练更懂路的老司机) ✓ 2025年 TrafficVLM 上线(高德地图“天眼”功能) 现在,我们正在构建智能交通宇宙,等你来编写核心算法剧本! 岗位职责: 1. 构建下一代TrafficVLM:运用SFT和强化学习技术打造能理解复杂交通场景的多模态大模型 2. 设计创新的思维链(COT)框架:解决交通流量预测、事故处理等复杂推理任务 3. 建立行业领先的评估体系:开发针对交通场景的大模型专项评估指标和测试平台 4. 探索RL与LLM的融合应用:通过强化学习持续优化模型在动态交通环境中的表现 💡 我们期待你: • 对AI技术充满热情,渴望将实验室技术转化为实际生产力 • 在大模型某个技术方向(SFT/RL/Agent/COT等)有深入理解或实践经验 • 喜欢解决开放性问题,能够独立思考和探索创新方案 • 具备优秀的工程实现能力或扎实的理论研究基础

更新于 2025-10-23北京