
商汤研究院-大模型评测实习生
社招全职技术族-实习地点:上海 | 深圳 | 香港状态:招聘
任职要求
1、学历背景:具备专业一个或多个领域知识,如计算机、中文、英文、金融、法律等。 2、技能与工具:能熟练应用测试工具和自动化脚本。 3、软实力与学习能力:具备强大的问题分析和解决能力,能够在压力下快速学习新的知识和技能。同时,思维敏捷、创新性强,能够从不同角度思考问题,并给出创造性的解决方案。 4、可以长期实习优先。
工作职责
1、产品评测与数据管理:负责大模型产品的全面评测工作,包括数据集的设计、构建和管理,以及 prompt 的深入挖掘和分析。 2、测试结果分析与报告撰写:负责测试结果的详细记录、数据的整理和分析,并根据分析结果撰写清晰、准确和具有洞察力的测试报告。 3、跨部门协作:与算法和研发团队保持紧密联系,共同解决模型运行过程中遇到的挑战。提供模型badcase的跟踪、修复与验证。
包括英文材料
学历+
脚本+
[英文] Scripting language
https://en.wikipedia.org/wiki/Scripting_language
https://zhuanlan.zhihu.com/p/571097954
一个脚本通常是解释执行而非编译。脚本语言通常都有简单、易学、易用的特性,目的就是希望能让程序员快速完成程序的编写工作。
相关职位

实习技术族-实习
1、产品评测与数据管理:负责大模型产品的全面评测工作,包括数据集的设计、构建和管理,以及 prompt 的深入挖掘和分析。 2、测试结果分析与报告撰写:负责测试结果的详细记录、数据的整理和分析,并根据分析结果撰写清晰、准确和具有洞察力的测试报告。 3、跨部门协作:与算法和研发团队保持紧密联系,共同解决模型运行过程中遇到的挑战。提供模型badcase的跟踪、修复与验证。
更新于 2025-05-09

实习技术族-实习
1. 与研究员合作针对集团的生成式AI业务板块中共性痛点和挑战性问题研发创新性解决方案; 2. 与研究员合作做某一细分领域算法或系统的深入研究,例如但不限于数学和逻辑推理数据合成,推理强化学习等; 3. 与研究员合作维护相关研究方向的基准(如代码、评测集等),将创新算法沉淀为论文、技术报告或专利。
更新于 2025-05-09