小红书大模型评测实习生
实习兼职模型标注地点:北京状态:招聘
任职要求
1、本科及以上学历,经济学、哲学、逻辑学、商业分析、艺术审美、文学、汉语言文学等相关专业,交叉专业不同或本硕专业不同优先考虑;
2、有较强的理解能力和逻辑思维能力…登录查看完整任职要求
微信扫码,1秒登录
工作职责
岗位职责: 1、梳理和解读大模型相关的评测业务,辅助进行定制化的评测框架体系构建,完善内部评测机制; 2、针对交付评测数据进行数据验收,反馈指标以及数据问题,引导评测同学进行质量提升; 3、针对市场上大模型相关应用进行摸底调研,结合内部模型方向给到模型优化改进意见;
包括英文材料
学历+
相关职位

社招技术族-实习
1、产品评测与数据管理:负责大模型产品的全面评测工作,包括数据集的设计、构建和管理,以及 prompt 的深入挖掘和分析。 2、测试结果分析与报告撰写:负责测试结果的详细记录、数据的整理和分析,并根据分析结果撰写清晰、准确和具有洞察力的测试报告。 3、跨部门协作:与算法和研发团队保持紧密联系,共同解决模型运行过程中遇到的挑战。提供模型badcase的跟踪、修复与验证。
更新于 2025-05-09上海|深圳|香港

实习技术族-实习
1、产品评测与数据管理:负责大模型产品的全面评测工作,包括数据集的设计、构建和管理,以及 prompt 的深入挖掘和分析。 2、测试结果分析与报告撰写:负责测试结果的详细记录、数据的整理和分析,并根据分析结果撰写清晰、准确和具有洞察力的测试报告。 3、跨部门协作:与算法和研发团队保持紧密联系,共同解决模型运行过程中遇到的挑战。提供模型badcase的跟踪、修复与验证。
更新于 2025-11-03上海|深圳|香港
实习车辆控制
1. 参与多模态(文本、语音、图像)模型评测; 2. 针对大模型在实际业务中的落地场景(如代码生成、知识问答、长文本摘要),设计测试用例,定位模型幻觉、偏见、安全性等问题; 3. 研究并扩展评测数据集,构建多样化业务场景; 4. 前沿技术研究与创新,跟踪大模型评测领域最新进展。
北京