百度大模型评估产品经理实习生(J89147)
任职要求
-本科及以上学历在校生,具备AI/NLP/数据产品背景优先 -可尽快到岗,线下实习4个月及以上,每周至少出勤4天 -具备模型评估或AI相关产品设计经验,熟悉大模型及其评估流程 -具备出色的产品规划和需求分析能力,逻辑清晰,能将复杂流程产品化 -对数据可视化、结果解读、趋势分析有一定经验 -良好的跨团队沟通与推动力,能协调不同角色高效合作 -责任心强,持续学习新技术新趋势
工作职责
-跟踪业界评估平台与工具趋势,能提出先进的评估指标、产品功能、实现方案等,帮助各方更准确理解评估结果 -负责评估产品的设计与持续迭代,深度调研用户需求,提升评估平台的易用性和科学性 -能系统梳理评估全流程,包括样本管理、评测执行、结果可视化、趋势对比和多维度分析等核心功能 -跟进行业领先的评估研究方向,推动开发团队高效的功能落地
-研究与设计大语言模型的评估方法与策略,跟踪业界最新研究进展,探索更高效、精准的评估体系 -参与benchmark的构建、分析和优化评估方法的区分度、稳定性与公允性,涵盖通用能力、垂直领域和多模态等维度 -研究评估自动化前沿方法,参与流程设计与开发 -与模型训练、产品、算法等多团队密切协作,推动评估体系与模型迭代紧密联动
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:飞书作为先进的企业协作与管理平台,是字节跳动在B端与企业服务领域的重要布局。不仅一站式整合办公协作套件,更提供高效的组织管理、业务管理和 AI 智能伙伴等先进工具,帮助组织和个人为 AI 时代做好准备。各行业越来越多先进企业,都选择与飞书共创行业最佳实践。先进团队,先用飞书。 1、参与飞书AI相关的产品规划和设计,结合用户需求与AI技术提出创新方案; 2、负责飞书内大模型相关 AI 应用场景的效果提升; 3、负责飞书内大语言模型评估体系、评测集设计和研发,并基于评测制定优化方案; 4、飞书业务内大语言模型训练过程中每个阶段数据质量评估,确保大语言模型训练数据的有效性。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:飞书作为先进的企业协作与管理平台,是字节跳动在B端与企业服务领域的重要布局。不仅一站式整合办公协作套件,更提供高效的组织管理、业务管理和 AI 智能伙伴等先进工具,帮助组织和个人为 AI 时代做好准备。各行业越来越多先进企业,都选择与飞书共创行业最佳实践。先进团队,先用飞书。 1、参与飞书AI相关的产品规划和设计,结合用户需求与AI技术提出创新方案; 2、负责飞书内大模型相关AI应用场景的效果提升; 3、负责飞书内大语言模型评估体系、评测集设计和研发,并基于评测制定优化方案; 4、飞书业务内大语言模型训练过程中每个阶段数据质量评估,确保大语言模型训练数据的有效性。