美团大模型评测产品经理

社招全职核心本地商业-基础研发平台2025-04-29地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1.具备较强的产品思维和用户导向，能够深入理解需求并转化为产品的功能和设计。
2.具备数据分析和问题解决的能力，有较强的数据敏感性，善于通过数据总结问题，并提出改进策略。
3.对大模型技术有一定的了解，能够理解和解释技术实现的原理和方法。
4.具备优秀的沟通与协调能力，具备…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.基于市场调研和需求分析，结合算法及工程能力，设计和优化评测社区的功能、架构、交互，并为社区活跃指标负责。
2.结合大模型不同维度的能力和应用场景，模型调用日志等数据分析，优化人机交互的大模型评测策略，提升当前大模型评测的科学性、全面性和置信度。
3.结合主线及专项的评测目标和训练协同方目标，在包括但不限于评测数据建设、高质量用户触达、用户人工评测结果收集等方面完成提效，持续收集用户反馈，迭代指标体系及评估方法。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

数据分析+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

大模型评测产品经理

社招A148949

1、负责大模型评测平台的全生命周期的产品规划、设计与推动落地，平台为大模型基座及抖音内各场景效果的评测服务，平台能力包括标准的管理、数据标注/生成、自动投放、智能化评测能力等； 2、深入理解大模型预训练语言模型，与评测团队一起建设科学、公允、客观的大模型评测体系； 3、判断行业发展趋势，结合最前沿的技术和产品形态，打造标杆性的大模型评测产品； 4、探索创新型算法评测方法，包括大模型的自动化标注，对抗模型等能力。

更新于 2024-01-31北京

大模型评测产品经理（创作方向）-豆包

社招A218409

1、负责豆包应用的评测的体系设计、执行与结论分析，提出有价值的改进建议，进而提升大语言模型效果与应用体验； 2、评测的体系设计：充分理解用户需求，并制定合理的评测标准、题目与指标体系； 3、评测的落地执行：既能统筹规模化运营团队进行人工评测，也能设计Workflow/Agent进行自动评测； 4、评测的结论分析：能给出清晰、有逻辑的评测结论，并从模型视角结出优化建议。

更新于 2025-04-25北京

大模型评测产品经理实习生-抖音/抖音火山版/剪映/直播

实习A167400A

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。团队介绍：互娱研发-质量保障部门负责抖音、抖音火山版、今日头条、直播、搜索、剪映等多款产品的质量保障工作，截止2020年8月，抖音连同抖音火山版在内，日活用户超6亿，并继续保持高速增长。加入我们，你会支持包括但不限于上述产品的质量保障工作，共同建立完善的质量保障体系，提升产品质量和效率。 1、参与大模型评测平台的全生命周期的产品规划、设计与推动落地，平台为大模型基座及抖音内各场景效果的评测服务，平台能力包括标准的管理、数据标注/生成、自动投放、智能化评测能力等； 2、深入理解大模型预训练语言模型，与评测团队一起建设科学、公允、客观的大模型评测体系； 3、探索创新型算法评测方法，包括大模型的自动化标注，对抗模型等能力。

更新于 2024-08-09北京

高德-投放平台产品经理-北京

社招5年以上产品类-平台型

1、平台产品设计：熟悉广告投放原理和算法推荐原理，负责内投平台（包括但不限于端内各资源位、push、短信、厂商终端资源位）的产品规划和设计、推动研发落地；熟悉投放计划管理、优先级/竞价等投放策略、人群定向、个性化智能创意、资源位频控管理等，搭建智能化一体化投放平台。 2、平台流量业务：深入了解用增、广告、行业各部门业务方对平台的使用目标与流量诉求。产品化沉淀用增策略和高低频行业广告投放策略。支撑业务目标达成，保证平台的易用性、可扩展性和整体流量效率。 3、媒体外投产品：作为广告主侧对接外部媒体平台，达成预设成本及ROI下的投放目标。曾实操过RTA定向、oCPX智能回传等媒体对接链路，同时负责面向媒体和代理的投放数据对接和展示。 4、资源项目管理：负责产品项目资源协调和进度把控，拉通运营、业务、工程引擎、算法等多个部门，周期性有序迭代，有效判断、和推动解决各方高优先级问题。

更新于 2026-04-01北京