logo of mi

小米Agent评测产品经理-2027届

实习兼职地点:北京状态:招聘

任职要求


1.文学、哲学、心理学、数学、物理、化学、生物、医学、计算机、工程等相关领域,本硕博均可。
2. 较强的动手能力和学习意愿,会使用coze、dify…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们正在寻找专注于提升小米全系列产品中大模型应用策略产品实习生,重点优化模型在知识百科、新闻时事、生活服务、学习办公、AI创作、营养健康、学科教育、AI编程、情感陪伴、智能家居等场景的理解与推理能力,推动大模型在复杂综合问题上的表现。
1. 研究用户需求:研究用户在知识百科、新闻时事、生活服务、学习办公、AI创作、营养健康、学科教育、AI编程、情感陪伴、智能家居等场景的真实需求,明确对大模型能力的要求。
2. 开发科学基准测试:定义接近用户真实体感的体验评估标准,构建科学的评测方法,衡量模型在复杂用户场景中的表现。
3.构建各种自动评测能力:参考用户场景和行业benchmark,构建小爱各场景的自动评测能力。
包括英文材料
大模型+
相关职位

logo of alibaba
实习阿里国际2026

阿里国际数字商业集团 -国际贸易事业部 Accio 团队 我们是阿里国际数字商业集团 - 国际贸易事业部 (ICBU)-Accio 团队。Accio 作为全球首个跨境领域的 AI 采购引擎,致力于让采购变得高效,让 B2B 外贸如零售般便捷。依托 25 年跨境采购经验、海量零售数据及专业分析,Accio 以 AI 搜索为核心,提供专业、高效、可信任的全球寻源找挑比价的服务。 岗位职责 1. 深度挖掘场景与用户需求,精准定位产品优化与创新方向,提升用户价值与产品竞争力。 2. 协同算法、开发、测试团队,精准把控产品进度,保障产品体验与项目按时推进。 3. 密切关注大模型技术与跨境电商动态,探索产品化及业务流程优化的落地机遇。 岗位要求 在这里,你将参与到LLM、多模态、Agent前沿技术的应用中,与之共同成长。发挥你的学习能力、创新思维、商业才能,亦或是对某个细分领域的深度理解,用新技术打造新体验、创造新市场。Accio 团队期待你的加入,一起推动业务迈向新高度!

更新于 2025-05-16杭州
logo of bytedance
实习A241565

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动内部创新业务团队,专注研究新技术赛道相关领域产品,落地AI智能化创新。 1、从用户视角定义产品体验,并细化到对模型效果的理想态定义和评测标准制定; 2、负责构建大模型在真实应用场景下的效果评估体系,产出稳定可信的评测结论;能够从用户反馈、模型行为观察、研究侧目标中提炼评估方向,并提出可落地的模型能力提升与应用体验优化策略,推动模型和产品迭代; 3、与研发、数据科学、用户研究等团队紧密协作,基于线上观测、实验结果和用户访谈,识别模型缺陷与改进机会,并给出可执行的优化方向与评估策略; 4、负责推动跨团队协作闭环,统筹评估目标、资源优先级与落地节奏,确保关键模型行为、风险点、用户体验问题能够被快速验证、追踪与优化; 5、持续跟进业界评测研究与方法论,结合真实业务场景迭代方案,探索更反映真实用户体验和价值的评测方法。

更新于 2026-03-26北京
logo of bytedance
实习A247254

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。 团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。 1、评测体系建设:参与大模型评测的工程基础设施的开发工作,包括评测集的接入、生产、管理,评测对象的链路采样,人评/机评能力建设,评估结果的分析等评测核心能力的开发工作; 2、评测Agent搭建:探索自动评测、高质量评测集构建等前沿评测方法,在评测场景搭建AI Agent,为评测业务提供端到端的高效、自动化的交付能力。

更新于 2026-04-16北京
logo of bytedance
实习A97144

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。 团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。 1、负责大模型自动化评测研发工作,将各类评测集在内部平台集成开发,助力模型在各垂类方向的能力提升; 2、负责训练数据的有效性验证工作,通过模型训练、构建Agent等方式,判别有效训练数据,助力模型能力提升; 3、调研公开文献、公开评测集、训练方法,参与自建评测集等探索类工作,优秀成果可以支持学术论文发表; 4、探索智能、高效的模型评估和训练方案,主导开发相关工具。

更新于 2026-04-15北京