百度LLM策略产品经理实习生(J90438)
任职要求
-计算机、统计学、数学、人工智能等相关专业本科及以上学历在校生;如具备扎实的计算机基础(如数据结构与算法、机器学习、深度学习、软件工程等)和强烈的AI兴趣可适当放宽专业要求 -熟练使用 Python 作为日常工作语言,具备英文文献阅读与日常交流能力 -日常使用至少一个大模型产品(如 ChatGPT、Gemini 等),具备使用大模型进行查询、调研、代码生成的实践经验;能在较短时间内构建出满足需求的初步解决方案 -具备较大规模数据分析的能力与经验。 -具备良好的自…
工作职责
-深入理解客户场景,将客户需求进行分类并抽象为标准任务类型 -将客户洞察映射至预训练或微调数据中,提升模型在客户评估中的表现 -基于客户/业务需求,结合ACG模型研发部的大模型能力,与大模型数据工程师、算法工程师密切合作,制定策略方案,提升多模态模型或推理模型在具体场景中的适配能力与表现 -协助构建“客户需求 ↔ 模型能力 ↔ 数据反馈”闭环,推动模型在真实业务中的应用效果最大化
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 1、内容理解:完成不同画风内容的筛选和提炼,并能总结出对应规则; 2、模型对接:通过案例复盘做准召判断,和推荐算法/研发等团队对接上线模型; 3、作者分析:热爱欧美文化,能够通过数据手段挖掘以及定位目标作者,完成作者投稿内容分析。
-关注大模型在应用中的模型效果问题,能深入分析提炼评价体系,并与算法策略团队推进模型效果迭代 -调研并分析大模型落地应用情况,根据客户输入及数据分析提炼效果优化点,主动发现并抽象问题 -辅助建设并持续完善大模型在具体场景的效果评估体系,支持高质量数据集建设,推进大模型效果持续提升 -参与设计大模型在常见行业领域的应用范式,总结最佳实践,帮助客户快速提升大模型效果
-研究与设计大语言模型的评估方法与策略,跟踪业界最新研究进展,探索更高效、精准的评估体系 -参与benchmark的构建、分析和优化评估方法的区分度、稳定性与公允性,涵盖通用能力、垂直领域和多模态等维度 -研究评估自动化前沿方法,参与流程设计与开发 -与模型训练、产品、算法等多团队密切协作,推动评估体系与模型迭代紧密联动
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动内部创新业务团队,专注研究新技术赛道相关领域产品,落地AI智能化创新。 1、从用户视角定义产品体验,并细化到对模型效果的理想态定义和评测标准制定; 2、负责构建大模型在真实应用场景下的效果评估体系,产出稳定可信的评测结论;能够从用户反馈、模型行为观察、研究侧目标中提炼评估方向,并提出可落地的模型能力提升与应用体验优化策略,推动模型和产品迭代; 3、与研发、数据科学、用户研究等团队紧密协作,基于线上观测、实验结果和用户访谈,识别模型缺陷与改进机会,并给出可执行的优化方向与评估策略; 4、负责推动跨团队协作闭环,统筹评估目标、资源优先级与落地节奏,确保关键模型行为、风险点、用户体验问题能够被快速验证、追踪与优化; 5、持续跟进业界评测研究与方法论,结合真实业务场景迭代方案,探索更反映真实用户体验和价值的评测方法。