夸克夸克-视觉问答产品经理-北京
任职要求
1、3年以上多模态大模型应用或图片搜索类产品经验(ToC),持续深度理解多模态大模型技术原理应用者优先。 2、具备敏锐的市场洞察力、逻辑分析能力,能够准确…
工作职责
1. 建设对照物理世界提问的视觉问答(VQA)能力,基于用户需求和大模型发展的判断,制定迭代策略,提升对视觉画面和用户需求的深度理解 2. 基于用户需求目的和VQA能力现状定义理想体验,探索迭代文本回复质量,引入并组织多模态内容 3. 可独立完成市场跟踪、需求调研、产品设计,高质量完成项目落地,并通过效果分析,迭代推动目标的达成产品全生命周期 4. 跨团队项目管理:协调并整合算法、设计、用增、市场等各方资源,确保产品顺畅推进和持续增长。

1、构建覆盖运动指导场景的AI Agent评测框架,制定专业指标(如动作规范性判断准确率、训练计划科学性评分); 2、模型能力的持续验证与优化,设计运动领域测试用例(如训练方案、运动咨询/指导问答);主导多模态Agent(文本/语音/视觉)在真实运动场景的评测并输出评测报告; 3、行业技术前瞻研究,跟踪Agent平台(Dify/Coze等)新功能,探索运动垂类适配方案;研究LLM、知识图谱与运动生理学数据的融合应用。
- 业务主要内容:负责百度搜索多模态检索效果优化,深度参与多模态生成式大模型的算法研发与技术创新,重点应用于智能识图、图文问答、AI解题等场景 - 重点研究方向:工作涉及大模型、多模态、生成式、预训练、计算机视觉及基础NLP领域的前沿研究与应用 - 算法研究与创新:持续跟踪学术界与工业界技术动态,探索前沿算法在搜索场景的落地,设计并实现创新性搜索策略,推动搜索技术持续进步 - 跨团队协作:与产品经理、数据科学家、工程师等跨职能团队紧密协作,确保算法方案高效落地并产生实际业务价值
-负责百度搜索多模态检索效果优化,深度参与多模态生成式大模型的算法研发与技术创新,重点应用于智能识图、图文问答、AI解题等场景 - 重点研究方向:工作涉及大模型、多模态、生成式、预训练、计算机视觉及基础NLP领域的前沿研究与应用 - 算法研究与创新:持续跟踪学术界与工业界技术动态,探索前沿算法在搜索场景的落地,设计并实现创新性搜索策略,推动搜索技术持续进步 - 跨团队协作:与产品经理、数据科学家、工程师等跨职能团队紧密协作,确保算法方案高效落地并产生实际业务价值
团队介绍:推荐架构团队支撑字节跳动旗下多款APP产品,如抖音、今日头条、番茄小说、西瓜视频、剪映等推荐系统架构的设计和开发,保障系统的稳定和高可用,致力于抽象系统通用组件和服务,建设推荐中台、数据中台;关于在线服务,在这里你有机会参与大规模机器学习在线预估框架的研发与优化,也有机会参与模型训练与调度等相关问题的研究与突破,解决系统瓶颈,降低成本开销;如你对大数据感兴趣,在这里也有机会参与通用实时计算系统的开发、构建统一的推荐特征中台,为推荐业务实现先进的消重、计数、特征服务等;我们期待热爱技术的你加入,一起创造更多可能。 课题介绍: 在人工智能技术高速发展的背景下,推荐系统作为信息过滤与个性化服务的核心,面临多重挑战: 一方面,推荐系统自身的复杂性急剧增加。大量推荐策略不断演进迭代、且系统状态动态变化,但缺乏有效手段自动跟踪评估策略有效性并下线低 ROI 策略,导致系统存在较多低效策略。同时,推荐系统依赖多种基础组件,其复杂负载模型给底层组件参数配置和性能调优带来巨大困难,日常开发迭代中的问题排查等工作消耗大量人力,亟需提升开发效率、降低人力成本。 另一方面,随着电商行业等领域的激烈竞争,传统推荐系统在多样性、创新性和个性化方面的短板愈发凸显,难以满足用户日益增长的多元需求。生成式人工智能技术虽带来新突破,但在实际应用中面临成本效率、全域数据协同、数据隐私与安全以及技术变革应对等诸多难题。 课题内容: 1、策略管理与优化:构建一套智能化系统,实现推荐策略的规范化定义、长期及离线评估、无效策略自动识别与下线,以及相关代码配置的下线; 2、自适应调优与故障诊断:针对推荐系统多样化业务负载,利用大模型能力完成系统及底层组件的参数和配置调优,并探索自适应故障诊断方案,提供全局视角的故障追踪、定位和分析能力; 3、成本与效率平衡:在推荐系统应用生成式技术时,解决模型训练和运行的高成本问题,平衡成本与效率,在有限资源下实现高效推荐; 4、全域数据处理:应对电商等横向全域场景下海量异构数据,提升和保障数据质量与准确性,标准化供给数据给全域推荐模型,并实现低成本跨端服务,同时,确保数据隐私与安全,合规使用数据; 5、多模态数据表征和 RAG 应用系统:应对推荐、检索、问答、创作场景的多模态数据需求,提供数据理解、预处理、索引、召回环节的完整解决方案,提供知识、记忆服务能力,并针对各类大小模型负载进行系统优化,最大化信息处理效率和精度。