logo of baidu

百度大模型推理产品经理(J100511)

实习兼职ACG地点:北京状态:招聘

任职要求


-具备大模型领域的基础认知,理解推理性能优化、KV Cache、Prefill-Decode(PD)分离等关键技术点,熟悉主流开源模型(如GLM、DeepSeek等)的架构特点与性能优势
-对Token经济或SaaS订阅制…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-模型推理服务产品设计:参与千帆MaaS平台的推理服务产品建设,协助设计API调用、控制台、性能监控等功能模块。调研开发者对模型推理的需求,输出竞品分析与用户需求文档
-订阅制产品体系建设:协助设计面向企业/个人的订阅制套餐,参与定价策略、配额管理、账单结算流程的产品设计。跟进订阅制用户生命周期管理,包括免费试用、续费提醒、升级引导等转化路径优化
-跨团队协作与落地推进:与算法、工程、运营团队紧密配合,推动推理服务性能优化与订阅系统开发上线。收集用户反馈与数据埋点,通过分析调用量、留存率、转化率等指标,迭代产品功能
-文档与市场支持:撰写推理服务API文档、订阅套餐说明、最佳实践指南,协助解答客户推理相关问题
包括英文材料
大模型+
缓存+
还有更多 •••
相关职位

logo of sensetime
社招1年以上技术产品管理

1.负责公有云AI计算类产品的规划和落地,主要负责容器推理产品设计; 2.积极与客户沟通,深入探索大模型推理算力产品建设; 3.熟悉各类GPU在推理细分场景的优劣势,能针对不同用户场景,拉通研发团队给与针对性优化建议; 4.产品PRD设计基本功扎实,重视用户体验。

更新于 2025-08-15上海
logo of sensetime
社招3年以上产品管理

工作职责 1、负责AI推理场景下的API服务平台的产品设计与规划,包括模型推理接入、性能优化策略、部署平台、模型API定义与优化,推动推理性能与服务体验的持续提升。 2、负责大模型生命周期管理,主导大模型API产品上下架及迭代维护工作,持续跟踪API性能表现,确保服务达标,联动运营团队优化资源利用率及成本结构 3、与销售、市场、技术等团队紧密合作,推动产品在客户侧的有效落地,为客户提供专业支持,深入分析客户实际场景和需求,提供最优产品路径与最佳实践; 4、建立产品SLA标准,明确产品核心指标,并定期展开对国内外大模型产品服务的测试和研究,持续提升用户体验和市场竞争力;

更新于 2026-05-19北京
logo of bytedance
社招3年以上A235611

1、负责公有云IaaS异构计算(CPU/GPU/NPU/FPGA等)产品的系统优化与产品设计规划工作; 2、推动异构计算产品与最新AI技术(如P/D分离、vLLM、SGLang、强化学习等)的深度融合(如模型训练加速、推理优化),提升GPU资源部署效率、使用效率、降低硬件适配成本; 3、推动异构算力适配层建设,提供标准API接口屏蔽底层硬件差异,降低业务开发复杂度; 4、跟踪业界最新模型发展趋势(如MoE架构、端侧大模型),推动异构产品与最新技术趋势的协同创新; 5、探索异构计算与行业场景(如具身智能、自动驾驶)的融合方案,推动生态合作与技术标准共建; 6、参与开源社区建设,建设在AI加速框架(如vLLM)与AI加速库领域的业界影响力。

更新于 2025-03-14北京
logo of bytedance
社招3年以上A76480A

1、负责公有云IaaS异构计算(CPU/GPU/NPU/FPGA等)产品的系统优化与产品设计规划工作; 2、推动异构计算产品与最新AI技术(如P/D分离、vLLM、SGLang、强化学习等)的深度融合(如模型训练加速、推理优化),提升GPU资源部署效率、使用效率、降低硬件适配成本; 3、推动异构算力适配层建设,提供标准API接口屏蔽底层硬件差异,降低业务开发复杂度; 4、跟踪业界最新模型发展趋势(如MoE架构、端侧大模型),推动异构产品与最新技术趋势的协同创新; 5、探索异构计算与行业场景(如具身智能、自动驾驶)的融合方案,推动生态合作与技术标准共建; 6、参与开源社区建设,建设在AI加速框架(如vLLM)与AI加速库领域的业界影响力。

更新于 2025-03-14深圳