百度大模型资深资源管理(J79916)
任职要求
-极强的责任心和执行力,热爱运营工作,目标导向,面对困难敢于挑战,不断推进目标达成 -具备良好的沟通、表达能力和项目管理能力,学习能力和抗压能…
工作职责
-负责百度云AI平台公有云业务的资源运营,协同兄弟团队高效完成资源交付,并不断改善交付流程,提升交付效率,客户满意度不断提升 -负责AI平台产品的资源运营,预测管理产品/客户需求,制定库存计划,保障资源平稳健康供给,确保产品营收/毛利目标达成 -负责AI平台产品的预算、成本管理,不断优化降低运营和单位成本,提供更具市场竞争力资源和产品服务 -数据运营,建设库存、售卖、成本、营销预测、预算执行等运营数据,实现线上化、可视化,为管理决策提供数据支撑
1、理解公司战略,深入贴近部门的业务进展及人力现状,助力管理者有效管理团队; 2、推动人力资源项目的实施,包括绩效管理、薪酬福利、员工关系等,提供专业的建议和解决方案; 3、推动二次创业文化诠释落地,营造良好的团队氛围及员工关系,保障组织的持续健康成长; 4、参与制定和完善人力资源政策、流程和制度,确保公司人力资源管理的合规性和有效性。
1、主导国内外战略级客户(SKA)拓展与经营:聚焦营销、游戏、影视、互联网等重点行业头部客户,推动可灵大模型产品标准化售卖和生态伙伴合作的深度落地;制定并执行SKA客户年度经营计划,实现从商机挖掘、方案匹配、商务谈判到项目交付闭环的全流程管理; 2、构建并管理全国性渠道生态体系:拓展并赋能系统集成商(SI)、ISV、区域代理商等核心合作伙伴,打造覆盖全国的大模型解决方案联合销售网络;设计渠道激励政策、联合营销机制及能力共建体系,提升渠道转化效率与复购率; 3、协同产品与技术团队,推动行业解决方案落地:深度理解客户业务痛点,将大模型能力(如知识库问答、智能客服、文档生成、多模态分析等)转化为可落地的商业价值;反馈市场与客户需求,驱动产品迭代与行业模板沉淀; 4、达成销售指标,建立标杆案例:完成公司下达的年度签约额、回款及客户满意度目标;在产品典型需求的每个赛道打造5-10个具有行业影响力的AI大模型标杆项目,形成可复制的销售方法论;指导直客拓展,引领渠道销售的市场规划。
我们正在招募一位具有系统级思维与AI大模型技术前瞻视野的 资深系统架构师,共同设计与构建下一代 AI 原生操作系统(AI Operating System, AIOS)。AIOS 是为智能计算时代重新定义的系统平台。它不再只是传统操作系统的资源管理者,而是智能体时代的计算基石,通过深度融合 基于大模型的AI 推理、感知、学习与决策能力,让系统能够自我理解、自我优化,并主动协作。您将站在系统软件与人工智能、大模型技术的融合前沿,定义AIOS的核心架构、智能调度体系、AI运行时、AI助手、AI智能体以及人机共生的新一代系统框架。 主要职责: 1. 主导 AIOS 的整体架构设计,包括AI原生系统内核层、系统服务层、AI运行时与智能交互层; 2. 设计并实现 AI原生系统内核(AI-native Kernel),将调度、内存与资源管理与AI智能决策引擎深度融合; 3. 构建 AIOS Runtime,支持端侧模型的高效运行、动态加载、分层缓存、在线推理与自适应资源分配; 4. 设计 智能调度系统(AI Scheduler),实现跨CPU/GPU/NPU/DSP的异构资源智能优化; 5. 构建 AI Memory & Model Management Framework,支持模型快速热加载、压缩与生命周期管理; 6. 推动系统级 智能安全与可信计算机制,确保AI决策链的可解释性与可信度; 7. 与硬件、内核、AI算法、设备驱动与应用生态团队协作,打通跨层架构接口,实现软硬件协同优化; 8. 负责AIOS技术蓝图与架构演进路线规划,推动系统持续演化; 9. 指导高级工程师团队落地架构设计,建立高标准的系统工程文化。
我们是中台技术部大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势。其中 QuickSilver 大模型生产部署平台负责调度公司内所有稠密类模型训练与推理资源,基于自建训推引擎,为公司所有大模型算法同学提供端到端一站式AI服务,包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力,持续赋能小红书社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 岗位职责: 1、负责大模型平台整体架构设计,构建高可用、高性能、可扩展的云原生体系。 2、主导大模型全流程 DevOps/MLOps 工程体系建设,打造端到端一站式平台能力。 3、推动训练框架、推理引擎、压缩工具链与平台深度集成,提升模型研发与发布效率。 4、负责平台核心模块研发(模型管理、任务管理、实验系统、评测与发布等)。 5、持续优化平台性能、稳定性与可观测性,支撑多模型、多业务的规模化生产需求。 6、跟踪并引入行业前沿 AI Infra 技术,推动平台能力和产品体验持续演进。 7、协同上下游团队进行必要的资源调度与自动化优化,共同提升算力效率。