百度内容生态研发部_ 推理性能优化工程师(J85683)
任职要求
-熟练掌握Linux环境下的C/C++、Python语言,熟悉docker使用 -熟悉深度学习基本原理和Pytorch深度学习框架,有对Pytorch框架二次开发经验者优先 -熟悉Transformer模型及其应用场景,熟练掌握至少一种开源社区的大模型推理框架,如vLLM、SGLang、TensorRT-LLM、LightLLM等…
工作职责
-负责内容架构相关开发工作,工作内容包括但不限于:模型推理性能优化、推理卡集群GPU利用率治理、模型服务化、GPU资源调度功能研发等 -负责多模态LLM和Diffusion Model的推理性能的极致优化,保持业界SOTA -紧跟多模态LLM、视频生成领域最新研究进展和技术趋势,协同策略团队完成业务落地 -和团队一起攻克高性能、高并发、高可用性等各种不同技术场景下的技术挑战

1. 负责内容安全领域的大模型算法研发与落地,构建面向国际及国内多场景(如商品审核、社区内容、广告等)的智能识别与风险防控体系; 2. 设计并实现基于大模型的自动化审核系统,提升审核效率与准确率,支持高并发、低延迟的在线服务; 3. 负责商品治理领域的风险防控算法研发与落地,面向数十亿级商品库,构建覆盖假货、侵权、山寨、劣质、滥发等核心场景的智能识别体系,通过大模型驱动的内容理解、行为建模与知识推理技术,提升风险识别准确率与自动化处置能力,保障消费者购物体验与权利人平台权益,支撑电商生态健康可持续发展; 4. 探索大模型在内容理解、行为建模、团伙识别、跨语言语义分析等方向的应用,推动从传统规则/小模型向知识驱动AGI范式的演进; 5. 构建可解释、可迭代的知识生产闭环,支撑风险感知、策略生成与防控标准动态更新; 6. 参与大模型训练、微调、推理优化及部署全流程,提升模型在真实业务中的泛化能力与稳定性。
团队介绍 我们是京东科技云事业部AI Infra团队,致力于大模型核心技术的前沿创新与应用。我们专注于业界领先的大模型创新算法及框架研发,构建极致高效的基础大模型训练、推理与渲染一体化平台,提供高吞吐高可用、低成本低延迟的大模型服务。我们的核心使命是高效支持京东自研和业界主流开源基础模型的训练、推理与渲染服务,驱动京东集团内外部的智能体/具身/全模态等大模型业务生态及应用。我们团队秉承技术驱动、创新为本的理念,为每一位成员提供广阔的成长空间和富有挑战性的项目。 工作内容 1.研发智能体/具身/全模态大模型算法,结合RL Infra后训练基座Scale-Law优化,提高大模型训练、生成和仿真渲染效能; 2.基于MoE/DiT大模型架构,融合样本均衡/多P并行/压缩/量化/剪枝/算子融合等技术,进行算法与系统Co-Design优化,并推动业务落地; 3.追踪业界最新技术进展,开展大模型算法与RL Infra训练、生成和仿真渲染相关创新,发表高影响力论文,打造业界一流的大模型RL Infra服务能力。
1.业务需求洞察与转化:; 2.深入对接业务线(如算法团队、司内业务部门),理解大模型在应用场景中的业务痛点,输出产品需求文档并推动优先级共识; 3.深入分析行业痛点(如客服、内容生成、3D建模等),输出定制化解决方案,推动产品适配性优化; 4.平台能力构建与体验提升:; 5.主导设计大模型全生命周期管理功能,涵盖数据标注、模型训练、效果评测、部优化等环节的核心模块,构建大模型全生命周期管理闭环,重点突破高并发训练、分布式推理、多模态模型兼容等能力; 6.设计面向开发者的低门槛工具链(如可视化Prompt编排、一键式模型微调),提升平台DAU/留存率; 7.端到端功能交付与落地; 8.独立负责功能从PRD设计到上线的全流程管理,协调研发、测试、算法团队资源,确保技术方案与业务目标的强对齐; 9.建立关键指标(如模型迭代周期、资源利用率、用户满意度),通过数据验证功能价值; 10.主导交付后的用户培训、反馈收集及问题闭环; 11.跨团队协同与项目管理; 12.推动业务方、工程团队、算法团队三方协作; 13.推动太极在腾讯生态产品(如微信、腾讯文档、腾讯会议)中的深度合作与能力共建。