百度大模型推理服务端工程师(J94378)
任职要求
-本科或硕士研究生,计算机相关专业,两年以上后端开发经验 -熟悉Golang 、 python语言编程;有较强的编程、算法实现、文档撰写能力,具有良好的代码风格和质量意识,能独立完成算法和工程应用模块的设计、开发、测试和应用 -精通Linux平台编程,熟悉docker、k8s相关组件和操作 -了解深度学习算法,了解LLM基…
工作职责
-负责百度千帆大模型平台模型服务工程相关系统的开发和支持,推理服务架构稳定性、性能优化、扩展性技术研发 -参与大模型的国产芯片适配、推理加速与优化工作,参与深度学习前沿加速技术研究 -将AI前沿技术应用到各个垂直行业,负责相关应用工程配套开发 -根据需求文档进行相关产品的开发,撰写开发文档,对负责的产品做好客户支持工作
-负责秒哒产品后端服务支撑工作,包括平台功能、智能体框架等需求理解,系统分析,设计及实现 -深入理解业务模型,采用合适的系统架构应对多变市场环境带来的需求变动和复杂的业务模型 -攻克服务中高并发,高稳定性,大数据处理,业务合规要求带来的各种挑战及技术难关 -深入了解两端全流程业务,了解并掌握后端整体的系统架构,参与中台的业务架构设计与优化工作
-负责百度千帆大模型平台模型服务工程相关系统的开发和支持 -负责推理服务架构稳定性、性能优化、扩展性技术研发 -参与百度千帆大模型的推理加速与优化工作,参与深度学习前沿加速技术研究 -将AI前沿技术应用到各个垂直行业,负责相关应用工程配套开发 -根据需求文档进行相关产品的开发,撰写开发文档,对负责的产品做好客户支持工作

负责大模型应用系统的后端架构设计与开发,保障系统的高可用性、稳定性及可扩展性; 参与智能体(Agent)和垂直领域大模型应用的服务端研发,持续优化业务落地效果; 负责后端服务模块开发,包括接口设计、服务拆分、数据库建模等核心工作; 参与国产化大模型的系统适配与框架设计,提升服务的通用性与兼容能力; 协同算法、前端、测试等团队,确保系统按计划稳定上线,并解决客户现场技术问题; 持续关注大模型和工程技术的发展趋势,结合业务需求推进服务端架构和性能的优化。
【关于我们】 Hi Lab 是小红书核心AI 实验室,点点作为新一代生活场景AI搜索助手,依托海量小红书笔记 + 全网真实经验 + 深度思考大模型能力(DeepSeek等),为用户提供“精准避坑、超级实用、有画面感”的美食、旅行、购物、穿搭、生活答案。 支持多模态提问(文字/语音/拍照)、视频化回复、多轮追问,正在快速迭代成为年轻人日常的“生活搭子”。 加入Hi Lab,你将直接参与千万级DAU AI对话产品的服务端核心建设,与顶尖算法/客户端团队一起,打造高并发、高可靠的AI交互基础设施,推动AI真正懂生活、懂小红书! 【岗位职责】 - 负责点点AI对话产品服务端核心架构设计与开发,覆盖多轮对话流、用户体系、账号体系及第三方能力集成; - 设计并实现高可用对话分发与消息路由系统,支持千万级并发访问与长连接管理; - 构建用户画像、Memory上下文与个性化记忆体系,提升多轮交互的智能与连贯性; - 对接搜索、RAG、点评、电商等第三方能力,打造灵活、可扩展的工具调用与Function Call链路; - 建设全链路稳定性与容灾体系,推动Trace、Metrics、Logging、OpenTelemetry、多地多活等可观测性与高可用能力落地; - 参与容量规划、压测优化、性能调优与持续可观测建设,确保系统在高峰期丝滑稳定; - 驱动工程效率提升,包括CI/CD自动化、服务治理、云原生实践(K8s/Istio),保障线上SLA。 1、负责 AI 对话产品服务端核心架构设计与开发,涵盖对话流、用户体系、账号与三方能力等模块; 2、设计并实现高可用的对话分发与消息路由系统,支撑千万级并发访问; 3、构建用户画像与 Memory 管理体系,支持上下文增强与个性化记忆; 4、对接第三方能力(搜索、点评、电商等),构建灵活可扩展的工具调用体系; 5、建设全链路稳定性与容灾体系,推进 Trace / Metrics / Logging / 多地多活能力落地; 6、参与系统容量规划、压测优化与持续可观测性建设; 7、推动工程效率、CI/CD 与服务质量提升,保障线上可用性。