logo of baidu

百度大模型推理服务端工程师(J94378)

社招全职2年以上ACG地点:上海 | 成都状态:招聘

任职要求


-本科或硕士研究生,计算机相关专业,两年以上后端开发经验
-熟悉Golangpython语言编程;有较强的编程、算法实现、文档撰写能力,具有良好的代码风格和质量意识,能独立完成算法和工程应用模块的设计、开发、测试和应用
-精通Linux平台编程,熟悉docker、k8s相关组件和操作
-了解深度学习算法,了解LLM基…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-负责百度千帆大模型平台模型服务工程相关系统的开发和支持,推理服务架构稳定性、性能优化、扩展性技术研发
-参与大模型的国产芯片适配、推理加速与优化工作,参与深度学习前沿加速技术研究
-将AI前沿技术应用到各个垂直行业,负责相关应用工程配套开发
-根据需求文档进行相关产品的开发,撰写开发文档,对负责的产品做好客户支持工作
包括英文材料
后端开发+
Go+
Python+
算法+
Linux+
还有更多 •••
相关职位

logo of baidu
社招3年以上ACG

-负责百度千帆大模型平台模型服务工程相关系统的开发和支持 -负责推理服务架构稳定性、性能优化、扩展性技术研发 -参与百度千帆大模型的推理加速与优化工作,参与深度学习前沿加速技术研究 -将AI前沿技术应用到各个垂直行业,负责相关应用工程配套开发 -根据需求文档进行相关产品的开发,撰写开发文档,对负责的产品做好客户支持工作

更新于 2025-06-10北京
logo of sensetime
社招后端开发

负责大模型应用系统的后端架构设计与开发,保障系统的高可用性、稳定性及可扩展性; 参与智能体(Agent)和垂直领域大模型应用的服务端研发,持续优化业务落地效果; 负责后端服务模块开发,包括接口设计、服务拆分、数据库建模等核心工作; 参与国产化大模型的系统适配与框架设计,提升服务的通用性与兼容能力; 协同算法、前端、测试等团队,确保系统按计划稳定上线,并解决客户现场技术问题; 持续关注大模型和工程技术的发展趋势,结合业务需求推进服务端架构和性能的优化。

更新于 2025-07-17深圳|武汉
logo of sensetime
社招1-3年后端开发

支持商汤SenseCore AI智算数据中心以及大模型应用开发平台等多产品的技术设计、开发工作; 开发并维护高可用,易扩展的后端服务; 优化后端服务的性能和可扩展性,分析并解决系统中的性能瓶颈; 设计和实现高效的 API 以及微服务架构,支持复杂的业务逻辑需求; 与前端、算法、DevOps 以及其他后端团队密切合作,共同推动技术解决方案的落地。

更新于 2025-11-03北京|杭州|上海
logo of oppo
社招3-5年SOFTWARE

岗位职责: 1.负责大模型推理系统的设计与开发,支持云上LLM、多模态语言模型推理业务。 2.负责深度优化大模型推理引擎性能,降低引擎推理延迟,提升引擎吞吐。 3.负责建设和维护大模型推理服务以及建设服务的稳定性。

更新于 2025-10-07深圳