logo of baidu

百度大模型推理服务端工程师(J94378)

社招全职2年以上ACG地点:上海 | 成都状态:招聘

任职要求


-本科或硕士研究生,计算机相关专业,两年以上后端开发经验
-熟悉Golangpython语言编程;有较强的编程、算法实现、文档撰写能力,具有良好的代码风格和质量意识,能独立完成算法和工程应用模块的设计、开发、测试和应用
-精通Linux平台编程,熟悉dockerk8s相关组件和操作
-了解深度学习算法,了解LLM基础;了解Paddle/PyTorch等至少一种深度学习框架
-有LLM真实大规模推理工程架构经验者优先;有深度学习模型优化、压缩、硬件适配相关经验者优先
-热爱互联网,对技术研究和应用抱有浓厚的兴趣,有强烈的上进心和求知欲,善于学习和运用新知识
-具有良好的学习能力,快速接受新事物
-具有良好时间意识、沟通能力、团队合作能力

工作职责


-负责百度千帆大模型平台模型服务工程相关系统的开发和支持,推理服务架构稳定性、性能优化、扩展性技术研发
-参与大模型的国产芯片适配、推理加速与优化工作,参与深度学习前沿加速技术研究
-将AI前沿技术应用到各个垂直行业,负责相关应用工程配套开发
-根据需求文档进行相关产品的开发,撰写开发文档,对负责的产品做好客户支持工作
包括英文材料
后端开发+
Go+
Python+
算法+
Linux+
Docker+
Kubernetes+
深度学习+
大模型+
PaddlePaddle+
PyTorch+
相关职位

logo of baidu
社招3年以上ACG

-负责百度千帆大模型平台模型服务工程相关系统的开发和支持 -负责推理服务架构稳定性、性能优化、扩展性技术研发 -参与百度千帆大模型的推理加速与优化工作,参与深度学习前沿加速技术研究 -将AI前沿技术应用到各个垂直行业,负责相关应用工程配套开发 -根据需求文档进行相关产品的开发,撰写开发文档,对负责的产品做好客户支持工作

更新于 2025-06-10
logo of sensetime
社招后端开发

负责大模型应用系统的后端架构设计与开发,保障系统的高可用性、稳定性及可扩展性; 参与智能体(Agent)和垂直领域大模型应用的服务端研发,持续优化业务落地效果; 负责后端服务模块开发,包括接口设计、服务拆分、数据库建模等核心工作; 参与国产化大模型的系统适配与框架设计,提升服务的通用性与兼容能力; 协同算法、前端、测试等团队,确保系统按计划稳定上线,并解决客户现场技术问题; 持续关注大模型和工程技术的发展趋势,结合业务需求推进服务端架构和性能的优化。

更新于 2025-07-17
logo of sensetime
社招1-3年后端开发

支持商汤SenseCore AI智算数据中心以及大模型应用开发平台等多产品的技术设计、开发工作; 开发并维护高可用,易扩展的后端服务; 优化后端服务的性能和可扩展性,分析并解决系统中的性能瓶颈; 设计和实现高效的 API 以及微服务架构,支持复杂的业务逻辑需求; 与前端、算法、DevOps 以及其他后端团队密切合作,共同推动技术解决方案的落地。

更新于 2025-09-29
logo of oppo
社招3-5年SOFTWARE

岗位职责: 1.负责大模型推理系统的设计与开发,支持云上LLM、多模态语言模型推理业务。 2.负责深度优化大模型推理引擎性能,降低引擎推理延迟,提升引擎吞吐。 3.负责建设和维护大模型推理服务以及建设服务的稳定性。

更新于 2025-10-07