京东大模型推理部署工程师
社招全职算法开发岗地点:北京状态:招聘
任职要求
1. 教育背景: 计算机科学、软件工程、人工智能或相关STEM领域的硕士及以上学历; 2. 技术基石: * 扎实的计算机科学基础和良好的工程实践能力; * 精通至少一种主流编程语言(如Python,C++),具备出色的编码和调试能力; * 熟悉主流大模型推理引擎和优化技术(如 vLLM, SGLang, TensorRT-LLM等); 2. 经验优先: * 拥有云计算系统、机器学习平台、分布式计算、中间件等领域的相关开发或落地经验者优先; * 在机器学习/系统领域顶级会议(如 A…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 构建AI云推理架构: 探索PD分离、KV池化、通信优化等技术,设计并实现适用于AI原生的分布式推理服务架构,应对高并发、低延迟挑战; 2. 开发核心推理平台能力: 打造AI原生网关及高可用系统,核心技术点包括但不限于:异构资源调度、身份认证与鉴权、请求智能限流、动态模型路由、推理容器/镜像加速、安全变更管控、系统深度可观测性等; 3. 参与推理全栈应用实践: 积极涉足推理服务上下游应用开发,如构建RAG(检索增强生成)系统、探索提示词工程优化实践、参与AI模型市场(MCP)建设或AIGC应用落地等。
包括英文材料
学历+
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
推理引擎+
https://www.youtube.com/watch?v=_dvk75LEJ34
https://www.youtube.com/watch?v=XtT5i0ZeHHE
还有更多 •••
相关职位
社招软件开发岗
1. 构建AI云推理架构: 探索PD分离、KV池化、通信优化等技术,设计并实现适用于AI原生的分布式推理服务架构,应对高并发、低延迟挑战; 2. 开发核心推理平台能力: 打造AI原生网关及高可用系统,核心技术点包括但不限于:异构资源调度、身份认证与鉴权、请求智能限流、动态模型路由、推理容器/镜像加速、安全变更管控、系统深度可观测性等; 3. 参与推理全栈应用实践: 积极涉足推理服务上下游应用开发,如构建RAG(检索增强生成)系统、探索提示词工程优化实践、参与AI模型市场(MCP)建设或AIGC应用落地等。
更新于 2025-07-23北京
社招软件开发岗
1. 构建AI云推理架构: 探索PD分离、KV池化、通信优化等技术,设计并实现适用于AI原生的分布式推理服务架构,应对高并发、低延迟挑战; 2. 开发核心推理平台能力: 打造AI原生网关及高可用系统,核心技术点包括但不限于:异构资源调度、身份认证与鉴权、请求智能限流、动态模型路由、推理容器/镜像加速、安全变更管控、系统深度可观测性等; 3. 参与推理全栈应用实践: 积极涉足推理服务上下游应用开发,如构建RAG(检索增强生成)系统、探索提示词工程优化实践、参与AI模型市场(MCP)建设或AIGC应用落地等。
更新于 2025-11-10北京
实习后端开发
核心职责 参与小红书大模型平台推理部署等流程及工具的研发建设,完善平台现有功能 参与平台Quota管理模块的开发,实现多机房、多集群环境下的,各种异构计算资源的配额管理功能 参与平台大模型训练/压缩/推理/数据集/资源调度等流程及工具的研发建设
更新于 2025-11-07上海|北京