腾讯腾讯云-云原生AI Infra研发工程师(深圳/北京)
社招全职3年以上腾讯云技术地点:深圳状态:招聘
任职要求
1.本科及以上学历,5年及以上相关工作经验; 2.熟悉Kubernetes生态,对Kubernetes源码有了解,具备 K8s Operator 相关开发经验优先; 3.熟悉 AI 训练、微调、推理等各个环节,熟悉主流大模型推理框架,如triton、vllm、lightllm、oll…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责 deepseek 等AI大模型在 K8s 上的推理部署方案研发,深度对接客户场景; 2.负责AI Infra相关能力在TKE的落地,如AI 相关工作负载的设计与研发,降低用户使用成本; 3.通过优化 AI 部署的计算、网络、存储相关资源,提升训练及推理效率; 4.负责推理稳定性、亲和性调度、推理框架优化、GPU池化等相关工作,降低推理成本,提升推理效率。
包括英文材料
学历+
Kubernetes+
https://kubernetes.io/docs/tutorials/kubernetes-basics/
This tutorial provides a walkthrough of the basics of the Kubernetes cluster orchestration system.
https://kubernetes.io/zh-cn/docs/tutorials/kubernetes-basics/
本教程介绍 Kubernetes 集群编排系统的基础知识。每个模块包含关于 Kubernetes 主要特性和概念的一些背景信息,还包括一个在线教程供你学习。
https://www.youtube.com/watch?v=s_o8dwzRlu4
Hands-On Kubernetes Tutorial | Learn Kubernetes in 1 Hour - Kubernetes Course for Beginners
https://www.youtube.com/watch?v=X48VuDVv0do
Full Kubernetes Tutorial | Kubernetes Course | Hands-on course with a lot of demos
Kubernetes Operator+
[英文] Operator pattern
https://kubernetes.io/docs/concepts/extend-kubernetes/operator/
Operators are software extensions to Kubernetes that make use of custom resources to manage applications and their components.
https://www.redhat.com/en/blog/create-kubernetes-operator
Kubernetes operators are a way to create, configure, and manage complex applications on top of Kubernetes.
https://www.youtube.com/watch?v=ha3LjlD6g7g
Kubernetes Operator explained | What are Kubernetes Operators and how it works
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
vLLM+
https://www.newline.co/@zaoyang/ultimate-guide-to-vllm--aad8b65d
vLLM is a framework designed to make large language models faster, more efficient, and better suited for production environments.
https://www.youtube.com/watch?v=Ju2FrqIrdx0
vLLM is a cutting-edge serving engine designed for large language models (LLMs), offering unparalleled performance and efficiency for AI-driven applications.
Ollama+
https://www.youtube.com/watch?v=GWB9ApTPTv4
Learn how to set up and use Ollama to build powerful AI applications locally.
https://www.youtube.com/watch?v=UtSSMs6ObqY
In this short video, I'll teach you everything you need to know to get up and running with Ollama.
CUDA+
https://developer.nvidia.com/blog/even-easier-introduction-cuda/
This post is a super simple introduction to CUDA, the popular parallel computing platform and programming model from NVIDIA.
https://www.youtube.com/watch?v=86FAWCzIe_4
Lean how to program with Nvidia CUDA and leverage GPUs for high-performance computing and deep learning.
Ray+
https://github.com/ray-project/ray
Ray consists of a core distributed runtime and a set of AI Libraries for accelerating ML workloads.
https://www.youtube.com/watch?v=FhXfEXUUQp0
In this video, I'll teach you everything you need to know about Apache Ray!
https://www.youtube.com/watch?v=fMiAyj2kgac
Using powerful machine learning algorithms is easy using Ray.io and Python.
https://www.youtube.com/watch?v=q_aTbb7XeL4
Parallel and Distributed computing sounds scary until you try this fantastic Python library.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
还有更多 •••
相关职位
社招3年以上CSIG技术
1.设计自动化数据治理流水线,支持多模态数据清洗/标注/增强(文本、图像、表格数据); 2.打造可视化微调工作台,支持LoRA/QLoRA/Adapter等高效算法一键配置; 3.开发智能评估中心,集成20+评估维度(事实性/安全性/逻辑性/领域适应性; 4.实现高并发推理服务,设计动态批处理/量化压缩/流量调度方案。
更新于 2025-06-11北京
社招3年以上TEG技术
1.基于开源项目 Ray,打造业内领先的通用分布式计算引擎,包括但不限于以下方向:引擎内核(分布式Task调度与执行)、分布式数据处理框架、分布式在线服务编排框架等; 2.面向 Data + AI,支持和拓展以 Ray 为 infra 的多种业务场景,包括但不限于以下方向:数据科学、大模型训练数据管道服务、在线推理与离线推理、AI Agent与应用系统、隐私计算、图计算等; 3.与 K8S 深度融合,建设云原生环境下超大规模分布式系统的服务能力与平台化能力,为业务提供高可用、可扩展、高易用性的集群化服务; 4.参与开源共建与合作,提升团队与个人在业界的影响力。
更新于 2025-06-09北京

社招3年以上Web前端开发
参与商汤大装置智能云的核心 Web 产品研发,包括: · 云控制台(算力/云服务/AI Infra) · AI 中台(大模型、数据、训练/推理平台) · 智能运营平台、官网等关键 B 端产品 我们会根据你的经验与意愿匹配具体方向。 岗位职责: 1. 负责大装置控制台、AI 中台、运营平台等 Web 应用的前端开发与架构优化。 2. 深度参与产品需求讨论,与产品、后端、设计团队紧密协作,推动功能迭代与用户体验提升。 3. 独立完成前端开发工作。 4. 优化系统性能、前端工程化体系和可观察性,提升整体开发效率与用户体验。 5. 参与前端组件、微前端架构及工程工具链的建设与持续优化。
更新于 2025-12-11北京|深圳
