logo of kuaishou

快手AI Infra平台-研发工程师

社招全职D10991地点:北京状态:招聘

任职要求


1、本科及以上学历,计算机相关专业;
2、熟悉至少一种编程语言(如 GolangJavaPython 等); 
3、掌握如K8SKnative,Serverless等主流及新兴云原生技术,特别在AI应用托管领域与大模型结合的演进方向;
4、有 Docker、Kubernetes、v…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、面向AI应用场景设计开发业界领先的AI平台,包括prompt工程,RAG工程、模型微调、推理加速等能力;
2、负责大模型场景下多领域的数据工程,包含知识库数据的高质量处理,Prompt提示词的优化,模型微调数据集的质量提升;
3、负责大模型场景下模型推理框架的性能优化方案的设计与实现;
4、设计训练和优化大模型,跟踪和研发代码大模型的预训练、持续训练、SFT、RLHF等技术;
5、设计与实现AI智能体应用的编排定义,提升企业应用的智能度。
包括英文材料
学历+
Go+
Java+
Python+
Kubernetes+
Knative+
大模型+
还有更多 •••
相关职位

logo of kuaishou
社招D10991

1、面向AI应用场景设计开发业界领先的AI平台,包括prompt工程,RAG工程、模型微调、推理加速等能力; 2、负责大模型场景下多领域的数据工程,包含知识库数据的高质量处理,Prompt提示词的优化,模型微调数据集的质量提升; 3、负责大模型场景下模型推理框架的性能优化方案的设计与实现; 4、设计训练和优化大模型,跟踪和研发代码大模型的预训练、持续训练、SFT、RLHF等技术; 5、设计与实现AI智能体应用的编排定义,提升企业应用的智能度。

更新于 2025-06-12杭州
logo of kuaishou
社招3-5年D14207

1、面向AI应用场景设计开发业界领先的AI平台,包括prompt工程,RAG工程、模型微调、推理加速等能力; 2、负责大模型场景下多领域的数据工程,包含知识库数据的高质量处理,Prompt提示词的优化,模型微调数据集的质量提升; 3、负责大模型场景下模型推理框架的性能优化方案的设计与实现; 4、设计训练和优化大模型,跟踪和研发代码大模型的预训练、持续训练、SFT、RLHF等技术; 5、设计与实现AI智能体应用的编排定义,提升企业应用的智能度。

更新于 2025-12-19杭州
logo of didi
校招工程-后端类

1、参与机器学习平台AI Infra建设,针对各类深度学习场景的训推全链路优化,包括平台产品、训推框架集成、存储加速、GPU虚拟化等 2、参与深度学习前瞻技术跟踪调研,探索新技术在内部场景的落地。

更新于 2025-08-18北京|杭州
logo of baidu
社招3年以上ACG

-参与 AI Infra 核心平台建设,支撑大模型训练与推理业务的稳定、高效运行,覆盖 GPU、RDMA、高速网络等算力资源在云原生体系中的统一管理与调度 -负责 GPU、RDMA 等 IaaS 资源的自动化准入、能力识别、基准测试与性能评测,建设标准化算力验收与持续评测体系,保障不同硬件规格在大规模集群下的可用性与一致性 -负责 Kubernetes 容器平台的架构设计、能力演进与稳定性治理,重点关注平台的高可用、稳定性、安全性、性能、可扩展性等非功能性指标,参与或主导调度、资源隔离、设备插件(GPU/RDMA)、网络或存储相关模块的设计与二次开发 -支撑大模型推理与训练业务在平台侧的工程化落地,关注推理与训练场景下的资源利用率、调度效率、显存管理与多租户隔离,与算法、引擎团队协作,推动性能优化能力在平台层的规模化复用 -参与多卡、多机、大规模 GPU 集群的资源调度与稳定性建设,支撑 TP/DP/PP/PD 等并行模式在平台侧的运行与管理,解决实际生产环境中的性能抖动、资源碎片化与容量规划问题 -参与运维与运营平台后端研发,支撑算力运营、性能监控、容量管理与成本治理,建设可观测体系(监控、日志、Tracing),推动问题发现与定位的自动化,通过工程化手段持续降低人工运维成本

更新于 2026-02-03深圳