logo of xiaohongshu

小红书AI大模型部署系统研发工程师(实习)

实习兼职后端开发地点:北京 | 上海状态:招聘

任职要求


1、计算机/软件工程相关专业在校生,熟悉Go/Python/Java至少一门语言
2、了解Linux系统及算法基础,熟悉MySQL/Redis等组件使用
3、了解 Kubernetes 架构和生态,有一定的云原生机器学习系统实践和开发经验;
具备快速学习能力,能持续跟踪AI基础设施技术动态
加分项
1、接触过Mesos、Yarn、Argo、Volca…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与AI平台大模型推理部署等流程及工具的研发建设,完善平台现有功能。
2、参与AI平台Quota管理模块的开发,实现多机房、多集群环境下的,各种异构计算资源的配额管理功能。
3、参与AI平台联邦调度能力的设计和开发,与下游云原生团队共同实现平台联邦和弹性部署能力。
包括英文材料
Go+
Python+
Java+
Linux+
算法+
MySQL+
Redis+
Kubernetes+
还有更多 •••
相关职位

logo of xiaohongshu
实习后端开发

核心职责 参与小红书大模型平台推理部署等流程及工具的研发建设,完善平台现有功能 参与平台Quota管理模块的开发,实现多机房、多集群环境下的,各种异构计算资源的配额管理功能 参与平台大模型训练/压缩/推理/数据集/资源调度等流程及工具的研发建设

更新于 2025-11-07上海|北京
logo of xiaohongshu
实习引擎

核心职责: 参与AI平台大模型推理部署等流程及工具的研发建设,完善平台现有功能。 参与AI平台Quota管理模块的开发,实现多机房、多集群环境下的,各种异构计算资源的配额管理功能。 参与AI平台联邦调度能力的设计和开发,与下游云原生团队共同实现平台联邦和弹性部署能力。

更新于 2025-10-14北京|上海
logo of xiaohongshu
实习引擎

核心职责 参与小红书万亿级Token量推理系统构建,包括但不限于大模型智能网关、大模型弹性伸缩、推理系统优化等方向,共同打造国内领先的大模型推理系统; 探索负载感知的推理系统流量调度算法,如基于Prefix Cache命中率调度、基于P/D分离的流量调度、基于KVCache使用率、推理排队负载感知的流量调度、长上下文请求调度优化等,持续提升MaaS系统的稳定性、成本效益; 探索并跟进业界开源SOTA模型,如Qwen系列、DeepSeek系列,多维度评估模型效果并建立相关的准入体系,及时上架到MaaS系统; 参与MaaS系统的国产卡适配,如华为910C、阿里PPU等; 参与攻克大规模分布式推理系统带来的复杂挑战,通过弹性调度、容量规划、链路压测等手段提升系统健壮性,确保平台能够弹性扩展,支撑业务的飞速增长。

更新于 2025-11-25北京|上海
logo of xiaohongshu
实习大模型

1、参与小红书万亿级Token量推理系统构建,包括但不限于大模型智能网关、大模型弹性伸缩、推理系统优化等方向,共同打造国内领先的大模型推理系统; 2、探索负载感知的推理系统流量调度算法,如基于Prefix Cache命中率调度、基于P/D分离的流量调度、基于KVCache使用率、推理排队负载感知的流量调度、长上下文请求调度优化等,持续提升MaaS系统的稳定性、成本效益; 3、探索并跟进业界开源SOTA模型,如Qwen系列、DeepSeek系列,多维度评估模型效果并建立相关的准入体系,及时上架到MaaS系统; 4、参与MaaS系统的国产卡适配,如华为910C、阿里PPU等; 5、参与攻克大规模分布式推理系统带来的复杂挑战,通过弹性调度、容量规划、链路压测等手段提升系统健壮性,确保平台能够弹性扩展,支撑业务的飞速增长。

更新于 2025-08-22北京|上海