小米分布式系统工程师实习生
任职要求
1. 本科及以上学历,具有扎实的计算机专业基础,至少熟练掌握一门编程语言
2. 具有良好的自驱和学习能力,责任心强,不断追求卓越
3. 具有优秀的发现问题和解决问题能力,有热情解…工作职责
1. 负责小米 ElasticSearch 搜索引擎及生态体系的研发工作 2. 参与开源,提高小米在开源社区的影响力
核心职责 参与小红书大模型平台推理部署等流程及工具的研发建设,完善平台现有功能 参与平台Quota管理模块的开发,实现多机房、多集群环境下的,各种异构计算资源的配额管理功能 参与平台大模型训练/压缩/推理/数据集/资源调度等流程及工具的研发建设
核心职责 参与小红书万亿级Token量推理系统构建,包括但不限于大模型智能网关、大模型弹性伸缩、推理系统优化等方向,共同打造国内领先的大模型推理系统; 探索负载感知的推理系统流量调度算法,如基于Prefix Cache命中率调度、基于P/D分离的流量调度、基于KVCache使用率、推理排队负载感知的流量调度、长上下文请求调度优化等,持续提升MaaS系统的稳定性、成本效益; 探索并跟进业界开源SOTA模型,如Qwen系列、DeepSeek系列,多维度评估模型效果并建立相关的准入体系,及时上架到MaaS系统; 参与MaaS系统的国产卡适配,如华为910C、阿里PPU等; 参与攻克大规模分布式推理系统带来的复杂挑战,通过弹性调度、容量规划、链路压测等手段提升系统健壮性,确保平台能够弹性扩展,支撑业务的飞速增长。
1、负责相关系统/模块的业务需求分析、设计、开发、上线和维护,如分布式文件系统、缓存系统、Key/Value存储系统、数据库、Linux操作系统和Java优化等; 2、参与高性能分布式服务端程序的系统设计,为菜鸟的产品提供强有力的后台支持,在海量的网络访问和数据处理中,设计并设施最强大的解决方案; 3、参与搜索引擎各个功能模块的设计和实现,构建高可靠性、高可用性、高可扩展性的体系结构,满足日趋复杂的业务需求; 4、参与海量数据处理和开发,通过sql、pl/sql、java进行etl程序开发,满足商业上对数据的开发需求。
本课题研究的目标是建设面向数据开发、数据分析和数据科学等场景的智能体Agent,对标Google Colab DataScience Agent,能够根据实际业务场景中的看数、分析、预测等需求,实现端到端的多任务的构建和编排,从而完成目前数仓、DI等日常工作。例如,对于数据开发场景,DataEngineer Agent 可以实现需求理解-> 找表 -> 指标设计 -> 数据建模 -> 任务代码生成->任务编排 -> 数据测试 -> 任务发布的全流程,从而进一步释放数据开发工程师的人力需求,支撑我们在保持精简的组织架构下,继续支撑业务的高速增长,实现卓越型组织架构。