小米高级AI系统开发工程师(大模型与RAG方向)
任职要求
1.计算机科学、人工智能或相关领域本科及以上学历,5年以上大型服务端开发经验,3年以上AI系统相关项目经验 2.有牵头大型AI工程项目经验,具备一定的团队管理或技术领导经验 3. 具备扎实的 Java 编程基础,熟悉常用的 Java 开发框架,包括不限于Spring,SpringMvc、SpringBoot、Spring Cloud,有高并发分布式系统开发经验 4. 熟悉常用数据库,包括不限于Mysql、MongoDB、ES、Redis等,熟悉常用的消息中间件 5. 熟悉python/GO开发语言,能进行一般的python/Go项目开发 6. 能够快速理解业务需求,具备良好的沟通能力,将业务需求准确转化为技术方案 7. 善于学习和总结,有团队合作精神和较强执行力,较强的问题解决能力、跨团队沟通能力和技术规划能力。 【加分项】 1. 精通Transformer架构、RAG技术栈、向量数据库优化与多模态检索策略者优先。 2. 掌握vLLM/SGLang/TensorRT-LLM推理框架中至少一种模型部署方法,掌握模型量化、算子融合、投机采样等优化技术者优先。 3. 对AI技术前沿(如Agent、多模态)有持续跟踪热情者优先。
工作职责
1. 主导大模型系统架构设计: 负责RAG系统的整体架构设计,包括存储层、检索层、推理层与缓存层的技术选型与实现。 构建高可用、低延迟的分布式推理服务框架,支持向量数据库集成(如Milvus、Elastic)、知识库管理与多模态检索优化。 设计并实现Agent工作流编排框架,支持工具调用(MCP协议)、任务规划与自动化执行。 2.模型部署与性能优化: 负责大模型(LLM/VLM)的本地化部署、量化压缩、动态批处理与推理加速,优化GPU/CPU异构算力利用率。 3. AI服务平台开发: 基于Java/Go/Python构建高并发、可扩展的AI微服务,与现有业务系统深度集成,实现模型训练-部署-监控的全链路管理。 4.技术领导与跨团队协作: 指导中级工程师,制定技术方案,并主导技术攻关。与产品、算法、基础设施团队协作,定义需求并推动工程落地。
1、负责服务零售家庭服务业务相关系统的设计与开发,参与架构演进、系统优化; 2、负责一个或多个子系统的中长期规划,承接业务需求并做好项目管理、上下游协同工作; 3、指导初中级工程师的学习成长和技术方案设计,参与团队代码Review等工作; 4、负责技术难点攻关,不断提升核心服务的稳定性和系统性能,提升运营效率。

负责技术方案设计与落地,根据业务需求设计AI系统架构,推动技术方案从PoC验证到规模化部署 1、优化模型推理效率,应用剪枝、蒸馏等技术降低计算资源消耗 2、负责机器学习/深度学习模型的开发与调优,主导数据预处理、特征工程、模型训练与评估全流程 3、协同产品、数据团队,将业务需求转化为技术实现,输出专利与技术文档 4、跟踪AI前沿技术(如多模态学习、Agent框架),探索创新应用场景

负责技术方案设计与落地,根据业务需求设计AI系统架构,推动技术方案从PoC验证到规模化部署 1、优化模型推理效率,应用剪枝、蒸馏等技术降低计算资源消耗 2、负责机器学习/深度学习模型的开发与调优,主导数据预处理、特征工程、模型训练与评估全流程 3、协同产品、数据团队,将业务需求转化为技术实现,输出专利与技术文档 4、跟踪AI前沿技术(如多模态学习、Agent框架),探索创新应用场景
1.Agent核心框架研发: 负责排障AI Agent的核心框架设计与开发,包括任务规划(Planning)、工具调用(Tool-use)、记忆(Memory)等关键模块,持续提升Agent的自主决策与执行能力; 2.Agent效果评测与迭代: 主导设计并落地Agent自动化评测体系,并基于线上失效案例(如规划错误、幻觉)的深入分析,驱动模型、Prompt及工具链的持续优化; 3.大模型后训练与优化: 负责大模型的后训练流程,包括构建高质量SFT数据集、实施Fine-tuning与RLHF/DPO等优化策略,并建立评测-训练-部署的闭环,持续提升模型在排障领域的专业能力。