logo of mi

小米高级AI系统开发工程师(大模型与RAG方向)

社招全职5年以上A18742地点:武汉状态:招聘

任职要求


1.计算机科学、人工智能或相关领域本科及以上学历,5年以上大型服务端开发经验,3年以上AI系统相关项目经验
2.有牵头大型AI工程项目经验,具备一定的团队管理或技术领导经验
3. 具备扎实的 Java 编程基础,熟悉常用的 Java 开发框架,包括不限于SpringSpringMvcSpringBootSpring Cloud,有高并发分布式系统开发经验
4. 熟悉常用数据库,包括不限于MysqlMongoDBESRedis等,熟悉常用的消息中间件
5. 熟悉python/GO开发语言,能进行一般的python/Go项目开发
6. 能够快速理解业务需求,具备良好的沟通能力,将业务需求准确转化为技术方案
7. 善于学习和总结,有团队合作精神和较强执行力,较强的问题解决能力、跨团队沟通能力和技术规划能力。

【加分项】
​1. 精通Transformer架构、RAG技术栈、向量数据库优化与多模态检索策略者优先。
​2. 掌握vLLM/SGLang/TensorRT-LLM推理框架中至少一种模型部署方法,掌握模型量化、算子融合、投机采样等优化技术者优先。
3. 对AI技术前沿(如Agent、多模态)有持续跟踪热情者优先。

工作职责


1. 主导大模型系统架构设计:
负责RAG系统的整体架构设计,包括存储层、检索层、推理层与缓存层的技术选型与实现。
构建高可用、低延迟的分布式推理服务框架,支持向量数据库集成(如Milvus、Elastic)、知识库管理与多模态检索优化。
设计并实现Agent工作流编排框架,支持工具调用(MCP协议)、任务规划与自动化执行。
2.模型部署与性能优化:
负责大模型(LLM/VLM)的本地化部署、量化压缩、动态批处理与推理加速,优化GPU/CPU异构算力利用率。
3. AI服务平台开发:
基于Java/Go/Python构建高并发、可扩展的AI微服务,与现有业务系统深度集成,实现模型训练-部署-监控的全链路管理。
4.技术领导与跨团队协作:
指导中级工程师,制定技术方案,并主导技术攻关。与产品、算法、基础设施团队协作,定义需求并推动工程落地。
包括英文材料
学历+
Java+
开发框架+
Spring+
Spring Cloud+
高并发+
分布式系统+
MySQL+
MongoDB+
ElasticSearch+
Redis+
中间件+
Python+
Go+
Transformer+
RAG+
大模型+
vLLM+
SGLang+
TensorRT+
AI agent+
相关职位

logo of meituan
社招3年以上核心本地商业-业

1、负责服务零售家庭服务业务相关系统的设计与开发,参与架构演进、系统优化; 2、负责一个或多个子系统的中长期规划,承接业务需求并做好项目管理、上下游协同工作; 3、指导初中级工程师的学习成长和技术方案设计,参与团队代码Review等工作; 4、负责技术难点攻关,不断提升核心服务的稳定性和系统性能,提升运营效率。

更新于 2025-07-23
logo of digitalchina
社招5年以上

负责技术方案设计与落地,根据业务需求设计AI系统架构,推动技术方案从PoC验证到规模化部署 1、优化模型推理效率,应用剪枝、蒸馏等技术降低计算资源消耗 2、负责机器学习/深度学习模型的开发与调优,主导数据预处理、特征工程、模型训练与评估全流程 3、协同产品、数据团队,将业务需求转化为技术实现,输出专利与技术文档 4、跟踪AI前沿技术(如多模态学习、Agent框架),探索创新应用场景

更新于 2025-10-15
logo of digitalchina
社招5年以上

负责技术方案设计与落地,根据业务需求设计AI系统架构,推动技术方案从PoC验证到规模化部署 1、优化模型推理效率,应用剪枝、蒸馏等技术降低计算资源消耗 2、负责机器学习/深度学习模型的开发与调优,主导数据预处理、特征工程、模型训练与评估全流程 3、协同产品、数据团队,将业务需求转化为技术实现,输出专利与技术文档 4、跟踪AI前沿技术(如多模态学习、Agent框架),探索创新应用场景

更新于 2025-10-16
logo of tencent
社招5年以上腾讯云技术

1.Agent核心框架研发: 负责排障AI Agent的核心框架设计与开发,包括任务规划(Planning)、工具调用(Tool-use)、记忆(Memory)等关键模块,持续提升Agent的自主决策与执行能力; 2.Agent效果评测与迭代: 主导设计并落地Agent自动化评测体系,并基于线上失效案例(如规划错误、幻觉)的深入分析,驱动模型、Prompt及工具链的持续优化; 3.大模型后训练与优化: 负责大模型的后训练流程,包括构建高质量SFT数据集、实施Fine-tuning与RLHF/DPO等优化策略,并建立评测-训练-部署的闭环,持续提升模型在排障领域的专业能力。

更新于 2025-08-06