小米高级AI系统开发工程师(大模型与RAG方向)
任职要求
1.计算机科学、人工智能或相关领域本科及以上学历,5年以上大型服务端开发经验,3年以上AI系统相关项目经验 2.有牵头大型AI工程项目经验,具备一定的团队管理或技术领导经验 3. 具备扎实的 Java 编程基础,熟悉常用的 Java 开发框架,包括不限于Spring,SpringMvc、SpringBoot、Spring Cloud,有高并发分布式系统开发经验 4. 熟悉常用数据库,包括不限于Mysql、MongoDB、ES、Redis等,熟悉常用的消息中间件 5. 熟悉python/GO开发语言,能进行一般的py…
工作职责
1. 主导大模型系统架构设计: 负责RAG系统的整体架构设计,包括存储层、检索层、推理层与缓存层的技术选型与实现。 构建高可用、低延迟的分布式推理服务框架,支持向量数据库集成(如Milvus、Elastic)、知识库管理与多模态检索优化。 设计并实现Agent工作流编排框架,支持工具调用(MCP协议)、任务规划与自动化执行。 2.模型部署与性能优化: 负责大模型(LLM/VLM)的本地化部署、量化压缩、动态批处理与推理加速,优化GPU/CPU异构算力利用率。 3. AI服务平台开发: 基于Java/Go/Python构建高并发、可扩展的AI微服务,与现有业务系统深度集成,实现模型训练-部署-监控的全链路管理。 4.技术领导与跨团队协作: 指导中级工程师,制定技术方案,并主导技术攻关。与产品、算法、基础设施团队协作,定义需求并推动工程落地。
1、负责服务零售家庭服务业务相关系统的设计与开发,参与架构演进、系统优化; 2、负责一个或多个子系统的中长期规划,承接业务需求并做好项目管理、上下游协同工作; 3、指导初中级工程师的学习成长和技术方案设计,参与团队代码Review等工作; 4、负责技术难点攻关,不断提升核心服务的稳定性和系统性能,提升运营效率。

负责技术方案设计与落地,根据业务需求设计AI系统架构,推动技术方案从PoC验证到规模化部署 1、优化模型推理效率,应用剪枝、蒸馏等技术降低计算资源消耗 2、负责机器学习/深度学习模型的开发与调优,主导数据预处理、特征工程、模型训练与评估全流程 3、协同产品、数据团队,将业务需求转化为技术实现,输出专利与技术文档 4、跟踪AI前沿技术(如多模态学习、Agent框架),探索创新应用场景

负责技术方案设计与落地,根据业务需求设计AI系统架构,推动技术方案从PoC验证到规模化部署 1、优化模型推理效率,应用剪枝、蒸馏等技术降低计算资源消耗 2、负责机器学习/深度学习模型的开发与调优,主导数据预处理、特征工程、模型训练与评估全流程 3、协同产品、数据团队,将业务需求转化为技术实现,输出专利与技术文档 4、跟踪AI前沿技术(如多模态学习、Agent框架),探索创新应用场景
特斯拉信息技术部门(工作地点:特斯拉上海超级工厂)正在招聘一名全职IT AI Platform 开发工程师,专注于构建和扩展下一代 AIOps与MLOps平台。随着人工智能技术在企业核心系统(尤其是GenAI平台)中的深入应用,亟需一位能够打通AI研发与生产部署之间壁垒的工程专家。该岗位将负责从模型训练、版本管理、自动化部署到高性能推理服务的完整MLOps体系建设,并主导构建支持本地GPU与云端LLM API融合的混合式推理网关平台,以实现低延迟、高吞吐的企业级AI服务能力。推动GenAI平台及未来AI服务落地的关键力量,将显著提升AI功能的交付效率与稳定性。 岗位职责: • 设计、构建和维护可扩展的 MLOps平台,实现AI模型从训练、版本控制、部署到监控的全生命周期管理。 • 基于 vLLM、TensorRT-LLM 、TGI 等框架,在大规模GPU集群上开发并优化大语言模型(LLM)推理流水线。 • 构建融合本地GPU模型与云上LLM API 的混合推理网关平台,实现智能路由、负载均衡与成本性能的优化。 • 搭建自动化 LLM微调(Fine-Tuning)流水线,支持LoRA、QLoRA等参数高效训练方法,涵盖数据预处理、分布式训练与检查点管理。 • 推动 RAG(检索增强生成)能力服务化(RAG-as-a-Service),集成并运维主流向量数据库(如 Pinecone、Milvus、Weaviate)。 • 通过 Prometheus、Grafana、OpenTelemetry 及自研监控方案,保障AI系统的可观测性与稳定性。 • 与AI科学家和应用工程师协作进行模型优化(量化、剪枝、蒸馏),提升推理效率与资源利用率。 • 支持 GenAI CN平台的高性能模型服务需求,确保低延迟、高并发的服务能力。 • 制定AI模型服务的关键性能指标(KPI)与服务等级协议(SLA),量化业务价值与系统表现。 • 使用 GitLab CI、Jenkins、ArgoCD 等工具实现AI工作流的CI/CD自动化,确保可复现性与可审计性。