理想汽车大模型框架开发工程师
任职要求
岗位要求: 1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先; 2、精通C/C++,精通算法与数据结构,熟悉Python; 3、深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等; 4、熟悉深度学习算法基本原理,熟悉神经网络基本架构,了解至少一种深度学习训练或推理框架及其模型文件的解析,如Pytorch、Tensorflow; 5、熟悉TensorRT-LLM、VLLM等; 6、了解主流LLM/VLM模型,有LLM模型加速优化经验者优先; 7、了解MLIR,有MLIR开发经验者有限。
工作职责
主要职责: 1、负责设计, 开发和优化大模型推理框架,使能理想汽车的自动驾驶/座舱大模型落地在自研芯片平台; 2、主要通过系统优化(量化,系统优化)的手段,提升大模型在芯片上的运行效率; 3、负责机器学习系统前瞻技术的调研和引入; 4、与算法和硬件部门深度合作,进行算法,软件,硬件的联合优化。

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.Agent 框架开发:研究和实现多 Agent 协作框架,提高 Agent 在复杂任务中的稳定性与执行效果,探索如任务分解、工具使用、状态记忆等机制。 4.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 5.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。
1、参与有灵平台Agents框架设计开发与优化,并负责将Agents框架应用于游戏AI的工程化服务于游戏产品; 2、探索Agent运行引擎(推理、感知、记忆等),关注AI智能体在游戏产品中的应用场景,并不断优化Agents框架的性能,提升Agents框架的稳定性和易用性;
1、负责高德出行场景(驾车,骑行,步行)的大模型应用框架开发,构建高可用、低延迟的分布式系统; 2、负责优化Agent决策引擎、任务调度、多模态数据处理等模块的性能与稳定性; 3、负责搭建Agent与外部系统(如数据库、API、第三方服务)的高效通信机制; 4、负责保障大模型应用系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性; 5、负责协调业务资源,与大模型算法和数据源服务等团队协作,保障项目有效落地和需求高效交付。
- 负责 AI Agent 的服务端核心开发工作,基于提示词工程优化 Agent 的交互逻辑与响应效果,提升 Agent 的智能化水平和用户体验。 - 基于 AI 大模型框架,搭建和优化 Agent 的底层技术架构,保障 Agent 系统的稳定性、高效性和可扩展性。 - 深度运用大模型的 function calling/tools 能力,开发并维护符合 mcp 协议的接口,实现 Agent 与外部系统的数据交互和功能集成。 - 运用 Python、Java 等编程语言,完成 Agent 服务端的模块开发、代码重构和性能优化,确保系统满足业务需求和性能指标。 - 与产品、算法、前端等团队紧密协作,参与 Agent 产品的技术方案设计和评审,解决开发过程中的技术难题,推动产品快速迭代上线。