滴滴AI 推理框架资深研发工程师(J251011005)
任职要求
1、计算机、数学、电子工程、通信等相关专业本科及以上学历; 2、熟练掌握Python/C++/Cuda编程,具备扎实的算法与数据结构基础; 3、熟悉常见自动驾驶领域模型结构:如Bevfusion、Occ、Transformer、E2E等; 4、熟悉至少1种推理…
工作职责
1、负责自动驾驶领域推理性能优化,针对英伟达 GPU硬件适配推理框架(TensorRT/ONNXRuntime/Triton) 2、参与图优化、算子优化、显存优化及并行策略等方案,降低模型推理延迟。 3、参与模型量化相关工具设计及开发工作。 4、与算法、工程团队协作,推动优化后的模型在实际业务中落地,提供技术支持与问题排查。
1. 负责滴滴 AI 推理框架的架构设计,应用于多个场景(NLP, ASR, LLM) 2. 参与高性能算子的开发及优化,支持多个后端 3. 参与模型量化相关工具设计及开发工作 4. 参与深度学习图优化,编译优化,分布式推理等性能优化工作 5. 参与服务化框架开发,SDK 封装及功能开发
1、主导AI客服系统架构设计,集成大模型、知识库、工单系统及内部工具(如版权库、曲库API),实现用户问题自动分类、意图识别和智能路由,实现用户求助满意度提升; 2、搭建多智能体(Multi-Agent)协作框架,设计客服场景下Agent工作流(如:意图理解Agent、故障诊断Agent、投诉处理Agent),支持跨系统工具调用(MCP、Function Call等); 3、构建客服对话记忆管理、实时决策引擎及服务追踪(Tracing)体系,实现复杂会话状态的持续优化; 4、负责RAG(检索增强生成)系统工程化落地,结合音乐知识库(版权规则、产品文档、歌曲信息等)提升回答准确性; 5、设计客服Agent 反思(Self-Reflection)与思维链(Chain-of-Thought)机制,提升复杂问题处理能力; 6、构建故障诊断推理引擎:基于用户反馈(如“歌曲无法播放”“耳机断连”)以及关联信息,实现自动根因分析; 7、主导系统性能优化与保障,提升千万用户客服体验。
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们正在寻找对多模态技术充满热情的算法工程师,加入我们的研发团队。您将专注于多模态理解与生成,推动其在高德扫街榜等热门应用中落地,为用户提供更智能、更沉浸的服务。 主要职责: 1、多模态大模型研发:开发业界领先的图文多模态大模型,实现高质量场景理解和内容生成; 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等); 3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地; 4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。