滴滴AI 推理框架资深研发工程师(J251011005)
任职要求
1. 计算机、数学、电子工程、通信等相关专业本科及以上学历; 2. 熟练掌握Linux环境下的C/C++,具备优秀的软件开发能力,对数据结构和算法设计有较为深刻的理解; 3. 学习能力强,有强烈的求知欲和自我驱动能力,良好的沟通能力和团队协作能力; 4. 有CPU…
工作职责
1. 负责滴滴 AI 推理框架的架构设计,应用于多个场景(CV, NLP, ASR, LLM). 2. 参与高性能算子的开发及优化,支持多个后端(GPU, arm, x86, DSP等). 3. 参与模型量化相关工具设计及开发工作。 4. 参与深度学习图优化,编译优化,分布式推理等性能优化工作。 5. 参与服务化框架开发,SDK 封装及功能开发。
1. 负责滴滴 AI 推理框架的架构设计,应用于多个场景(NLP, ASR, LLM) 2. 参与高性能算子的开发及优化,支持多个后端 3. 参与模型量化相关工具设计及开发工作 4. 参与深度学习图优化,编译优化,分布式推理等性能优化工作 5. 参与服务化框架开发,SDK 封装及功能开发
-参与公司深度学习推理引擎、AI编译器的架构设计、开发和优化,确保领域内推理引擎技术的先进性 -参与多模态LLM、视频生成模型推理性能性能的极致优化,保持业界SOTA -研究最近的推理优化技术,跟踪最新研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展,并应用到业务 -和团队一起攻克高性能、高并发、高可用性等各种不同技术场景下的技术挑战
-负责AI Agent及相关智能应用的设计、开发和优化,打造高效、可靠的Agent系统 -深入探索大模型(如GPT、Claude等)的应用场景,优化Agent的决策、推理和交互能力 -主导RAG(检索增强生成)相关技术的研发,提升Agent的知识检索与生成质量 -研究并应用最新的AI技术(如多模态、强化学习等),提升Agent的智能化水平 -与产品、算法、工程团队紧密协作,推动AI Agent的落地和规模化应用 -关注行业前沿技术动态
钉钉正在全面拥抱多模态AI,正在致力于将视觉大模型、边缘智能与实时视频分析深度融合,赋能智能零售、智慧工厂、智能交通等多个行业。我们拥有强大的工程化能力和创新研发氛围,期待志同道合的技术精英加入,共同推动视觉AI落地千行百业。 我们正在寻找在视觉AI领域具备真正工程化落地经验的技术人才,你将参与公司核心视觉AI系统的研发与优化,负责从算法设计、模型训练到高性能部署、大规模流式处理的全链路技术实现。具体职责包括: 1. 视觉大模型与算法开发 ○ 负责视觉大模型的后训练(Post-training)优化,包括微调、蒸馏、量化、剪枝等,提升模型在实际场景中的泛化能力与效率。 ○ 开发端侧视觉大模型,针对边缘设备进行轻量化设计与部署。 ○ 设计并实现传统CV算法(如目标检测、跟踪、姿态估计、图像增强等)与深度学习模型的融合方案。 ○ 构建视觉嵌入生成与特征提取模型,支持跨模态检索、相似性匹配等应用。 ○ 能根据实时性、性能、成本等多维约束,设计合理的算法组合与技术路线,实现最优落地效果。 ○ 在行业专家的指导下完成高质量的数据清洗和标注,建立多行业多场景的视觉AI评估框架 2. 高性能推理部署与优化 ○ 基于不同算法特性,选择并实施高并发、大吞吐的推理部署方案,熟练使用以下技术栈: ■ 推理框架:Triton Inference Server、ONNX Runtime、TensorRT ■ 部署平台:KServe + Triton / KServe + vLLM ○ 实现模型的动态批处理、自适应推理、低延迟响应,优化端到端服务性能。 ○ 负责模型格式转换、算子优化、硬件适配(GPU/TPU/NPU)及性能调优。 3. 分布式视频流处理系统构建是加分项 ○ 构建高可用、可扩展的分布式视频流处理 pipeline,支持多路视频流的实时接入与处理。 ○ 基于 Kafka + Flink 实现视频帧的流式消费、分发与状态管理。 ○ 完成视频数据的实时AI推理、结果聚合、元数据落盘,并与下游系统无缝集成。 ○ 保障系统在高负载下的稳定性、容错性与可监控性。 4. 跨团队协作与技术沉淀 ○ 与产品、业务、后端及硬件团队紧密协作,推动AI能力在真实业务场景中的落地。 ○ 输出技术文档、最佳实践,参与构建公司级AI工程化平台与工具链。