logo of didi

滴滴AI 推理框架资深研发工程师(J250811008)

社招全职技术地点:北京状态:招聘

任职要求


1. 计算机、数学、电子工程、通信等相关专业本科及以上学历;
2. 熟练掌握Linux环境下的C/C++,具备优秀的软件开发能力,对数据结构和算法设计有较为深刻的理解;
3. 学习能力强,有强烈的求知欲和自我驱动能力,良好的沟通能力和团队协作能力;
4. 有CPU…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责滴滴 AI 推理框架的架构设计,应用于多个场景(NLP, ASR, LLM)
2. 参与高性能算子的开发及优化,支持多个后端
3. 参与模型量化相关工具设计及开发工作
4. 参与深度学习图优化,编译优化,分布式推理等性能优化工作
5. 参与服务化框架开发,SDK 封装及功能开发
包括英文材料
学历+
Linux+
C+
C+++
数据结构+
还有更多 •••
相关职位

logo of didi
社招技术

1. 负责滴滴 AI 推理框架的架构设计,应用于多个场景(CV, NLP, ASR, LLM). 2. 参与高性能算子的开发及优化,支持多个后端(GPU, arm, x86, DSP等). 3. 参与模型量化相关工具设计及开发工作。 4. 参与深度学习图优化,编译优化,分布式推理等性能优化工作。 5. 参与服务化框架开发,SDK 封装及功能开发。

更新于 2025-10-24北京
logo of baidu
社招MEG

-参与公司深度学习推理引擎、AI编译器的架构设计、开发和优化,确保领域内推理引擎技术的先进性 -参与多模态LLM、视频生成模型推理性能性能的极致优化,保持业界SOTA -研究最近的推理优化技术,跟踪最新研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展,并应用到业务 -和团队一起攻克高性能、高并发、高可用性等各种不同技术场景下的技术挑战

更新于 2025-04-25北京
logo of baidu
社招3年以上ACG

-负责AI Agent及相关智能应用的设计、开发和优化,打造高效、可靠的Agent系统 -深入探索大模型(如GPT、Claude等)的应用场景,优化Agent的决策、推理和交互能力 -主导RAG(检索增强生成)相关技术的研发,提升Agent的知识检索与生成质量 -研究并应用最新的AI技术(如多模态、强化学习等),提升Agent的智能化水平 -与产品、算法、工程团队紧密协作,推动AI Agent的落地和规模化应用 -关注行业前沿技术动态

更新于 2025-08-26北京|上海|深圳
logo of dingtalk
社招3年以上技术类-算法

钉钉正在全面拥抱多模态AI,正在致力于将视觉大模型、边缘智能与实时视频分析深度融合,赋能智能零售、智慧工厂、智能交通等多个行业。我们拥有强大的工程化能力和创新研发氛围,期待志同道合的技术精英加入,共同推动视觉AI落地千行百业。 我们正在寻找在视觉AI领域具备真正工程化落地经验的技术人才,你将参与公司核心视觉AI系统的研发与优化,负责从算法设计、模型训练到高性能部署、大规模流式处理的全链路技术实现。具体职责包括: 1. 视觉大模型与算法开发 ○ 负责视觉大模型的后训练(Post-training)优化,包括微调、蒸馏、量化、剪枝等,提升模型在实际场景中的泛化能力与效率。 ○ 开发端侧视觉大模型,针对边缘设备进行轻量化设计与部署。 ○ 设计并实现传统CV算法(如目标检测、跟踪、姿态估计、图像增强等)与深度学习模型的融合方案。 ○ 构建视觉嵌入生成与特征提取模型,支持跨模态检索、相似性匹配等应用。 ○ 能根据实时性、性能、成本等多维约束,设计合理的算法组合与技术路线,实现最优落地效果。 ○ 在行业专家的指导下完成高质量的数据清洗和标注,建立多行业多场景的视觉AI评估框架 2. 高性能推理部署与优化 ○ 基于不同算法特性,选择并实施高并发、大吞吐的推理部署方案,熟练使用以下技术栈: ■ 推理框架:Triton Inference Server、ONNX Runtime、TensorRT ■ 部署平台:KServe + Triton / KServe + vLLM ○ 实现模型的动态批处理、自适应推理、低延迟响应,优化端到端服务性能。 ○ 负责模型格式转换、算子优化、硬件适配(GPU/TPU/NPU)及性能调优。 3. 分布式视频流处理系统构建是加分项 ○ 构建高可用、可扩展的分布式视频流处理 pipeline,支持多路视频流的实时接入与处理。 ○ 基于 Kafka + Flink 实现视频帧的流式消费、分发与状态管理。 ○ 完成视频数据的实时AI推理、结果聚合、元数据落盘,并与下游系统无缝集成。 ○ 保障系统在高负载下的稳定性、容错性与可监控性。 4. 跨团队协作与技术沉淀 ○ 与产品、业务、后端及硬件团队紧密协作,推动AI能力在真实业务场景中的落地。 ○ 输出技术文档、最佳实践,参与构建公司级AI工程化平台与工具链。

更新于 2025-12-05杭州