滴滴大模型推理框架研发工程师（高级/资深）(J250514005)

社招全职技术2025-12-02地点：北京状态：招聘

扫码手机上打开

任职要求

1. 计算机、数学、电子工程、通信等相关专业本科及以上学历.
2. 熟练掌握C++/Python，具备大型项目代码架构设计能力.
3. 熟悉Transformer架构及大模型推理相关技术（如FlashAttentio…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 主导大模型推理引擎的架构设计与核心模块开发，支撑千亿参数模型的高效分布式推理。
2. 研发面向GPU/NPU等异构计算平台的高性能算子，提升硬件利用效率。
3. 参与模型低精度量化，图优化，编译优化等性能优化工作。
4. 攻克分布式推理中的动态负载均衡、通信优化、显存管理等核心技术难题。
5. 跟踪学术界与工业界前沿技术（如vLLM、TGI、TensorRT-LLM等），推进框架迭代。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

C+++

Python+

还有更多 •••

登录查看完整学习资料

相关职位

高级/资深机器学习推理框架研发工程师

社招技术类

1. 负责机器学习推理框架的研发和维护 2. 支持商业技术中心ctr/cvr、召回、CV、NLP等核心模型的在线部署 3. 与算法团队紧密合作，不断优化系统架构和性能

更新于 2025-04-07上海

钉钉-视觉AI高级工程师 / 资深算法工程师（工程落地方向）-杭州

社招3年以上技术类-算法

钉钉正在全面拥抱多模态AI，正在致力于将视觉大模型、边缘智能与实时视频分析深度融合，赋能智能零售、智慧工厂、智能交通等多个行业。我们拥有强大的工程化能力和创新研发氛围，期待志同道合的技术精英加入，共同推动视觉AI落地千行百业。我们正在寻找在视觉AI领域具备真正工程化落地经验的技术人才，你将参与公司核心视觉AI系统的研发与优化，负责从算法设计、模型训练到高性能部署、大规模流式处理的全链路技术实现。具体职责包括： 1. 视觉大模型与算法开发 ○ 负责视觉大模型的后训练（Post-training）优化，包括微调、蒸馏、量化、剪枝等，提升模型在实际场景中的泛化能力与效率。 ○ 开发端侧视觉大模型，针对边缘设备进行轻量化设计与部署。 ○ 设计并实现传统CV算法（如目标检测、跟踪、姿态估计、图像增强等）与深度学习模型的融合方案。 ○ 构建视觉嵌入生成与特征提取模型，支持跨模态检索、相似性匹配等应用。 ○ 能根据实时性、性能、成本等多维约束，设计合理的算法组合与技术路线，实现最优落地效果。 ○ 在行业专家的指导下完成高质量的数据清洗和标注，建立多行业多场景的视觉AI评估框架 2. 高性能推理部署与优化 ○ 基于不同算法特性，选择并实施高并发、大吞吐的推理部署方案，熟练使用以下技术栈： ■ 推理框架：Triton Inference Server、ONNX Runtime、TensorRT ■ 部署平台：KServe + Triton / KServe + vLLM ○ 实现模型的动态批处理、自适应推理、低延迟响应，优化端到端服务性能。 ○ 负责模型格式转换、算子优化、硬件适配（GPU/TPU/NPU）及性能调优。 3. 分布式视频流处理系统构建是加分项 ○ 构建高可用、可扩展的分布式视频流处理 pipeline，支持多路视频流的实时接入与处理。 ○ 基于 Kafka + Flink 实现视频帧的流式消费、分发与状态管理。 ○ 完成视频数据的实时AI推理、结果聚合、元数据落盘，并与下游系统无缝集成。 ○ 保障系统在高负载下的稳定性、容错性与可监控性。 4. 跨团队协作与技术沉淀 ○ 与产品、业务、后端及硬件团队紧密协作，推动AI能力在真实业务场景中的落地。 ○ 输出技术文档、最佳实践，参与构建公司级AI工程化平台与工具链。

更新于 2026-02-10杭州

高级/资深算法工程师(MJ023289)

社招住宿业务AI &

负责 LLM 在软件研发领域的应用与落地，采用包括但不限于LLM、Agent/Multi-agent、Tool Learning、RAG、RLHF等技术，探索大模型和软件研发领域的结合，实现在业务中的应用落地。负责算法模型研发，包含但不限于Embedding、SFT、Self-instruct;参与领域模型的全流程工作，包括但不限于数据、训练、评测、推理部署，保证数据的高质量和有效性;探索Agent在复杂任务中的应用，实现基于LLM的复杂任务在软件研发领域场景的应用落地。

更新于 2026-02-05上海

高级/资深算法工程师（大模型）(MJ031086)

社招住宿业务AI &

算法工程师（大模型方向）职责描述： 1、熟练掌握NLP基础理论和算法，对深度学习和大模型有深刻理解，在文本分类、语义理解、用户意图识别、信息抽取等方向能独立开展研发工作 2、具备大模型训练和应用开发经验，如语料清洗、预训练、微调、RLHF、workflow优化和效果评估等，并撰写报告，推动上线 3、基于大量非结构化数据构建内容检索和多模态检索，开发检索优化算法 4、应用推理加速相关技术，包括但不限于量化、蒸馏、稀疏化、分布式计算、调度优化等 5、持续阅读文献，对前研技术保持追踪，结合旅游行业应用场景进行技术落地

更新于 2025-12-16上海