顺丰计算机视觉高级工程师（多模态）

社招全职3-5年2026-02-05地点：深圳状态：招聘

扫码手机上打开

任职要求

* 计算机/自动化/电子等相关专业，研究生以上学历；2年及以上视觉/检测方向经验（优秀者年限可放宽）
* 扎实的 CV/ML 基础：检测框架与常用损失（IoU/DFL/Focal/Varifocal）、数据增强、长尾与不平衡处理
* 熟练使用 PyTorch，掌…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

* 针对物流垂域场景进行深入的视觉研发，主要是面向小样本/零样本场景目标的检测
* 负责将大模型能力蒸馏到轻量化学生模型（YOLO 系），落地在边缘端，达成精度-延迟-功耗平衡
* 搭建检测训练与评估流水线：数据清洗/去重、标注规范、数据集版本化，指标包含 mAP、召回率
* 构建半监督/弱监督训练链路，并与业务无标数据结合，提升域内泛化

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

还有更多 •••

登录查看完整学习资料

相关职位

计算机视觉高级工程师

校招研发类

1、从事计算机视觉、模式识别、多媒体内容分析等方向的应用研究和开发工作，如3D重建、图像超分、OCR、多目标跟踪、场景识别等； 2、负责计算视觉核心算法及平台的设计与研发，提升公司相关产品的核心竞争力和用户体验，应用场景包括智能摄影等领域。 3、负责将前沿技术及时、适时的进行转化和优化，构筑荣耀公司在业界的领先竞争力，领域包括但不限于：图像生成、多模态理解、视频/图像理解、图像增强等。

更新于 2025-08-07北京|上海|深圳

飞猪-算法高级工程师-多模态理解与生成

社招1年以上

1. 从事多模态大模型的训练，包括预训练、指令微调与对齐，强化学习/RLHF后训练，提升模型在复杂场景下的泛化与生成能力。 2.从事高效多模态数据管线。 3. 将多模态大模型应用于内容生产，拍照讲解，多模态对话等多个旅行行业场景落地。 4.跟踪并实践多模态生成大模型前沿技术，引入新的算法技术及理念，推动业务落地及技术优化。

更新于 2026-02-10杭州

阿里国际-高级算法工程师（多模态大模型）-杭州

社招1年以上技术类-算法

团队介绍 "阿里巴巴国际数字商业集团的智能技术团队，负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合，为用户打造更好更智能化的网上购物体验，同时赋能百万商家实现更高效的经营。选择加入我们意味着投身入于高速发展的国际化电商业务，一起打造最先进的AI技术以驱动全球电商业务发展。" 职位描述 1.负责研发电商多模态预训练模型基座，抽象并解决商品理解的基础问题使得模型具备业务通识能力，并构建针对大模型幻觉问题、推理能力、模型加速等关键问题的系统性解决方案，提高下游业务的迭代效率和效果上限。 2.基于多模态预训练大模型，落地商品理解关键场景任务，比如商品类目/属性/标签预测、商品同款、商品图搜等，实现业务指标提升。 3.学习前沿论文与把握技术趋势，深入理解底层算法原理，探索实验面向未来的硬核技术，实现核心技术突破和技术创新，发表相关论文。

更新于 2025-12-02杭州

钉钉-视觉AI高级工程师 / 资深算法工程师（工程落地方向）-杭州

社招3年以上技术类-算法

钉钉正在全面拥抱多模态AI，正在致力于将视觉大模型、边缘智能与实时视频分析深度融合，赋能智能零售、智慧工厂、智能交通等多个行业。我们拥有强大的工程化能力和创新研发氛围，期待志同道合的技术精英加入，共同推动视觉AI落地千行百业。我们正在寻找在视觉AI领域具备真正工程化落地经验的技术人才，你将参与公司核心视觉AI系统的研发与优化，负责从算法设计、模型训练到高性能部署、大规模流式处理的全链路技术实现。具体职责包括： 1. 视觉大模型与算法开发 ○ 负责视觉大模型的后训练（Post-training）优化，包括微调、蒸馏、量化、剪枝等，提升模型在实际场景中的泛化能力与效率。 ○ 开发端侧视觉大模型，针对边缘设备进行轻量化设计与部署。 ○ 设计并实现传统CV算法（如目标检测、跟踪、姿态估计、图像增强等）与深度学习模型的融合方案。 ○ 构建视觉嵌入生成与特征提取模型，支持跨模态检索、相似性匹配等应用。 ○ 能根据实时性、性能、成本等多维约束，设计合理的算法组合与技术路线，实现最优落地效果。 ○ 在行业专家的指导下完成高质量的数据清洗和标注，建立多行业多场景的视觉AI评估框架 2. 高性能推理部署与优化 ○ 基于不同算法特性，选择并实施高并发、大吞吐的推理部署方案，熟练使用以下技术栈： ■ 推理框架：Triton Inference Server、ONNX Runtime、TensorRT ■ 部署平台：KServe + Triton / KServe + vLLM ○ 实现模型的动态批处理、自适应推理、低延迟响应，优化端到端服务性能。 ○ 负责模型格式转换、算子优化、硬件适配（GPU/TPU/NPU）及性能调优。 3. 分布式视频流处理系统构建是加分项 ○ 构建高可用、可扩展的分布式视频流处理 pipeline，支持多路视频流的实时接入与处理。 ○ 基于 Kafka + Flink 实现视频帧的流式消费、分发与状态管理。 ○ 完成视频数据的实时AI推理、结果聚合、元数据落盘，并与下游系统无缝集成。 ○ 保障系统在高负载下的稳定性、容错性与可监控性。 4. 跨团队协作与技术沉淀 ○ 与产品、业务、后端及硬件团队紧密协作，推动AI能力在真实业务场景中的落地。 ○ 输出技术文档、最佳实践，参与构建公司级AI工程化平台与工具链。

更新于 2026-02-10杭州