logo of dji

大疆高级计算机视觉算法工程师(多模态大模型)

社招全职3年以上算法地点:深圳 | 上海状态:招聘

任职要求


1. 硕士及以上学历,具备计算机科学、信息工程、电子工程、机器人学等相关专业背景;
2. 具备对深度学习、机器人学、计算机图形学、计算机视觉几何等领域的深入认识,并了解各个算法的条件和瓶颈;
3. 具备C++/Python/Pytorch/ROS开发经验;
4. 具有3年以上VLM,强化学习等科研或开发经验,且熟悉目标分割、目标检测、姿态估计者优先;…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责多模态融合算法研发,针对无人机、手持影像开展环境理解与交互控制相关算法系统的设计与研发;
2. 负责设计和构建VLM/VLA体系能力关键环节,例如数据质量、数据挖掘、数据生成、自动标注、自动迭代等任一或多个模块的设计和算法实现;
3. 开展跨模块沟通,主导相关智能功能系统方案的设计、研发与交付。
包括英文材料
学历+
深度学习+
OpenCV+
算法+
C+++
Python+
PyTorch+
还有更多 •••
相关职位

logo of dji
社招软件

1. 负责与产品经理对接需求,开展跨模块沟通,调研前沿技术(如多模态大模型)并主导相关智能拍摄功能系统方案的设计、研发与交付(如智能跟随、大师镜头、手势语音等自然交互); 2. 依托平台组件能力,结合产品需求,高效组合创新,完成相关算法系统的设计与研发,并与嵌入式工程师协作完成功能落地。

更新于 2025-04-03深圳
logo of dji
社招算法

1. 负责研发面向无人机场景的大模型算法,实现感知、路径规划、动态避障与飞行控制的深度融合; 2. 负责开发多模态大模型(视觉/激光雷达/MU/地理信息等),优化无人机在复杂环境(城市、野外、低空)下的自主决策能力; 3. 参与构建无人机大规模数据集,设计数据标注策略及仿真训练系统,优化提升无人机系统的性能; 4. 持续关注跟踪泛机器人以及大模型领域的前沿技术进展,进行技术对标以及原型验证工作。

更新于 2025-06-18深圳|上海
logo of alibaba
社招1年以上技术类-算法

团队介绍 "阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。" 职位描述 1.负责研发电商多模态预训练模型基座,抽象并解决商品理解的基础问题使得模型具备业务通识能力,并构建针对大模型幻觉问题、推理能力、模型加速等关键问题的系统性解决方案,提高下游业务的迭代效率和效果上限。 2.基于多模态预训练大模型,落地商品理解关键场景任务,比如商品类目/属性/标签预测、商品同款、商品图搜等,实现业务指标提升。 3.学习前沿论文与把握技术趋势,深入理解底层算法原理,探索实验面向未来的硬核技术,实现核心技术突破和技术创新,发表相关论文。

更新于 2025-12-02杭州
logo of oppo
社招3-5年SOFTWARE

1. 负责多模态大模型的基础能力提升,如长窗口拓展,逻辑推理提升,指令遵循提升、自动化生成prompt等基础能力构建。 2. 负责图文多模态模型的下游算法研究,例如:SFT微调(包括full和lora),强化学习,图搜增强,知识蒸馏等技术方向; 3. 负责图文多模态技术在AI搜索、图片结构化提取、图片内容理解等应用领域云侧和端侧的研究和落地工作; 4. 跟进业界前沿技术,持续提升团队在图文多模态算法方面的技术积累。

更新于 2025-12-05深圳