大疆高级计算机视觉算法工程师(多模态大模型)
任职要求
1. 硕士及以上学历,具备计算机科学、信息工程、电子工程、机器人学等相关专业背景; 2. 具备对深度学习、机器人学、计算机图形学、计算机视觉几何等领域的深入认识,并了解各个算法的条件和瓶颈; 3. 具备C++/Python/Pytorch/ROS开发经验; 4. 具有3年以上VLM,强化学习等科研或开发经验,且熟悉目标分割、目标检测、姿态估计者优先;…
工作职责
1. 负责多模态融合算法研发,针对无人机、手持影像开展环境理解与交互控制相关算法系统的设计与研发; 2. 负责设计和构建VLM/VLA体系能力关键环节,例如数据质量、数据挖掘、数据生成、自动标注、自动迭代等任一或多个模块的设计和算法实现; 3. 开展跨模块沟通,主导相关智能功能系统方案的设计、研发与交付。
1. 负责与产品经理对接需求,开展跨模块沟通,调研前沿技术(如多模态大模型)并主导相关智能拍摄功能系统方案的设计、研发与交付(如智能跟随、大师镜头、手势语音等自然交互); 2. 依托平台组件能力,结合产品需求,高效组合创新,完成相关算法系统的设计与研发,并与嵌入式工程师协作完成功能落地。
1. 负责研发面向无人机场景的大模型算法,实现感知、路径规划、动态避障与飞行控制的深度融合; 2. 负责开发多模态大模型(视觉/激光雷达/MU/地理信息等),优化无人机在复杂环境(城市、野外、低空)下的自主决策能力; 3. 参与构建无人机大规模数据集,设计数据标注策略及仿真训练系统,优化提升无人机系统的性能; 4. 持续关注跟踪泛机器人以及大模型领域的前沿技术进展,进行技术对标以及原型验证工作。
团队介绍 "阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。" 职位描述 1.负责研发电商多模态预训练模型基座,抽象并解决商品理解的基础问题使得模型具备业务通识能力,并构建针对大模型幻觉问题、推理能力、模型加速等关键问题的系统性解决方案,提高下游业务的迭代效率和效果上限。 2.基于多模态预训练大模型,落地商品理解关键场景任务,比如商品类目/属性/标签预测、商品同款、商品图搜等,实现业务指标提升。 3.学习前沿论文与把握技术趋势,深入理解底层算法原理,探索实验面向未来的硬核技术,实现核心技术突破和技术创新,发表相关论文。