传音高级算法工程师-CV(J15971)
任职要求
数学、计算机、自动化或其他相关专业。 具备扎实的数学功底,掌握计算机视觉和图像处理基本算法,理解深度学习算法原理。 具备扎实的编程功底,熟悉Pytorch等主流深度学习框架,熟练使用C++/Python等至少一种编程语言,熟悉Linux开发环境。 掌握扩散模型原理,熟悉DDPM、Stable Diffusion以…
工作职责
负责AIGC+图像(包括视频)的算法研发工作,助力AIGC内容生态。 针对当前AIGC算法中的痛点问题,设计优化和加速算法,赋能公司图像视频生成业务要求。
1、负责端侧CV算法的研发和落地,包括但不限于目标检测、识别、跟踪等算法; 2、负责算法工程化,包括模型工程化和优化等工作; 3、负责端侧算法框架设计开发; 4、可能也会参与一部分多模态大模型相关的工作;
1、与业务方紧密合作,理清业务需求并从多模态角度提供解决方案; 2、跟进前沿多模态算法,了解常见多模态任务、数据、评测手段,能够使用内外部多模态工具; 3、处理和分析多模态数据,需要能够有效地清洗、整理和可视化数据等; 4、在多模态LLM上要做到用能改,并在业务数据上Finetune; 5、着重探索基于多模态LLM的视频内容理解,支撑各类业务; 6、与各团队紧密协作,确保算法实施满足业务需求。
1、负责图像增强方面的算法设计和开发,包括数据构建、模型训练、端侧部署、性能优化等; 2、负责消费电子产品中深度学习算法研发,包括但不限于目标检测、识别、属性等模型的训练、优化和在产品中的部署落地; 3、针对产品结合图像相关技术,能够提出解决方案并进行算法设计、分析和测试; 4、关注 CV 相关领域内最新研究进展,能将算法落实到项目中。
团队介绍 "阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。" 职位描述 1.负责研发电商多模态预训练模型基座,抽象并解决商品理解的基础问题使得模型具备业务通识能力,并构建针对大模型幻觉问题、推理能力、模型加速等关键问题的系统性解决方案,提高下游业务的迭代效率和效果上限。 2.基于多模态预训练大模型,落地商品理解关键场景任务,比如商品类目/属性/标签预测、商品同款、商品图搜等,实现业务指标提升。 3.学习前沿论文与把握技术趋势,深入理解底层算法原理,探索实验面向未来的硬核技术,实现核心技术突破和技术创新,发表相关论文。