阿里巴巴1688-图像搜索算法专家-多模态/CV
任职要求
1.计算机视觉和深度学习等相关专业,硕士/博士; 2.具备扎实的计算机视觉/机器学习/深度学习理论功底和算法经验,或者在该领域有优秀的学术成果 (例如,主流会议CVPR/ICCV/ECCV/NeurIPS/ICLR等,发表过一作论文); 3.在计算机视觉领域有高影响力成果者优先, 例如,高引论文,或者行业影响力比赛 (第1名), 或者优秀开源贡献者; 4.熟练使用C/C++、Python其中一种开发语言;有利用视觉/深度学习创新技术解决行业难题,并带来大幅业务增长者优先; 5.有很强的创新能力,能够解决高挑战性问题,自我驱动能力强,出色的沟通能力与抗压能力,善于跨团队协作,且具备技术决策与团队管理能力。
工作职责
"让每张图片都成为打开全球供应链的钥匙"——我们正在构建下一代智能视觉中枢,让中小企业的采购效率提升10倍,让中国工厂的优质商品被全球买家精准发现。在这里,你将面对万亿级商品图像的复杂挑战,构建服务数百万企业买家的智能视觉中枢。 1.负责1688平台商品图像搜索的计算机视觉算法创新与研发,重点突破大规模图像及多模态算法,提升B2B场景下的商品识别与检索效率。 2.主导1688图像搜索系统的视觉算法技术方向,包括商品多模态理解、图像特征提取与语义匹配,支持平台核心业务的精准搜索与推荐。 3.结合行业趋势,探索生成式AI、多模态同款搜索等前沿技术,解决B2B场景中的找挑体验问题,推动算法在业务中规模化应用并实现显著增长。

1,理解电商场景商品、商品匹配业务,结合得物自身场景特点,提升算法指标; 2,理解电商服装商品特点,优化服装尺码推荐准确度; 3,参与商品内容理解算法研发,图像匹配相关模型设计和研发。
高德信息算法专项招聘方向 业务背景 高德地图作为行业领先的出行平台,持续探索AI与大数据技术在地图、导航、出行服务等领域的创新应用,现面向算法、工程、数据领域招聘顶尖人才,推动技术驱动业务增长与用户体验升级。 核心岗位方向 算法与AI应用 1. 推荐与个性化算法:负责用户兴趣建模、个性化推荐系统设计与优化(覆盖推荐算法专家、个性化推荐/搜索算法工程师)。 2. 广告算法:优化广告预估模型、创意策略、流量分配机制及增长路径(需熟悉CTR/CVR预估、机制设计)。 3. 强化学习与智能决策:研究强化学习在路径规划、动态资源分配等场景的落地应用。 4. 多模态内容理解:探索文本、图像、时空数据融合的多模态算法,提升内容分析与场景理解能力。 搜索与数据技术 1. 搜索算法:优化搜索排序、语义理解及RAG(检索增强生成)引擎开发(需熟悉NLP、信息检索技术)。 2. 用户画像与增长:构建用户行为分析体系,驱动商家/用户增长策略(需具备数据挖掘与增长分析经验)。
AE搜索算法团队,负责AIDC AliExpress(AE)、JP- AO和天猫淘宝海外等国际化电商搜索业务优化,为全球100多个国家使用不用语言的用户持续电商搜索体验与效率,并结合大模型升级技术与产品体验创新。 多年来团队紧跟工业界和学术界前沿,在多语言Query理解与相关性、国家差异化召回与排序模型、多语言Query导购与大模型在多语言搜索中应用等技术方向持续探索创新,带来业务快速增长同时发表⾼⽔平学术论⽂20+篇(如AAAI、 IJCAI、TKDE、TMM、RecSys、CIKM和ICDM),申请专利15+项。 大规模深度模型的搜索算法研究,包括但不限于: 1. 多语言Query理解、商品理解和相关性,包括:Query和商品NER、Query类目预测、Query改写与扩展、多语言&跨语言语义相关性等;LLM在多语言电商搜索领域应用,包括:大模型CT和SFT,以及在Query理解、语义相关性、商品理解上的应用; 2. 个性化召回与排序相关技术:基于大规模深度模型的CTR/CVR预估模型及个性化召回模型,包括用户行为序列建模、多目标建模、多模态跨场景迁移建模、国家差异化建模体系建设等; 3. 个性化多语言Query推荐,包括:下拉、底纹、风向标等场域,基于异构行为序列建模、多场景建模的多语言Query推荐技术研究与应用;
团队介绍: 高德地图机器学习研发部是公司AI核心技术引擎,聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地,支撑亿级用户产品,同时长期投入前沿探索,在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文,多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源,鼓励创新突破,诚邀你与顶尖算法专家并肩,共同定义AI的未来!如果你渴望挑战多模态与生成式AI的技术巅峰,在视频、图像、大模型的交叉领域实现突破,欢迎加入我们!团队的github页面是:https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发,见证技术直接赋能业务; • 与学术大牛和工业界专家共事,持续提升技术视野; • 顶配算力资源+开放创新氛围,支持前沿探索与顶会论文发表。 具体职责包括但不限于: 1. 视频生成:负责视频生成技术的前沿技术的研究,对AIGC的diffusion和auto-regressive技术有深入了解,在T2I/AIGCT2V/I2V上面有一定的研究,图文对齐,长视频生成等有一定的研究,做好视频生成在高德业务(广告,POI详情页等)中的进行落地。 2. 视频理解:能够使用和优化多模态大模型对用户上传的视频进行质量理解,标签,densecaption,视频summary等生成,作用到视频的搜索,广告,推荐等业务的落地。 3. 世界模型: 参与世界模型的构建,能够使用最新的视频生成技术,3D技术等构建符合人类物理规律的统一的世界模型,在高德的业务进行落地。 4. 紧跟技术前沿和技术沉淀,形成顶会论文和专利。