阿里巴巴算法技术- 视觉搜索任务中细粒度属性理解与应用-算法工程师实习生
任职要求
1.计算机视觉和深度学习等相关专业,本科/硕士/博士; 2.具备扎实的计算机视觉/机器学习/深度学习理论功底和算法经验,或者在该领域有优秀的学术成果 (例如,主流会议CVPR/ICCV/ECCV/NeurIPS/ICLR等,发表过一作论文); 3.在计算机视觉领域有高影响力成果者优先, 例如,高引论文,或…
工作职责
1. 负责商品搜索相关的计算机视觉算法创新和研发,特别是大规模图像/多模态算法; 2. 服务于拍立淘图搜核心业务的视觉算法技术方向,包括商品多模态理解、图像理解、图像/多模态大模型应用; 3. 致力于为淘天大搜索核心业务打造行业领先的计算机视觉创新技术。
依托淘宝、天猫超大规模商业场景,我们致力于通过最前沿的多模态大模型技术驱动万亿级交易额的增长。在这里你将面对业界最复杂的电商图文、视频语境,与顶尖团队一起探索 AIGC 与多模态技术在搜索广告全链路(召回、排序、创意生成)的深度融合与变现。包括并不限于: 1. 负责电商多模态统一表征: 构建面向海量商品、直播、短视频的超大规模预训练模型(VLM),解决多模态语义对齐、细粒度特征提取及跨模态检索难题。 2. 负责生成式广告物料(AIGC): 探索 Diffusion Model、LLM 在广告创意自动生成(文案、头图、视频步进)中的应用,提升物料投放质量与点击转化率。 3. 负责多模态驱动的商业决策: 将多模态感知能力深度注入广告全链路(从搜索词理解到广告 CTR/CVR 预估),实现从“看懂图片”到“理解意图”的决策升级。 4. 负责全链路多物料优化: 针对商品、直播间、短视频等多类型物料,设计统一的跨模态排序算法,优化搜索场景下的多元流量分配效率。 5. 负责视觉底层技术创新: 针对电商复杂场景,优化 OCR、商品检测、度量学习及视觉搜索等经典任务,建立行业领先的视觉基座。
团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与抖音,今日头条,西瓜视频,剪映等App,以及国内电商,生活服务等重点业务的搜索推荐模型和策略改进,负责这些业务的搜索流量和用户渗透增长&搜索心智建设任务; 2、以推荐算法为核心技术栈,改进基于超大规模机器学习模型的推荐系统,覆盖从候选挖掘到召回,粗排,精排,多目标融合全链路技术环节; 3、探索短文本推荐和通用推荐技术的上限,重点是推荐和NLP技术的联合应用,以及多模态等前沿技术的探索。
团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与抖音,今日头条,西瓜视频,剪映等App,以及国内电商,生活服务等重点业务的搜索推荐模型和策略改进,负责这些业务的搜索流量和用户渗透增长&搜索心智建设任务; 2、以推荐算法为核心技术栈,改进基于超大规模机器学习模型的推荐系统,覆盖从候选挖掘到召回,粗排,精排,多目标融合全链路技术环节; 3、探索短文本推荐和通用推荐技术的上限,重点是推荐和NLP技术的联合应用,以及多模态等前沿技术的探索。
数据算法团队在特斯拉工业智能研发方面扮演关键角色。我们通过自主搭建数据算法平台,赋能生产制造、供应链、销售、服务和充电网络等领域,将信息转化为高价值的数据资产,从而创造更优质的产品并提供完美的用户体验。 作为特斯拉应用软件团队的数据算法工程师,您将参与自研数据算法产品和项目的全生命周期,从孵化到落地,从雏形到成熟。您将领导数据的收集、清理、预处理、模型训练以及生产部署的全流程。理想候选人应对人工智能和3D视觉技术充满热情,并紧跟该领域的最新进展。 本职位主要聚焦于工厂相关的3D机器视觉应用,包括自动视觉质检、机器人引导、视觉尺寸测量(如精确尺寸验证、公差检查和3D形状分析)、物体姿态估计以及工业自动化场景中的点云处理和实时感知。 岗位职责 机器协同控制相关:负责相机标定、手眼标定、点云数据处理(如滤波、分割、检测、配准和6D位姿估计),配合机器人/PLC等技术,驱动3D视觉应用与生产协同。主动开展机器人控制和引导,促进生产制造效率。 3D数据处理相关:负责机器视觉项目中大批量3D数据(如点云、深度图像)的收集、整理、过滤和清洗。需熟练处理视觉尺寸测量任务,包括使用激光三角测量或立体视觉方法进行物体尺寸提取、形状建模和精度校准。需熟练使用Python、C++、OpenCV、PCL、Numpy、Blender等工具处理3D数据。 模型开发相关:负责3D视觉项目的物体检测、分割、姿态估计模型的数据预处理、训练、迭代、重训练,以及模型准确率提升和搜索任务。在视觉尺寸测量领域,需开发和优化相关模型(如基于PointNet的尺寸估计网络),确保测量精度达到工业标准(如微米级)。需具备Python、C++、TensorFlow/PyTorch等框架经验,并理解常用神经网络(如CNN、PointNet、Transformer变体)在3D视觉中的应用。熟悉Pandas、MongoDB(Aggregation)、Redis、Kafka等工具用于模型部署。 创新相关:对最新的3D视觉技术和趋势(如实时SLAM、神经辐射场NeRF、多模态融合)保持敏感,能够提出创新解决方案应对工业生产挑战,例如机器人路径规划中的点云配准优化或视觉尺寸测量中的实时公差检测优化,以提升质量控制效率。