高德地图高德-多模态理解和生成算法专家-广告和智能创作
任职要求
1、人工智能、计算机科学等相关学科硕士或博士,具备较强的学习能力和创新能力; 2、对多模态模型或者扩散模型等相关领域的前沿算法有了解,掌握指令微调及LORA等微调方法,有生成模型训练等方面的经验者优先; 3、具备扎实的编程基础,优秀的分析、解决问题的能力,能够自我驱动,良好的团队合作精神和较强的沟通能力; 4、对AI技术原理有浓厚兴趣,在主要会议(NIPS/ICML/ICLR/CVPR/ICCV/ECCV/ACL/EMNLP等)上发表过论文者优先。
工作职责
部门介绍: 我们是阿里巴巴-高德的大模型和AIGC核心部门,承接公司的重点业务,包括本地生活场景中的广告创意、商品理解、内容智能创作和分发,出行场景的AI智能化等,研究领域广泛,包括但不限于多模态大模型、大语言模型、图像生成、图像编辑美化、视频生成和视频理解等,团队技术氛围好,成长空间大,拥有充足的研发资源和大量的业务应用数据,团队多篇论文入选paper digest最有影响力论文名单。 岗位职责: 1、负责多模态媒体内容的理解、编辑、生成相关新技术的应用落地和探索,解决在内容智能创作以及广告创意等的应用中的算法难点; 2、研究和应用计算机视觉(CV)等相关技术,熟悉多模态大模型或者图像编辑生成等方向的经典网络模型,了解各种常用网络训练方式及调优方式; 3、前沿技术探索:跟踪和深入探索技术研究前沿,提出创新性方案,形成论文或者专利。
1、广告AIGC:负责以可灵模型等为代表的前沿视频生成式AI在内容创作方面的算法研发和落地,包括但不限于text to video, image to video,image and video editting等,结合文本/图像/视频/音频等多模态匹配技术、广告投放优化策略和模型,优化AIGC系统生成效果和广告投放效果; 2、追踪业界创意、多模态及Generative AI方向最新技术,落地应用并提升广告创意理解、自动生成和优化等场景的效果。
1、广告AIGC:负责以可灵模型等为代表的前沿视频生成式AI在内容创作方面的算法研发和落地,包括但不限于text to video, image to video,image and video editting等,结合文本/图像/视频/音频等多模态匹配技术、广告投放优化策略和模型,优化AIGC系统生成效果和广告投放效果; 2、追踪业界创意、多模态及Generative AI方向最新技术,落地应用并提升广告创意理解、自动生成和优化等场景的效果。
1、负责公司产品的智能广告创意,探索应用 DiffusionModel, GPT,Qwen,CV/NLP 在营销场景/短视频领域实现对广告文案、视频、图片等素材进行内容理解并高质量生成投放竞争力素材; 2、追踪业界创意、多模态及Generative AI方向最新技术,落地应用并提升广告创意理解、自动生成和优化等场景的效果。 3. 探索和实施生鲜垂直类行业下的AIGC营销素材生产工作流,从预训练到微调再到强化学习,共同构建更高效智能的营销设计生产范式。
团队介绍: 高德地图机器学习研发部是公司AI核心技术引擎,聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地,支撑亿级用户产品,同时长期投入前沿探索,在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文,多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源,鼓励创新突破,诚邀你与顶尖算法专家并肩,共同定义AI的未来!如果你渴望挑战多模态与生成式AI的技术巅峰,在视频、图像、大模型的交叉领域实现突破,欢迎加入我们!团队的github页面是:https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发,见证技术直接赋能业务; • 与学术大牛和工业界专家共事,持续提升技术视野; • 顶配算力资源+开放创新氛围,支持前沿探索与顶会论文发表。 具体职责包括但不限于: 1. 视频生成:负责视频生成技术的前沿技术的研究,对AIGC的diffusion和auto-regressive技术有深入了解,在T2I/AIGCT2V/I2V上面有一定的研究,图文对齐,长视频生成等有一定的研究,做好视频生成在高德业务(广告,POI详情页等)中的进行落地。 2. 视频理解:能够使用和优化多模态大模型对用户上传的视频进行质量理解,标签,densecaption,视频summary等生成,作用到视频的搜索,广告,推荐等业务的落地。 3. 世界模型: 参与世界模型的构建,能够使用最新的视频生成技术,3D技术等构建符合人类物理规律的统一的世界模型,在高德的业务进行落地。 4. 紧跟技术前沿和技术沉淀,形成顶会论文和专利。