vivo图像算法专家(多模态大模型及Agent研发方向)
任职要求
1.计算机科学、电子工程、数学等相关专业硕士及以上学历。 2.至少3年以上相关领域工作经验,拥有从0到1搭建AI项目的经验者优先。 3.在CVPR, ICCV, ECCV, NeurIPS, ICML等顶级国际会议上发表过论文者优先考虑。 4.熟悉TensorFlo…
工作职责
1.参与设计并实现面向手机摄影领域的多模态(图像、视频等)深度学习模型,提升手机拍摄体验。 2.研究开发能够理解用户意图、自动优化照片质量的智能代理(Agent)系统。 3.对现有技术进行持续迭代优化,探索新的应用场景和技术突破点。 4.与产品团队紧密合作,根据市场需求定义项目目标,并推动技术创新成果的应用落地。 5.撰写高质量的技术文档和研究报告,参与相关学术会议或期刊的文章发表。
AI搜索和智能体产品后端系统研发: 1. 设计并实现AI搜索Agent应用,包括Query理解、记忆存储、环境感知等模块的集成与优化。 2. 负责Agentic Search(搜索智能体)技术探索和架构研发,支持多模态(文本、图像、视频)检索与应用创新。 3. 抽象并开发企业级别的AI应用平台,支持Agent相关应用的接入与扩展,确保平台的高可用性和可扩展性。 4. 实现平台的模块化设计,支持快速迭代与功能扩展,满足AI时代本地生活服务领域智能体应用快速发展需求。 5. 与业务部门(如产品、运营团队)协作,将AI搜索能力嵌入现有工作流(如智能问答、个性化推荐)。 6. 负责AI系统的日常运维,包括异常监控、接口优化及用户培训,确保生产环境高效运行。
1.为导航规划、地图渲染、高精度定位和地图数据编译等高德核心服务端系统进行全面的质量保障和测试体系建设; 2.设计并执行综合测试方案,确保高复杂度地图业务系统的质量和可靠性; 3.通过多种创新技术手段(如LLM、图像识别等)实现高度自动化的测试方法,通过持续集成/持续交付体系建设实现高效率、高质量的产品研发和交付流程。
团队介绍: 高德地图机器学习研发部是公司AI核心技术引擎,聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地,支撑亿级用户产品,同时长期投入前沿探索,在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文,多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源,鼓励创新突破,诚邀你与顶尖算法专家并肩,共同定义AI的未来!如果你渴望挑战多模态与生成式AI的技术巅峰,在视频、图像、大模型的交叉领域实现突破,欢迎加入我们!团队的github页面是:https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发,见证技术直接赋能业务; • 与学术大牛和工业界专家共事,持续提升技术视野; • 顶配算力资源+开放创新氛围,支持前沿探索与顶会论文发表。 具体职责包括但不限于: 1. 视频生成:负责视频生成技术的前沿技术的研究,对AIGC的diffusion和auto-regressive技术有深入了解,在T2I/AIGCT2V/I2V上面有一定的研究,图文对齐,长视频生成等有一定的研究,做好视频生成在高德业务(广告,POI详情页等)中的进行落地。 2. 视频理解:能够使用和优化多模态大模型对用户上传的视频进行质量理解,标签,densecaption,视频summary等生成,作用到视频的搜索,广告,推荐等业务的落地。 3. 世界模型: 参与世界模型的构建,能够使用最新的视频生成技术,3D技术等构建符合人类物理规律的统一的世界模型,在高德的业务进行落地。 4. 紧跟技术前沿和技术沉淀,形成顶会论文和专利。