字节跳动资深多模态算法工程师-内容理解方向
任职要求
1、本科或以上学历,计算机、自动化、电子信息或相关专业,拥有5年以上的算法研发经验,1年以上团队管理经验; 2、编程基础扎实,熟悉基本的数据结构和算法; 3、算法基础扎实,对计算机视觉或NLP至少一个领域有丰富经验,同时具有AIGC相关的算法经验和业务落地经验; 4、能够紧跟前沿技术,同时洞察行业发展趋势,设计整个团队的技术架构,规划中长期发展路线; 5、具备优秀的分析及解决问题能力、逻辑思维能力、沟通协作能力,保持对新事物的好奇心,责任心强,诚信可靠; 6、在AI顶会顶刊(如CVPR,ICCV,ECCV,TPAMI,IJCV,ICML,NeurIPS,ICLR,ACL,EMNLP,NAACL等)发表过AIGC相关的高水平论文者优先。
工作职责
1、负责基础模型和生成式人工智能的基础能力建设和业务落地,包括但不限于文本生成/翻译、图生文、深伪技术、大模型高效训练/推理等等,追踪业界最前沿进展,并进行前瞻性的技术研究; 2、带领团队将AIGC相关技术在广告、电商、短视频、直播等商业产品的内容理解上落地,构建新一代基于大模型的商业化生态; 3、负责大模型算法团队的项目规划、团队建设、跨团队合作,打造行业领先的内容理解算法团队。
1、与业务方紧密合作,理清业务需求并从多模态角度提供解决方案; 2、跟进前沿多模态算法,了解常见多模态任务、数据、评测手段,能够使用内外部多模态工具; 3、处理和分析多模态数据,需要能够有效地清洗、整理和可视化数据等; 4、在多模态LLM上要做到用能改,并在业务数据上Finetune; 5、着重探索基于多模态LLM的视频内容理解,支撑各类业务; 6、与各团队紧密协作,确保算法实施满足业务需求,有优秀的团队管理经验。
1、负责前沿计算机视觉和图形学AI算法研究,跟进业界LLM、AIGC、多模态等前沿技术 2、负责多模态技术实现图像/视频内容理解、图像文本描述等在车载智能座舱的落地应用
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们正在寻找对多模态技术充满热情的算法工程师,加入我们的研发团队。您将专注于多模态理解与生成,推动其在高德扫街榜等热门应用中落地,为用户提供更智能、更沉浸的服务。 主要职责: 1、多模态大模型研发:开发业界领先的图文多模态大模型,实现高质量场景理解和内容生成; 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等); 3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地; 4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。