logo of tencent

腾讯腾讯视频-多模态算法负责人

社招全职5年以上PCG技术地点:深圳状态:招聘

任职要求


1.计算机视觉、人工智能相关领域的算法研究5年以上经验,研究生及以上学历,具有大规模数据处理和集群训练的经验和真实大型业务上落地的案例;
2.具有团队管理经验,良好的内外沟通…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责腾讯视频多模态内容理解,包括但不限于大语言模型LLM,多模态MLLM模型的研发和应用;
2.负责视频的多种模态的特征相关算法研发和产品落地,如素材生产,智能剪辑等;
3.探索生成式技术在影视制作中的落地场景。
包括英文材料
OpenCV+
算法+
学历+
还有更多 •••
相关职位

logo of alibaba
社招5年以上技术类-算法

● 作为多模态搜索算法团队的负责人,主导构建全球领先的AI驱动跨境B2B搜索引擎,帮助全球买家高效寻找优质制造工厂。 ● 带领团队攻克复杂采购需求的理解难题,支持用户通过图像、图文、Excel表格、PDF文档等多模态输入方式表达采购意图,实现端到端智能解析与语义理解。 ● 设计并落地先进的多模态融合架构,结合视觉、语言与结构化数据理解技术,提升对产品规格、工艺要求、批量参数等关键信息的精准提取能力。 ● 构建高精度、可扩展的搜索引擎匹配系统,融合语义推理、知识构建与向量检索技术,实现“所想即所得”的智能搜索体验。 ● 与产品、工程及业务团队深度协作,洞察业务需求,定义合理的技术路线图,推动技术创新与产品落地。

更新于 2025-12-09杭州
logo of bytedance
社招A174584

团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。 在这里,你将有机会参与搜索业务的多模态技术研发和落地。用前沿的深度学习算法、海量文本、图片、视频数据,用激动人心的技术给用数亿用户带来更理想的多模态搜索体验。方向可能包括: 1、多模态生成大模型:视频多模态大模型、大规模细粒度分类、自监督学习等模型应用和研究; 2、视觉智能:视频分析、物体检测、主体识别、视频tracking、细粒度分类等技术,真正理解用户需求; 3、视觉搜索体验改进:相关性排序召回、用户行为模型、意图识别等各个搜索模块的体验改进。

更新于 2024-03-01北京
logo of fliggy
社招5年以上

1. 负责OTA在线旅行领域的多模态大模型的方案设计与落地,包括预训练、指令微调与对齐,强化学习/RLHF后训练,并在内容生产,拍照讲解等多个旅行行业场景落地 。 2. 负责研究生成理解统一,VQA,高效多模态数据管线等方向。 3. 负责跟踪并实践多模态生成大模型前沿技术,引入新的算法技术及理念,推动业务落地及技术优化。

更新于 2026-01-30杭州
logo of kuaishou
社招5年以上D13811

1、深入理解业务,识别平台内违法、违规等不良内容和恶意用户,制定有效的打压策略; 2、带领团队完成内容安全领域治理方案的制定和落地; 3、持续完善监控体系,及时发现、控制新增类型的风险。

更新于 2025-06-17北京