logo of youku

优酷算法工程师-多模态算法

实习兼职虎鲸文娱2026届实习生招聘地点:杭州状态:招聘

任职要求


1、专业背景:具有图像/视频生成相关领域的知识,熟悉StableDiffusion等生成算法原理,深入了解IP-adapter、ControlNet等图像控制生成算法;
2、编程技能:熟悉使用Python,PyTorch,具备扎实的编…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


深入研究AIGC领域内的图像和视频生成算法,重点突破多模态内容生成,长视频语义一致性等关键技术。
1、参与AIGC视频生产链路模块化开发与性能优化;
2、通过模型训练微调提升业务场景下的视频生成效果;
3、探索控制生成、风格迁移等算法的优化与落地。
包括英文材料
算法+
还有更多 •••
相关职位

logo of aliyun
实习阿里云2026届

阿里云持续推进AI 技术深化战略布局, 围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 1、从事多模态算法和模型的研究与开发,包括但不局限于文本-图像、文本-视频等跨模态算法研发和优化,跟进并保持业界技术领先; 2、推进跨模态内容理解/生成前沿技术的创新落地。设计和优化现有算法,提高性能和准确性,确保高质量的用户体验; 3、关注多模态/NLP/CV等方向的前沿技术,及时将新技术应用到产品中。

更新于 2025-06-17北京|杭州|深圳
logo of quark
校招智能信息秋季20

1.从事多模态生成/理解大模型的研究与开发,包括但不局限多模态生成预训练、多模态理解、多模态数据处理、多模态后训练、多模态强化学习等跨模态算法的研发和优化,跟进并保持业界技术领先; 2.推进跨模态内容理解/生成前沿技术的创新落地。设计和优化现有算法,提高性能和准确性,确保高质量的用户体验; 3.关注多模态/NLP/CV等方向的前沿技术,及时将新技术应用到产品中。

更新于 2025-08-13北京|杭州|上海
logo of antgroup
校招蚂蚁集团2026

1、研发和探索多模态内容理解或生成算法(文本/图像/声音/视频等),并应用于搜索推荐、内容生成、智能交互等核心业务中。 2、提出和实现业界领先的多模态算法创新,包括但不限于多模态预训练、多模态大模型、多模态表征学习等等,并应用到核心业务中。

北京|上海|杭州
logo of bytedance
社招A173988

1、与业务方紧密合作,理清业务需求并从多模态角度提供解决方案; 2、跟进前沿多模态算法,了解常见多模态任务、数据、评测手段,能够使用内外部多模态工具; 3、处理和分析多模态数据,需要能够有效地清洗、整理和可视化数据等; 4、在多模态LLM上要做到用能改,并在业务数据上Finetune; 5、着重探索基于多模态LLM的视频内容理解,支撑各类业务; 6、与各团队紧密协作,确保算法实施满足业务需求。

更新于 2023-10-31北京