logo of soul

Soul APPAIGC视觉算法工程师-校招

社招全职地点:上海 | 北京状态:招聘

任职要求


- 计算机视觉、人工智能、数学等相关专业硕士及以上学历。
- 在国际顶级会议/期刊(如 CVPRICCVECCV、NeurIPS、ICLR、SIGGRAPH、TPAMI 等)以第一作者发表过论文,或在开源社区/竞赛中有突出成果。
- 熟悉主流大模型训练与推理框架(如 PyTorch、M…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


近年来,AIGC 技术在图像与视频生成方向取得了突破性进展,生成对抗网络、扩散模型以及多模态大模型的快速迭代,使视觉内容的创作方式发生了革命性变化。我们专注于探索生成式 AI 在视觉生成、虚拟内容创作和沉浸式体验中的前沿应用,致力于打造具备创意表达与真实感渲染能力的新一代图像与视频生成大模型。
随着模型在高分辨率生成、长视频建模与跨模态理解上的持续演进,如何进一步提升生成质量、控制力与效率,并将前沿技术落地到实际产品场景,是我们的核心研究方向。
如果你对生成式 AI、计算机视觉和视频生成充满热情,并希望参与构建下一代 AIGC 创作平台,欢迎加入我们,共同突破视觉生成的技术边界。
岗位职责
- 图像与视频生成算法创新:围绕GAN、VAE、Diffusion Models、Video Diffusion 等前沿技术,开展图像/视频生成、编辑、控制的算法研究与优化。
- 高分辨率与长视频建模:探索多尺度建模、时序一致性与跨帧约束方法,提升长视频生成的稳定性与沉浸感。
- 多模态融合与可控生成:设计跨模态联合建模方案,实现文本、图像、视频、语音等模态的协同生成与精准控制。
- 端到端研发闭环:参与或主导从数据构建、模型训练、性能评测到应用部署的完整研发流程。
- 前沿方向探索:紧跟 LLM、Diffusion Models、AR等前沿技术,推动 AIGC 在视觉生成领域的创新与落地。
包括英文材料
OpenCV+
学历+
CVPR+
ICCV+
ECCV+
还有更多 •••
相关职位

logo of soul
社招

近年来,以大模型为核心的生成式人工智能在人机交互和虚拟陪伴领域展现出巨大潜力。我们专注于探索生成式AI在社交场景下的前沿应用和产业落地,致力于打造具备多模态感知与生成能力的社交大模型。 随着大语言模型的快速演进,如何让模型更好地理解多维度信息,并在社交场景中提供自然、细腻、沉浸感十足的语音与多模态交互体验,成为我们的核心研究方向。 如果你对生成式AI、多模态建模和智能交互充满热情,并希望参与构建下一代社交与陪伴大模型,欢迎加入我们,共同突破技术边界。 1. 多模态大模型算法创新:面向社交与智能交互需求,设计与优化模型架构,实现文本、语音、视觉等模态的联合建模,推动行业领先的社交多模态大模型研发。 2. 语音编码与生成算法突破:探索高效语音编码策略,优化离散化与连续特征建模方案,提升语音合成质量和建模效率。 3. 端到端技术闭环:参与或主导从数据构建、模型训练、性能评测到部署上线的完整研发流程。 4. 前沿应用技术探索:紧跟LLM、RL、Diffusion Models等前沿技术发展,探索创新范式并提升模型性能。

更新于 2025-09-09上海|北京
logo of horizon
校招算法序列

1. 参与设计、开发和优化机器人Real2Sim算法方案,结合3D重建、3D&视频生成等技术,提升仿真环境真实性并降低仿真资产获取成本,以减缓在仿真中训练的机器人算法在迁移到真实世界时出现的性能下降; 2. 通过创新的技术解决柔性物体、流体、触觉仿真等复杂的仿真问题; 3. 设计复杂环境下的机器人3D感知&理解系统搭建,支持机器人导航&操作等下游任务能力提升; 4. 跟踪三维重建、AIGC生成领域的最新研究,探索解决机器人Real2Sim、Sim2Real领域关键问题的创新技术。

更新于 2025-07-01北京|上海
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,渴望深入探索视频生成技术,开发文本到视频(T2V)基础模型的前沿技术,致力于提升生成视频的画质,真实性,一致性,以及视频生产的效率; 如果你,热衷于AIGC驱动的视频增强与处理技术,专注于将通用大模型架构优化并迁移到垂直领域,推动下游应用性能的突破; 如果你,专注于基于AIGC的可控性编辑,探索如何精准实现内容生成与修改,满足多样化的业务需求; 如果你,对基于AIGC的人脸,人体生成编辑技术充满热情,致力于打造具有高度交互性和真实性的数字形象; 如果你,期望在多模态视频理解领域取得突破,通过技术创新提升视频内容的理解与分析能力; 如果你,期望与一群聪明、皮实、乐观、追求卓越的优秀伙伴并肩作战,共同开创音视频技术的新篇章; 那还在等待什么,赶紧加入我们吧! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。

更新于 2025-05-07北京|杭州