logo of soul

Soul APPAIGC视觉算法工程师-校招

社招全职地点:上海 | 北京状态:招聘

任职要求


- 计算机视觉、人工智能、数学等相关专业硕士及以上学历。
- 在国际顶级会议/期刊(如 CVPRICCVECCVNeurIPSICLR、SIGGRAPH、TPAMI 等)以第一作者发表过论文,或在开源社区/竞赛中有突出成果。
- 熟悉主流大模型训练与推理框架(如 PyTorchMegatronDeepSpeed 等),具备大规模图像/视频生成模型的训练与优化经验。
- 熟悉 GAN、VAE、Diffusion Models、Video Diffusion 等生成等相关方向,有实际项目经验者优先。
- 具备良好的跨团队沟通能力,能够与产品、设计和研究团队高效协作。

工作职责


近年来,AIGC 技术在图像与视频生成方向取得了突破性进展,生成对抗网络、扩散模型以及多模态大模型的快速迭代,使视觉内容的创作方式发生了革命性变化。我们专注于探索生成式 AI 在视觉生成、虚拟内容创作和沉浸式体验中的前沿应用,致力于打造具备创意表达与真实感渲染能力的新一代图像与视频生成大模型。
随着模型在高分辨率生成、长视频建模与跨模态理解上的持续演进,如何进一步提升生成质量、控制力与效率,并将前沿技术落地到实际产品场景,是我们的核心研究方向。
如果你对生成式 AI、计算机视觉和视频生成充满热情,并希望参与构建下一代 AIGC 创作平台,欢迎加入我们,共同突破视觉生成的技术边界。
岗位职责
- 图像与视频生成算法创新:围绕GAN、VAE、Diffusion Models、Video Diffusion 等前沿技术,开展图像/视频生成、编辑、控制的算法研究与优化。
- 高分辨率与长视频建模:探索多尺度建模、时序一致性与跨帧约束方法,提升长视频生成的稳定性与沉浸感。
- 多模态融合与可控生成:设计跨模态联合建模方案,实现文本、图像、视频、语音等模态的协同生成与精准控制。
- 端到端研发闭环:参与或主导从数据构建、模型训练、性能评测到应用部署的完整研发流程。
- 前沿方向探索:紧跟 LLM、Diffusion Models、AR等前沿技术,推动 AIGC 在视觉生成领域的创新与落地。
包括英文材料
OpenCV+
学历+
CVPR+
ICCV+
ECCV+
NeurIPS+
大模型+
PyTorch+
Megatron+
DeepSpeed+
相关职位

logo of soul
社招

近年来,以大模型为核心的生成式人工智能在人机交互和虚拟陪伴领域展现出巨大潜力。我们专注于探索生成式AI在社交场景下的前沿应用和产业落地,致力于打造具备多模态感知与生成能力的社交大模型。 随着大语言模型的快速演进,如何让模型更好地理解多维度信息,并在社交场景中提供自然、细腻、沉浸感十足的语音与多模态交互体验,成为我们的核心研究方向。 如果你对生成式AI、多模态建模和智能交互充满热情,并希望参与构建下一代社交与陪伴大模型,欢迎加入我们,共同突破技术边界。 1. 多模态大模型算法创新:面向社交与智能交互需求,设计与优化模型架构,实现文本、语音、视觉等模态的联合建模,推动行业领先的社交多模态大模型研发。 2. 语音编码与生成算法突破:探索高效语音编码策略,优化离散化与连续特征建模方案,提升语音合成质量和建模效率。 3. 端到端技术闭环:参与或主导从数据构建、模型训练、性能评测到部署上线的完整研发流程。 4. 前沿应用技术探索:紧跟LLM、RL、Diffusion Models等前沿技术发展,探索创新范式并提升模型性能。

更新于 2025-09-09
logo of horizon
校招算法序列

1. 参与设计、开发和优化机器人Real2Sim算法方案,结合3D重建、3D&视频生成等技术,提升仿真环境真实性并降低仿真资产获取成本,以减缓在仿真中训练的机器人算法在迁移到真实世界时出现的性能下降; 2. 通过创新的技术解决柔性物体、流体、触觉仿真等复杂的仿真问题; 3. 设计复杂环境下的机器人3D感知&理解系统搭建,支持机器人导航&操作等下游任务能力提升; 4. 跟踪三维重建、AIGC生成领域的最新研究,探索解决机器人Real2Sim、Sim2Real领域关键问题的创新技术。

更新于 2025-07-01
logo of meitu
校招算法类

美图影像研究院(MT Lab)专注于计算机视觉、深度学习与计算机图形学等前沿算法的研究与应用。我们为美图产品提供核心技术支持。团队汇聚顶尖人才,致力于推动影像技术的突破,让科技与艺术美好交汇。 MT Lab focuses on R&D of cutting-edge algorithms in CV, deepearning, and computer graphics. We provide core technicalsupport for Meitu products.Our team of top talent is dedicated to advancing imagingtechnology, beautifully merging science and art. 岗位名称:计算机视觉工程师 工作地点:北京 涉及技术方向:深度学习/计算机视觉/图像视频处理, 如图像和视频的检测、识别、分割、编辑、重建、3D视觉、计算成像、图像生成、AIGC、多模态等 岗位职责: ● 理论创新:研究领域最新技术,提出新idea,撰写技术专利或论文 ● 算法设计:针对实际应用场景,设计算法并提升其效果/效率/鲁棒性 ● 落地实现:核心代码实现,输出demo或SDK,根据产品反馈迭代优化

更新于 2025-08-18
logo of meitu
校招算法类

美图影像研究院(MT Lab)专注于计算机视觉、深度学习与计算机图形学等前沿算法的研究与应用。我们为美图产品提供核心技术支持。团队汇聚顶尖人才,致力于推动影像技术的突破,让科技与艺术美好交汇。 MT Lab focuses on R&D of cutting-edge algorithms in CV, deepearning, and computer graphics. We provide core technicalsupport for Meitu products.Our team of top talent is dedicated to advancing imagingtechnology, beautifully merging science and art. 岗位名称:计算机视觉工程师 工作地点:厦门 涉及技术方向:深度学习/计算机视觉/图像视频处理, 如图像和视频的检测、识别、分割、编辑、重建、3D视觉、计算成像、图像生成、AIGC、多模态等 岗位职责: ● 理论创新:研究领域最新技术,提出新idea,撰写技术专利或论文 ● 算法设计:针对实际应用场景,设计算法并提升其效果/效率/鲁棒性 ● 落地实现:核心代码实现,输出demo或SDK,根据产品反馈迭代优化

更新于 2025-08-18