地平线计算机视觉/多模/3D生成(图生3D)实习生

实习兼职算法序列2026-03-27地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1、硕士/博士在读，计算机、人工智能、电子工程等相关专业；
2、具备扎实的深度学习基础，熟悉且跟踪生成模型最新的学术研究成果；
3、有较强的代码实现能力，能独立完成…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

在资深研究员的指导下，参与3D几何生成、编辑，点云补全等的算法研发与系统实现，重点包括以下方向的探索与原型验证：
1、对3D AIGC模型进行探索和优化，实现算法原型并落地到真实业务场景中；
2、探索复杂业务场景的解决办法；
3、探索3D生成，三维重建的前沿方向，发表高水平论文；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

深度学习+

相关职位

【北斗】基座大模型视觉生成算法研究员

校招核心本地商业-基

研究方向一：图像生成大模型技术研究 1.负责下一代图像生成模型架构建设，包括但不限于AR-Diffusion、生成编辑统一架构构建； 2.负责生图专项能力升级，包括Reward model设计、多语言文字生成能力。研究方向二：视频生成大模型技术研究 1.负责下一代视频生成模型架构建设，以及高效率、低精度损失、高压缩比的视频VAE和tokenizer建设； 2.负责视频生成下游功能拓展，包括多概念注入生成、交互式生成、长视频生成等。研发方向三：视觉内容创作Agent 1.负责对话式创作助手核心能力攻坚，包括图像视频创作场景的CoT能力、交互式编辑能力提升。 2.负责图文海报、剧情化成片等典型应用场景的模型微调、Agent能力建设。研究方向四：拟人化多模交互前沿路线研究 1.构建多模输入的人物视频生成模型，具备高度拟人化的面部驱动、人体动作生成。 2.构建基于多模态大模型的端到端交互模型，实现智能双工交互和人-物-场景的交互。

更新于 2025-05-23北京|上海|深圳

【基座模型】多模生成大模型算法工程师

社招智能与信息技术

1. 探索多模态理解与生成、语音/音乐生成、3D生成、视频生成、强化学习等前沿技术； 2. 利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模，研发以人工智能技术为核心的新技术、新产品。

北京

多模生成算法实习生-北京/杭州

校招算法

1. 探索多模态理解与生成、3D生成、视频生成、强化学习等前沿技术； 2. 利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模，研发以人工智能技术为核心的新技术、新产品。

北京

搜索算法工程师（J82955）

社招MEG

-负责百度多模视觉搜索产品的技术、系统、产品的研发工作 -工作包括但不限于：图像/视频的内容理解与多模态搜索，包括多模态预训练大模型、视觉检测/分类/跟踪、移动端图像技术应用。3D视觉、生成技术、图形学的应用，包括稀疏点云重建、网格化生成、后端图形渲染等 -研究和开发可穿戴设备和手机中的MR（Mixture Reality）技术，探索下一代搜索产品形态 -将技术创新推向亿万用户

更新于 2025-02-27北京