
地平线计算机视觉/多模/3D生成(图生3D)实习生
实习兼职算法序列地点:北京 | 上海状态:招聘
任职要求
1、硕士/博士在读,计算机、人工智能、电子工程等相关专业;
2、具备扎实的深度学习基础,熟悉且跟踪生成模型最新的学术研究成果;
3、有较强的代码实现能力,能独立完成…登录查看完整任职要求
微信扫码,1秒登录
工作职责
在资深研究员的指导下,参与3D几何生成、编辑,点云补全等的算法研发与系统实现,重点包括以下方向的探索与原型验证: 1、对3D AIGC模型进行探索和优化,实现算法原型并落地到真实业务场景中; 2、探索复杂业务场景的解决办法; 3、探索3D生成,三维重建的前沿方向,发表高水平论文;
包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
相关职位
校招核心本地商业-基
研究方向一:图像生成大模型技术研究 1.负责下一代图像生成模型架构建设,包括但不限于AR-Diffusion、生成编辑统一架构构建; 2.负责生图专项能力升级,包括Reward model设计、多语言文字生成能力。 研究方向二:视频生成大模型技术研究 1.负责下一代视频生成模型架构建设,以及高效率、低精度损失、高压缩比的视频VAE和tokenizer建设; 2.负责视频生成下游功能拓展,包括多概念注入生成、交互式生成、长视频生成等。 研发方向三:视觉内容创作Agent 1.负责对话式创作助手核心能力攻坚,包括图像视频创作场景的CoT能力、交互式编辑能力提升。 2.负责图文海报、剧情化成片等典型应用场景的模型微调、Agent能力建设。 研究方向四:拟人化多模交互前沿路线研究 1.构建多模输入的人物视频生成模型,具备高度拟人化的面部驱动、人体动作生成。 2.构建基于多模态大模型的端到端交互模型,实现智能双工交互和人-物-场景的交互。
更新于 2025-05-23北京|上海|深圳
社招智能与信息技术
1. 探索多模态理解与生成、语音/音乐生成、3D生成、视频生成、强化学习等前沿技术; 2. 利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,研发以人工智能技术为核心的新技术、新产品。
北京