优酷优酷-AIGC算法工程师（2D/3D生成方向）-北京

社招全职3年以上2025-12-09地点：北京状态：招聘

扫码手机上打开

任职要求

1. 良好的数学能力，基础数学知识优异者优先
2. 良好的工程代码能力，熟悉C++，CUDA，python等编程语言，能独立复现未开源论文者优先， 信息竞赛获奖者优先
3. 熟悉2D/3D计算机视觉、图形学、机器学习领…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

介绍：我们主要针对动漫影视剧行业研发生成式AI相关算法，加速高质量动漫影视剧生产。你将有机会深度参与动漫影视生产全流程，了解并解决生成式AI在行业落地的实际研究问题，为后续工业或学术发展做好充分准备和规划
1. 负责解决3D动漫影视行业相关的3D物体/人脸生成，表情生成等基础生成模型数据处理与训练
2. 负责模型注册，曲面变形，网格布线等基础图形学问题的创新算法的开发，以及性能优化

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

C+++

CUDA+

Python+

OpenCV+

机器学习+

ICCV+

CVPR+

还有更多 •••

登录查看完整学习资料

相关职位

3D/动作-多模态大模型算法工程师-抖音V-AI-筋斗云人才计划

校招A69432

团队介绍：V-AI团队当前支持抖音直播、开放平台、V项目（AI分身/小火人等）业务方向，涵盖了自然语言处理、计算机视觉、图形学等技术领域，通过大模型技术来创造新的互动玩法、制作美术资产、提升研发运营效率等，当前已上线和开展中的项目包括直播大模型（助播/伴播/独播）、角色多模态对话大模型、研发智能助手、3D模型生成大模型、动作生成大模型等。课题介绍：背景：随着虚拟现实、增强现实、数字孪生等技术的快速应用，3D数字资产已成为构建沉浸式数字空间的核心要素。在影视动画、游戏开发、直播、社交等领域，3D模型与3D动作的需求呈现爆发式增长。然而，传统3D内容生产高度依赖人工建模与动作捕捉技术，存在效率低、成本高、创作门槛高等瓶颈，难以满足直播等场景中大规模、高保真、多样化、高频迭代的3D内容需求。近年来，以生成式人工智能（AIGC）为代表的大模型技术在2D图像与视频生成领域取得突破性进展，但在3D内容生成领域仍面临表征复杂、多模态数据稀缺、物理规律约束严格等难题。如何将大模型技术与3D生成任务深度融合，实现“文本/图像到3D模型”、“文本/语音到动作”的高质量生成，形成建模+驱动的一站式美术资产生成管线以适配直播场景下资产迭代速度快，品质要求高的需求是当前的重要研究内容。课题挑战：传统方法依赖人工建模工具或程序化生成算法，存在生成效率与创作自由度之间的固有矛盾。AI技术虽然能很好地弥补人工生成效率不足的问题，但仍然存在如下挑战 1. 表征困难：与一维文本和二维图像可以自然地实现结构化表征不同，3D模型由于其多模态（如几何、纹理、材质等）、结构复杂和高维度等特性，使得其表征更为复杂。而3D动作又与物理世界紧密相关，且动态复杂度高。因此，如何高效地表征3D几何形状和3D动作，同时确保高品质的生成，仍然是亟需突破的课题。 2. 生成困难：模型生成需同时保障结构完整性、拓扑合理性和细节丰富性；动作生成需兼顾运动多样性、物理约束与时空连续性。现有方法易出现模型畸变、贴图瑕疵、动作力度不足和多样性差等问题。 3. 数据不足：3D数据标注成本高、多模态对齐难度大，且现有公开数据集规模有限，导致大模型训练面临数据不足的问题；如何把相关模态数据（图像、视频）利用起来，提升3D模型和3D动作的生成品质也是当前的重大挑战。 4. 评估体系不完善：缺乏统一的3D生成质量量化指标，现有评价多依赖人工主观判断，难以客观衡量生成的几何精度、动作自然度与多模态语义一致性，因此建立完善、客观、可量化的评价体系是保障技术迭代的关键基石。 1、负责抖音、抖音直播及相关产品的大语言模型/多模态大模型/AIGC算法研发，如数字人、3D生成、动作生成、智能对话等相关工作； 2、负责关键场景的算法优化，构建高质量的模型和Agent系统，提升业务效果； 3、跟踪AI前沿技术进展，推动前沿技术的产品化落地。

更新于 2025-05-26北京

3D/动作-多模态大模型算法工程师-抖音V-AI-筋斗云人才计划

社招A11449

更新于 2025-05-27北京

计算机视觉工程师（校招-北京）

校招算法类

美图影像研究院(MT Lab)专注于计算机视觉、深度学习与计算机图形学等前沿算法的研究与应用。我们为美图产品提供核心技术支持。团队汇聚顶尖人才，致力于推动影像技术的突破，让科技与艺术美好交汇。 MT Lab focuses on R&D of cutting-edge algorithms in CV, deepearning, and computer graphics. We provide core technicalsupport for Meitu products.Our team of top talent is dedicated to advancing imagingtechnology, beautifully merging science and art. 岗位名称：计算机视觉工程师工作地点：北京涉及技术方向：深度学习／计算机视觉／图像视频处理, 如图像和视频的检测、识别、分割、编辑、重建、3D视觉、计算成像、图像生成、AIGC、多模态等岗位职责: ● 理论创新：研究领域最新技术，提出新idea，撰写技术专利或论文 ● 算法设计：针对实际应用场景，设计算法并提升其效果/效率/鲁棒性 ● 落地实现：核心代码实现，输出demo或SDK，根据产品反馈迭代优化

更新于 2025-08-18北京

计算机视觉工程师(北京）

社招算法类

更新于 2025-09-12北京