优酷优酷-AIGC视觉算法工程师-北京/杭州
任职要求
- 硕士及以上学历,计算机图形学、计算机科学、应用数学或相关专业 - 精通 C/C++编程,具备扎实的数据结构与算法基础,熟练掌握 OpenGL、DirectX 等图形编程接口 - 在VDB压缩、纹理压缩、各向异性访问、辐射度场压缩等领域有深入研究和实践经验,发表过相关学术论文或参与过知名影视项目者优先 - 有UE和houdini开发经验的优先 - 了解计算机图形学的前沿技术和发展趋势,具备创新思维和独立解决问题的能力,对影视视效充满热情,追求卓越的视觉效果
工作职责
- 负责在影视视效和虚拟拍摄上研发先进的CG特效落地方案,包括但不限于流体渲染、流体压缩、Niagara粒子系统等方向 - 与美术团队、动画师紧密合作,将算法集成到现有的影视制作流程中,确保算法的实用性和视觉效果达到顶尖水平 - 优化算法性能,提升计算效率,满足影视制作的实时和高质量渲染需求
拍立淘是阿里电商核心视觉搜索算法团队,致力于为淘宝搜索核心业务打造行业领先的计算机视觉创新技术,应用于多种电商场景(如拍照搜同款、电商创意AIGC、电商大模型),堪称国内最大的视觉算法应用场景之一。我们紧随技术潮流,不断进行商业和技术创新,期待有志之士的加入,让算法发挥价值,让技术更有影响力。 【招聘方向】 1. AIGC视觉生成(包括但不限于可控图像/视频生成、图像/视频编辑、图像驱动、定制化、试衣等); 2.多模态大模型(包括但不限于大模型预训练、垂域微调SFT、RLHF、数据治理飞轮、训练部署加速等); 3.图像/多模态理解(包括商品多模态理解VG、目标检测、OCR、图像/多模态表征等),其他任何感兴趣/有价值的方向欢迎交流讨论。 【实习工作环境】 1. 充裕的GPU资源,近千张A100/V100 海量业务数据和基础能力积累,帮助高效产出; 2. 来自国内外top学校的师兄/师姐的倾力指导充分尊重实习生个人意见,自由度高; 3. 产研结合,支持鼓励实习生投递顶会论文。
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 课题背景: 图形渲染技术是游戏、影视、AR/VR等多媒体应用的重要基础设施与核心技术。随着短视频、直播、元宇宙等场景的爆发式增长,以及AI生成能力对传统图形管线的冲击,用户对实时场景下,内容更泛化,制作流程的效率提升,高画质渲染呈现的需求也急剧上升。当下的移动端算力又难以满足高画质、个性化、低门槛的UGC创作诉求。随着AI技术更进一步的发展,正逐步推动着图形渲染从"确定性算法驱动"向"概率化智能生成"的迁移,为渲染技术带来了新的可能性。 课题挑战: 1、提升渲染上限:传统实时图形渲染框架诞生了近三十年,传统实时渲染框架下的各种技术&工具链已经发展得非常成熟。但随着用户对高质量、高画质的效果内容的需求越来越高,图形渲染的场景、光影复杂度也越来越高,传统的图形光栅化渲染管线越来越难以满足用户对画质效果的需求,在算力更为不足的移动端表现地尤为明显。如何应用AI技术提升渲染性能,是一个充满挑战的课题。 2、减低制作门槛:在用户互动场景中,素材、场景建模的制作成本也变得越来越高昂。用户希望低门槛生成个性化内容,但传统图形渲染技术依赖专业人士建模,门槛极高。如何应用AI技术制作低门槛、个性化资产,同样是一个充满挑战的课题。 3、工作范式革新:在短视频拍摄场景中,传统图形引擎是通过视觉算法、图形渲染算法的结合完成图像视频增强。伴随着人工智能的热潮,AI技术在视频生成领域也有了许多突破性进展。以 Sora、Luma、DreamMachine 为代表的生成式视频模型,正在重构视觉内容生产范式,存在对现有视频处理链路革新的可能性,但也面临许多挑战,如视频一致性、物理仿真正确性、运算复杂度高等等。
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 课题背景: 图形渲染技术是游戏、影视、AR/VR等多媒体应用的重要基础设施与核心技术。随着短视频、直播、元宇宙等场景的爆发式增长,以及AI生成能力对传统图形管线的冲击,用户对实时场景下,内容更泛化,制作流程的效率提升,高画质渲染呈现的需求也急剧上升。当下的移动端算力又难以满足高画质、个性化、低门槛的UGC创作诉求。随着AI技术更进一步的发展,正逐步推动着图形渲染从"确定性算法驱动"向"概率化智能生成"的迁移,为渲染技术带来了新的可能性。 课题挑战: 1、提升渲染上限:传统实时图形渲染框架诞生了近三十年,传统实时渲染框架下的各种技术&工具链已经发展得非常成熟。但随着用户对高质量、高画质的效果内容的需求越来越高,图形渲染的场景、光影复杂度也越来越高,传统的图形光栅化渲染管线越来越难以满足用户对画质效果的需求,在算力更为不足的移动端表现地尤为明显。如何应用AI技术提升渲染性能,是一个充满挑战的课题。 2、减低制作门槛:在用户互动场景中,素材、场景建模的制作成本也变得越来越高昂。用户希望低门槛生成个性化内容,但传统图形渲染技术依赖专业人士建模,门槛极高。如何应用AI技术制作低门槛、个性化资产,同样是一个充满挑战的课题。 3、工作范式革新:在短视频拍摄场景中,传统图形引擎是通过视觉算法、图形渲染算法的结合完成图像视频增强。伴随着人工智能的热潮,AI技术在视频生成领域也有了许多突破性进展。以 Sora、Luma、DreamMachine 为代表的生成式视频模型,正在重构视觉内容生产范式,存在对现有视频处理链路革新的可能性,但也面临许多挑战,如视频一致性、物理仿真正确性、运算复杂度高等等。
团队介绍: 近年来,以大模型为核心的生成式人工智能技术发展取得了突破性进展,视觉内容创作领域展现出前所未有的技术潜力与广泛的应用前景。我们在数字人、视觉理解、2D/3D生成&编辑、人机交互等领域深耕多年,拥有丰富的学术积累与工程实践经验。过去几年,团队在顶级会议发表论文50余篇,相关成果已在阿里集团内外如教育、培训、客服、社交等多场景落地,在多家主流手机厂商中实现深度集成,也成功服务于奥运会、亚运会、春晚等盛会,累计数亿次调用。 如果你对研发规模化的AIGC解决方案感兴趣,期望在计算机视觉、图形学与机器学习领域持续创新,推动图像、视频与3D内容创作的普惠化和产业化发展,欢迎加入我们共同探索生成式AI在视觉内容创作中的无限可能。 岗位职责具体职责包括但不限于: 1.负责视觉生成模型的核心理论与前沿进展相关研究,通过算法创新与性能优化,提升多模态内容的生成质量、多样性与可控性。 2.负责图像/视频生成、编辑与理解等的核心算法研发、系统研发和产品开发,包括文生图/视频、图生图/视频、图像/视频修复、图像/视频编辑、风格迁移等。 3.负责2D/3D数字人核心算法研发、系统研发和产 品开发,包括基于2D/3D数字人重建、2D/3D数字人生成、姿态估计、表情驱动、语音驱动等。 4.负责面向场景的空间智能算法研究、产品开发,包括子弹时间系统、4D体积视频、3D感知、空间定位等。 5.探索理解生成统一的新范式,以及更加高效的多模态生成Scaling方法,包括但不限于高效attention设计、人类反馈和强化学习、模型蒸馏、训练/推理优化、多模态Tokenizer研究。