字节跳动AIGC算法工程师/专家(3D方向)-智能创作(北京/上海/杭州)
任职要求
1、计算机、电子、自动化等相关专业硕士及以上学位; 2、熟练掌握3D基础理论,在视频生成、Diffusion、图像生成、3D视觉等方向中至少一个方向有深入的研究;熟悉Python开发,具备独立开发能力; 3、熟悉至少一种常见的深度学习框架,比如TensorFlow、PyTorch;有大规模分布式系统工程经验者优先; 4、在计算机视觉、3D视觉、视频生成等相关方向发表…
工作职责
1、负责3D能力与图像/视频生成结合的算法研发与优化,跟进三维视觉领域的前沿技术研究; 2、支持字节跳动各个产品线3D相关的业务需求; 3、跟进生成领域的新技术; 4、负责推动3D能力与视频生成相关技术落地于特效、视频编辑、商业化等领域的应用; 5、根据团队的整体目标和规划,进行相关的研发工作。
ꔷ 模型选型与评测:负责跟踪和深度评测业界前沿的Text/Image-to-3D模型(如混元、VAST、Meshy等),建立“文玩”品类的评测基准(Benchmark),从质量、速度、成本、可塑性等多维度输出评估报告,并参与制定技术共建方案。 ꔷ 训练框架搭建:主导或参与自建3D AIGC训练框架,实现SFT(监督微调)、PO(偏好优化)、RLHF以及模型蒸馏等全套“后训练”链路。 ꔷ 模型SFT与强化:深入“文玩”业务场景,构建高质量SFT数据集(如品类黑话、风格化),对底座模型进行微调,使其更懂品类。 ꔷ 可打印性优化:探索使用PO/RLHF技术,构建“高可打印性”偏好数据集,训练AIGC模型使其倾向于生成结构稳定、易于修复、符合制造标准的3D模型,构建核心数据与模型壁垒。 ꔷ 模型优化与部署: 负责3D生成模型的轻量化、蒸馏和加速,优化推理速度和成本,满足平台规模化应用需求。
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1、负责研发空间智能核心技术,进行室内/室外/航拍/卫片等全场景高质量空间理解、重建与生成,包括但不限于基于图像、视频、点云、Mesh和3DGS等多种模态数据的空间智能基座与应用; 2、负责多模态大模型和视频生成大模型的预训练、微调等工作,包括但不限于数字人、生成式重建及空间生成等应用方向; 3、负责大规模多模态数据集的构建、清洗与管理,搭建高效数据流水线,保障算法训练与评估; 4、负责结合具体需求,抽象出关键算法进行研发,并持续保持及引领相关技术指标。
ꔷ Mesh修复与优化:负责“Mesh自动化修复引擎”的研发,解决AIGC模型输出的网格破洞、非流形、漂浮件、法线错误、噪点等问题,实现高质量的水密(Watertight)网格输出和自动化重拓扑(Retopology)。 ꔷ 可制造性分析: 研发3D模型可制造性(3D打印)智能分析算法,自动检测薄壁、悬垂角度、过小细节、打印风险等,并输出分析报告与修复建议。 ꔷ AI参数化基座生成:攻坚“AI参数化基座生成器”V1至V2。研发算法智能分析主体Mesh的姿态、尺寸和接口特征,自动从CAD标准库中匹配、生成并融合参数化基座(如吊坠扣、戒指圈、印章底座),解决Mesh与CAD的“最后一公里”融合难题。 ꔷ 智能支撑生成:针对SLA/DLP等高精度打印工艺,开发智能支撑生成算法,实现支撑结构的最优化(易拆卸、少接触面、省材料)。 ꔷ 几何算法库构建:负责几何处理相关算法库的搭建、性能优化与维护。
如果你渴望投身于AI技术驱动的未来,并希望通过算法与系统研发改变亿级用户的内容体验,那么这里将是你实现梦想的最佳舞台!在淘天集团,我们正在构建一个基于海量图像/视频数据的智能生态,覆盖内容理解、匹配分发、生成等多个核心方向。作为团队的一员,你将参与以下前沿领域的探索与实践: ● AIGC(AI-Generated Content)创新:探索扩散模型(SD、flux系列)、自回归生成(AR)、强化学习、多模态生成技术等前沿方法,打造下一代智能化内容生成工具,赋能电商、娱乐、广告等多个场景。 ● 跨领域联合创新:结合计算机图形学、物理仿真和大语言模型等技术,推动虚拟试穿、3D内容生成、基于文本描述的通用图像编辑、动态视频生成编辑等应用落地,开创视觉技术的新格局。 在这里,你不仅能够接触到行业最顶尖的数据资源,还能与一群聪明、皮实、乐观、自省、追求卓越的伙伴一起,探索未知、突破边界,共同定义视觉技术的未来! 为什么选择我们? ● 海量数据与真实场景:依托淘天集团丰富的业务场景,你将有机会在亿级图像/视频数据上验证你的算法,并看到它们如何直接影响用户的生活。 ● 前沿技术与创新氛围:我们鼓励大胆尝试、快速迭代,支持你在机器学习、深度学习、计算机视觉、AIGC等领域的深入研究。 ● 成长与发展机会:无论你是希望深耕技术成为领域专家,还是逐步转型为技术管理者,我们都会为你量身定制适合的成长计划。 ● 顶级资源支持:无论是计算资源、数据资源,还是与行业顶尖专家的合作机会,我们都将全力支持你的成长。