阿里巴巴算法工程师-视觉AIGC
任职要求
【必备项】 ● 学历背景:本科及以上学历,计算机科学、人工智能、电子与通信等相关专业优先; ● 技术能力: 熟悉计算机视觉、机器学习、图像/视频分析与处理、多模态内容理解、AIGC等相关领域技术和应用; 具备扎实的工程实现能力,熟练掌握C/C++、Java、Python等至少一门编程语言; 了解并使用过torch、tensorflow等深度学习开发工具; ● 学习与思考:拥有极强的学习能力,对新技术充满好奇心,善于独立思考并总结经验…
工作职责
如果你渴望投身于AI技术驱动的未来,并希望通过算法与系统研发改变亿级用户的内容体验,那么这里将是你实现梦想的最佳舞台!在淘天集团,我们正在构建一个基于海量图像/视频数据的智能生态,覆盖内容理解、匹配分发、生成等多个核心方向。作为团队的一员,你将参与以下前沿领域的探索与实践: ● AIGC(AI-Generated Content)创新:探索扩散模型(SD、flux系列)、自回归生成(AR)、强化学习、多模态生成技术等前沿方法,打造下一代智能化内容生成工具,赋能电商、娱乐、广告等多个场景。 ● 跨领域联合创新:结合计算机图形学、物理仿真和大语言模型等技术,推动虚拟试穿、3D内容生成、基于文本描述的通用图像编辑、动态视频生成编辑等应用落地,开创视觉技术的新格局。 在这里,你不仅能够接触到行业最顶尖的数据资源,还能与一群聪明、皮实、乐观、自省、追求卓越的伙伴一起,探索未知、突破边界,共同定义视觉技术的未来! 为什么选择我们? ● 海量数据与真实场景:依托淘天集团丰富的业务场景,你将有机会在亿级图像/视频数据上验证你的算法,并看到它们如何直接影响用户的生活。 ● 前沿技术与创新氛围:我们鼓励大胆尝试、快速迭代,支持你在机器学习、深度学习、计算机视觉、AIGC等领域的深入研究。 ● 成长与发展机会:无论你是希望深耕技术成为领域专家,还是逐步转型为技术管理者,我们都会为你量身定制适合的成长计划。 ● 顶级资源支持:无论是计算资源、数据资源,还是与行业顶尖专家的合作机会,我们都将全力支持你的成长。
主要职责: (图像识别 三维重建经验 51word toC 袋鼠 数字孪生 新能源汽车) 1. 三维建模技术研究,包括NeRF建模、可微分几何建模、3D Gaussian Splatting建模算法等; 2. 负责非限定场景下的高精度相机位姿估计研究,包含COLMAP算法、SLAM算法等; 3. 负责3D Diffusion相关技术研究,包括多模态3D AIGC、材质生成等; 4. 负责隐式三维模型编辑相关技术研究,包括模型压缩、材质&光照解耦、显式&隐式模型融合等。 5. 负责通过人工智能的方式,提升过程效率和自动化程度,降低人工参与的成本,参与其他相关业务的 AI算法研发、数据处理、模型训练、模型调优和训练流程自动化;
团队介绍: 我们团队聚焦多模态模型、大语言模型、扩散模型的前沿探索和算法应用。团队承接公司核心业务,深耕人工智能前沿领域,在业内有持续影响力,在NeurIPS/ICLR/CVPR/ACL/EMNLP等顶会已发表多篇论文。 具体职责包括但不限于: 多模态模型、扩散模型、图像编辑的研究和应用,包含但不限于文本、图像的跨模态对齐和AIGC内容生成。 大语言模型的前沿探索和应用,包括但不限于SFT和RLHF算法、CoT、Hallucination、Agent等领域的探索与研究; 大模型的效率研究,包括但不限于大模型的量化、蒸馏、训练与推理加速。
介绍:我们主要针对动漫影视剧行业研发生成式AI相关算法,加速高质量动漫影视剧生产。你将有机会深度参与动漫影视生产全流程,了解并解决生成式AI在行业落地的实际研究问题,为后续工业或学术发展做好充分准备和规划 1. 负责解决3D动漫影视行业相关的3D物体/人脸生成,表情生成等基础生成模型数据处理与训练 2. 负责模型注册,曲面变形,网格布线等基础图形学问题的创新算法的开发,以及性能优化