影石深度学习算法工程师(数据生成方向)-2026校招
任职要求
1.硕士及以上学历,模式识别、计算机视觉、数学、电子信息等相关专业优先; 2.能够熟练使用Tensorflow/Pytorch中的一种或多种深度学习框架,熟练使用Python; 3.熟悉多视角几何、三维重建、生成式模型相关算法理论知识; 4.具备相关领域工程背景:在无人机、自动驾驶、机器人相关的重建算法(包括Diffusion Model、NeRF、ControlNet、3DGS)中的一个或多个领域有过研究和项目经历优先; 5.有过相关领域的顶级会议论文发表(CVPR、 ICCV、ECCV等)或在相关领域的学术竞赛中取得较好成绩者优先。
工作职责
1.负责图像、视频、3D内容⽣成算法,包括但不限于VAE/GAN、Diffusion、NeRF、3DGS等相关算法前沿技术跟进和研发落地; 2.深⼊下游应⽤场景,结合场景重建、神经渲染、生成式AI等为算法提供可用于训练/评估的高质量数据,支持高级智能感知系统的研发落地; 3.探索大规模图像数据自动生成: AIGC、DiffusionModel、3DGS 、World Model等技术研发和业务落地。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,渴望深入探索视频生成技术,开发文本到视频(T2V)基础模型的前沿技术,致力于提升生成视频的画质,真实性,一致性,以及视频生产的效率; 如果你,热衷于AIGC驱动的视频增强与处理技术,专注于将通用大模型架构优化并迁移到垂直领域,推动下游应用性能的突破; 如果你,专注于基于AIGC的可控性编辑,探索如何精准实现内容生成与修改,满足多样化的业务需求; 如果你,对基于AIGC的人脸,人体生成编辑技术充满热情,致力于打造具有高度交互性和真实性的数字形象; 如果你,期望在多模态视频理解领域取得突破,通过技术创新提升视频内容的理解与分析能力; 如果你,期望与一群聪明、皮实、乐观、追求卓越的优秀伙伴并肩作战,共同开创音视频技术的新篇章; 那还在等待什么,赶紧加入我们吧! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。
1. 参与知乎核心业务中的AI算法研发与优化,包括但不限于AI搜索、内容理解、智能推荐、搜索排序、多模态内容生成等场景。 2. 探索大模型(LLM)及多模态大模型(VLM)在知乎业务中的应用,推动模型创新与落地。 3. 深入研究和实现前沿论文中的算法,结合业务需求进行迭代优化,提升模型效果与性能。 4. 与产品、工程团队紧密协作,推动AI技术在知乎生态中的规模化应用,赋能业务增长与用户体验提升。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作; 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽; 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质; 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法; 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具; 在这里,你将帮助淘宝直播等大型的视频传输场景设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。