哔哩哔哩计算机视觉算法实习生(人脸/人体方向)
1. 将深度学习图形图像领域技术结合游戏场景进行创新研究; 2. 负责计算机视觉/图形学相关核心技术在游戏相关领域的算法与落地应用工作,包括但不限于如下方向:3D生成,3D重建,3D人脸/头发/人体,表情/动作,渲染,蒙皮,材质等; 3. 借助游戏平台及数据推动技术前沿的发展,并且能够快速落地应用到业务中; 4. 发表高质量论文或撰写专利,提升技术影响力。
我们致力于前沿机器人交互技术的研发,目标是打造能够精准理解人类意图、实现自然流畅人机协作的下一代机器人系统。在这里,您将有机会将最先进的计算机视觉与多模态大模型技术应用于真实的机器人场景,解决极具挑战性的问题,并见证您的算法如何改变人机交互的未来。 负责机器人交互中的核心意图识别算法的研发与迭代,技术方向包括但不限于:目标检测、多目标跟踪、人体/人脸关键点检测、手势识别、行为理解等。 探索并推动多模态大模型在机器人交互场景下的应用与落地,实现基于视觉、语音等多模态信息的深度意图理解。 负责将算法模型进行高效的优化、部署和集成,确保其在真实机器人平台上的性能和稳定性。 持续跟踪计算机视觉、多模态学习、机器人学等领域的最新学术进展,并将有潜力的技术转化为实际生产力。
1. 基于 AIGC 研发虚拟换衣(Virtual Try-On)与虚拟化妆(Virtual Makeup)方向算法, 实现业界/学术界前沿生成技术 2. 与产品设计团队紧密合作,推动算法快速落地,提升用户体验 3. 深度参与模型调优、数据构建、效果评估等端到端研发流程 4. 鼓励创新与研究产出,支持在顶会(CVPR / ICCV / ECCV / SIGGRAPH / NeurIPS / ICML 等)投稿
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,渴望深入探索视频生成技术,开发文本到视频(T2V)基础模型的前沿技术,致力于提升生成视频的画质,真实性,一致性,以及视频生产的效率; 如果你,热衷于AIGC驱动的视频增强与处理技术,专注于将通用大模型架构优化并迁移到垂直领域,推动下游应用性能的突破; 如果你,专注于基于AIGC的可控性编辑,探索如何精准实现内容生成与修改,满足多样化的业务需求; 如果你,对基于AIGC的人脸,人体生成编辑技术充满热情,致力于打造具有高度交互性和真实性的数字形象; 如果你,期望在多模态视频理解领域取得突破,通过技术创新提升视频内容的理解与分析能力; 如果你,期望与一群聪明、皮实、乐观、追求卓越的优秀伙伴并肩作战,共同开创音视频技术的新篇章; 那还在等待什么,赶紧加入我们吧! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper