
美图计算机视觉工程师(校招-北京)
任职要求
● 计算机/电子信息/数学相关专业,基础扎实,硕士及以上学历 ● 熟练掌握C/C++/Python至少一种,工程实现能力强 ● 熟悉常用CV库和深度学习框架(PyTorch/TensorFlow/Caffe等) ● 对计算机视觉和人工智能研究和落地有热情 Title: Computer Vision Engineer Location: Beijing Core Technical Domains: Deep learning, computer vision, and image & video processing, with specific focus on technologies including but not limited to: image/video detection, recognition, segmentation, editing, reconstruction, 3D vision, computational imaging, image generation, AIGC, and multimodality. Key Responsibilities: 1、Theoretical Innovation ● Conduct in-depth research on cutting-edge technologies within the domain, proactively propose innovative concepts and solutions, and be responsible for drafting technical patents or academic papers. 2、Algorithm Design ● Target specific practical application scenarios, design tailored algorithms, and conduct systematic optimization to enhance the algorithms' performance, operational efficiency, and robus…
工作职责
美图影像研究院(MT Lab)专注于计算机视觉、深度学习与计算机图形学等前沿算法的研究与应用。我们为美图产品提供核心技术支持。团队汇聚顶尖人才,致力于推动影像技术的突破,让科技与艺术美好交汇。 MT Lab focuses on R&D of cutting-edge algorithms in CV, deepearning, and computer graphics. We provide core technicalsupport for Meitu products.Our team of top talent is dedicated to advancing imagingtechnology, beautifully merging science and art. 岗位名称:计算机视觉工程师 工作地点:北京 涉及技术方向:深度学习/计算机视觉/图像视频处理, 如图像和视频的检测、识别、分割、编辑、重建、3D视觉、计算成像、图像生成、AIGC、多模态等 岗位职责: ● 理论创新:研究领域最新技术,提出新idea,撰写技术专利或论文 ● 算法设计:针对实际应用场景,设计算法并提升其效果/效率/鲁棒性 ● 落地实现:核心代码实现,输出demo或SDK,根据产品反馈迭代优化
1、三维模型渲染:利用WebGL技术进行3D小区孪生项目的三维模型渲染,应用倾斜摄影技术开发移动web端的高精度三维模型,实现三维模型的实时渲染和动态交互; 2、参数化建模:负责孪生或家装领域的三维模型参数化设计和建模,开发模型动画渲染效果,提高用户交互体验。与产品团队合作,优化模型的视觉表现和用户体验; 3、技术研发:研究和应用最新的三维图形技术和工具,如高斯渲染技术、visionPro头盔等。撰写技术文档,并为团队提供技术支持和培训。参与项目规划和需求分析,提供技术解决方案; 4、数据处理与分析:处理和分析倾斜摄影及其他三维数据源,确保模型精确度。开发和优化数据处理管道,提升模型渲染效率; 5、跨部门协作:与研发、设计、产品等团队协作,推动项目顺利进行。参与客户需求讨论,提供技术咨询和支持。
1、前沿技术研究与应用: 深入研究并实践三维建模领域的最新技术,包括但不限于NeRF(神经辐射场)建模、3D Gaussian Splatting等高级建模算法; 对传统photogrammetry pipeline有深入理解,优化并提升高精度相机位姿估计、SFM(Structure from Motion)、MVS(Multi-View Stereo)、SLAM(Simultaneous Localization and Mapping)等算法的性能; 2、3D图像优化与工程化: 主导或参与3D图像优化pipeline的设计与实施,解决阴影、日光处理等视觉问题,确保3D应用的真实感和用户体验; 将研究成果工程化落地,确保技术能够在产品中得到有效应用并持续迭代优化; 3、隐式三维模型编辑技术研发: 负责隐式三维模型编辑技术的研发,包括模型压缩、材质与光照解耦、显式与隐式模型融合等,提升模型编辑的灵活性和效率; 探索并应用新的技术和算法,不断优化三维模型的质量和处理速度; 4、AI驱动的自动化与效率提升: 利用人工智能和机器学习技术,设计并实施自动化解决方案,提升三维建模与编辑过程的效率和准确性,降低人工干预成本。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 你的挑战: 攻克LLM全链路训练难题:主导大模型训练,优化模型Scaling Law,结合应用需求突破分布式性能瓶颈,基于RL增强模型推理能力,打造电商领域最懂用户需求的超级大脑(含多模态VLM研发)。 为什么选择淘天? 1.坐拥电商领域最大规模场景:每天处理数亿次用户交互,覆盖搜索/推荐/广告/客服/营销全链路,你将直接面对全球最复杂的电商需求场景。 2.定义未来购物标准:你研发的模型将服务数亿消费者,结合大语言和多模态模型能力满足用户偏好,影响海量商家经营决策。 3.顶级科研配置:超大规模GPU集群支持大规模参数模型训练,自研分布式框架实现训练推理效率大幅提升,顶级会议发表,前沿技术成果即时输血。 加入我们,你将获得: 1.与NLP/多模态领域顶尖团队共创,解锁大模型在商品理解、智能创作、消费决策、购物对话等场景的无限可能。 2.弹性化的技术路线选择权,既可在大模型基础技术方面突破能力上限,也可深入应用层打造现象级AI产品。 3.打通产学研用全链路:支持技术成果转化顶会论文和专利+百万级ai native用户产品。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,渴望深入探索视频生成技术,开发文本到视频(T2V)基础模型的前沿技术,致力于提升生成视频的画质,真实性,一致性,以及视频生产的效率; 如果你,热衷于AIGC驱动的视频增强与处理技术,专注于将通用大模型架构优化并迁移到垂直领域,推动下游应用性能的突破; 如果你,专注于基于AIGC的可控性编辑,探索如何精准实现内容生成与修改,满足多样化的业务需求; 如果你,对基于AIGC的人脸,人体生成编辑技术充满热情,致力于打造具有高度交互性和真实性的数字形象; 如果你,期望在多模态视频理解领域取得突破,通过技术创新提升视频内容的理解与分析能力; 如果你,期望与一群聪明、皮实、乐观、追求卓越的优秀伙伴并肩作战,共同开创音视频技术的新篇章; 那还在等待什么,赶紧加入我们吧! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。