
美图计算机视觉实习生(北京)
任职要求
● 计算机/电子信息/数学相关专业,基础扎实,硕士及以上学历 ● 熟练掌握C/C++/Python至少一种,工程实现能力强 ● 熟悉常用CV库和深度学习框架(PyTorch/TensorFlow/Caffe等) ● 对计算机视觉和人工智能研究和落地有热情 Location: Beijing/Shenzhen/Xiamen/Shanghai Core Technical Domains: Deep learning, computer vision, and image & video processing, with specific focus on technologies including but not limited to: image/video detection, recognition, segmentation, editing, reconstruction, 3D vision, computational imaging, image generation, AIGC, and multimodality. Key Responsibilities: 1、Theoretical Innovation ● Conduct in-depth research on cutting-edge technologies within the domain, proactively propose innovative concepts and solutions, and be responsible for drafting technical patents or academic papers. 2、Algorithm Design ● Target specific practical application scenarios, design tailored algorithms, and conduct systematic optimization to enhance the algorithms' performance, operational efficiency, and robustne…
工作职责
美图影像研究院(MT Lab)专注于计算机视觉、深度学习与计算机图形学等前沿算法的研究与应用。我们为美图产品提供核心技术支持。团队汇聚顶尖人才,致力于推动影像技术的突破,让科技与艺术美好交汇。 MT Lab focuses on R&D of cutting-edge algorithms in CV, deepearning, and computer graphics. We provide core technicalsupport for Meitu products.Our team of top talent is dedicated to advancing imagingtechnology, beautifully merging science and art. 工作地点:北京 涉及技术方向:深度学习/计算机视觉/图像视频处理, 如图像和视频的检测、识别、分割、编辑、重建、3D视觉、计算成像、图像生成、AIGC、多模态等 岗位职责: ● 理论创新:研究领域最新技术,提出新idea,撰写技术专利或论文 ● 算法设计:针对实际应用场景,设计算法并提升其效果/效率/鲁棒性 ● 落地实现:核心代码实现,输出demo或SDK,根据产品反馈迭代优化
本课题的研究目标是优化AI与人类的多模态交互体验,通过研发能够融合文本、视觉和语音等多种模态的自然交互机制,使AI系统能够通过理解图像内容、语音语调和情感等非文本信息增强交互效果。 研究将探索情境感知与个性化适应技术、多轮多模态交互中的意图理解与记忆保持能力,以及跨模态信息的整合与表达方式,使AI系统能够更好地理解用户通过不同感知通道传达的需求,提供视觉和语音层面的情感共鸣,并在长期多模态交互中不断适应用户偏好,实现更加流畅、高效且人性化的人机协作。
1、负责小红书电商和直播风险治理的策略算法工作,通过数据分析和算法建模,解决包括小红书电商和直播业务当中涉及交易、支付、体验、流量等多个风险治理域的治理问题。 2、风险问题发现:深入理解业务,通过定性和定量分析业务的关键问题,发现潜在风险点,提出优化建议和解决方案; 3、算法建模:针对各类风险问题,落地机器学习模型的解决方案,并部署应用; 4、指标体系建设:梳理和搭建各治理场景的核心指标体系,帮助业务明确风险治理路径,指导风险治理动作迭代; 5、驱动改进:基于实验分析、因果推断等手段,提出风控策略优化上的改进建议,提升风险治理效率;
【职位描述】 我们是小红书安全风控平台部/算法策略组/内容安全组,目前专注于多模态大模型在多模态理解和内容安全场景的技术落地和产品预研,目前在相关数据&技术方向有一定的积累,并将长期持续投入。我们希望寻求优秀在读硕士生/博士生共同突破大模型在安全审核行业落地的技术挑战,作为实习生,你将有机会与产品、工程紧密合作,将研究算法应用到实际问题中,并解决有难度有价值的问题,促进领域前沿技术的发展。欢迎投递简历。该岗位的核心研究方向包括但不限于: 1. 基础多模态表征:主要研究小红书多模态数据(笔记)下的基础多模态表征工作,包括层次化表征、特征融合、自监督探索等,作为基础模型,支持多样化检索场景。 2. 通用多模态大模型:通用多模态大模型在安全领域理解相关研究,包括高效微调、多模态理解等。建立安全多模态基础模型。