快手多模态算法实习生
实习兼职D3336地点:北京状态:招聘
任职要求
1、计算机、多媒体通信、信号处理等相关专业本科及以上学历,实习生时间保证6个月以上; 2、精通图像增强算法基本原理,有美颜、降噪、弱光增强、防抖、去雾、超分辨率、插帧等算法研发经验者优先; 3、良好的计算机科学基础, 具备较强的算法实现和复现能力,…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责研发基于diffusion的low-level视频处理算法,专注于提升算法性能,包括但不限于网络架构设计(VAE和DIT)、算法优化、大规模数据处理以及Diffusion模型保真性提升; 2、负责研发基于diffusion的视频压缩和生成框架,致力于突破视频生成极限,涉及图像/视频压缩算法的创新设计和优化; 3、负责跟进和探索业界前沿视频修复技术,并根据业务需求进行创新和性能提升。
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
还有更多 •••
相关职位
实习技术类
1.深入开展内容安全治理多模态大模型的调研工作,跟踪前沿技术发展趋势,分析不同模型在该场景下的适用性。 2.协助团队进行多模态大模型的训练工作,包括数据预处理、模型搭建、参数调整等,以提升模型在内容审核任务上的准确性和效率。 3.参与模型性能评估,分析实验结果,提出改进方案,优化模型性能。 4.与其他团队成员协作,共同解决在多模态模型应用于内容审核业务过程中遇到的技术问题。
更新于 2025-06-09上海
实习AIGC算法
【岗位亮点】 顶会论文直通车:我们鼓励并全力支持你将研究成果发表到CVPR、NeurIPS等顶级会议,资深技术人员全程指导,算力充足。 核心业务组:智能创作发布,直接影响用户体验,专注于将前沿多模态大模型、AIGC 技术与小红书发布核心业务深度融合。转正机会大。 前沿探索与创新:聚焦多模-态大模型(MLLMs)前沿,在 多模态指令微调、多模态检索、个性化文案生成、RAG 等方向中选择你最擅长或最感兴趣的,提出并实现你的创新想法。 从想法到落地:负责从算法设计、实验验证到模型优化的全流程,用严谨的实验和数据说话,推动研究课题取得突破。
更新于 2025-09-05北京

校招AI 算法类
负责研发虚拟数字人多模态交互算法,整合语音、文本、表情、肢体动作等多模态信息,实现自然流畅的人机交互; 持续优化多模态交互算法,提升数字人对复杂多模态输入的理解与处理能力,增强交互的精准性和实时性; 探索端到端的数字人多模态交互技术; 跟踪人工智能领域的前沿技术在虚拟数字人项目的应用和落地。
杭州