快手【留用实习】音视频联合生成大模型算法工程师
实习兼职J1007地点:北京状态:招聘
任职要求
1、计算机和数学相关专业,硕士及以上学历; 2、对VAE、扩散/AR模型、多模态等技术有深度理解,有较强的代码实现能力; 3、有较丰富的语音/音频/音乐生成大模型相关领域经验; 4、具…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责可灵AI音视频联合生成大模型的关键算法研发和优化; 2、负责音视频数据的筛选,清洗和打标工作,为可灵AI音视频联合生成大模型提供数据支持; 3、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 4、推动音视频联合生成技术在可灵及快手各业务场景中的落地,探索新玩法和业务创新。
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••
相关职位
实习J1020
1.参与AI与GPU相关项目的性能优化与研发,通过利用CPU、GPU的并行计算优化、架构优化、量化优化和异构调度等高性能优化技术,研发行业领先的高性能异构AI优化技术与编译优化技术; 2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理场景的性能; 3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。
更新于 2025-03-31杭州|北京
实习J1007
1、参与快手音视频大模型研发,内容包括视频处理大模型/编码大模型。其整体目标是用更少的码率,转出画质更好的视频,从而为用户带来更好的体验,实现压缩即智能; 2、负责点播/直播的处理大模型开发,探索超分等处理大模型算法上限,内容包括网络架构设计和优化,大规模数据处理, Diffusion保真性优化等; 3、负责点播/直播的编码大模型开发,探索AI codec的压缩上限,内容包括压缩网络框架设计和优化,与H.265等传统算法性能评估等; 4、跟踪国内外最新的前沿AI技术,融合处理和编码大模型,为公司研发出下一代基于AI的高效视频转码系统。
更新于 2025-03-18北京
实习J1001
1 挖掘海量用户数据,进行音视频场景的画像体系建设,包括但不限于机型画像、网络画像、用户清晰度/流畅度偏好画像等,精准刻画用户音视频属性。 2. 建设音视频体验QoE模型,优化播放和边缘计算相关策略,如预加载、CDN调度、PCDN等; 3. 基于因果模型、机器学习模型等框架进行音视频用户画像研发,全链路优化模型效果,包括特征优化,模型结构优化等 4. 与内外部团队合作,包括商业化、电商等,制定基于用户价值的体验和成本ROI优化策略,并推动优化上线。
更新于 2025-03-04北京