logo of kuaishou

快手【留用实习】音视频联合生成大模型算法工程师

实习兼职J1007地点:北京状态:招聘

任职要求


1、计算机和数学相关专业,硕士及以上学历;
2、对VAE、扩散/AR模型、多模态等技术有深度理解,有较强的代码实现能力;
3、有较丰富的语音/音频/音乐生成大模型相关领域经验;
4、具…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责可灵AI音视频联合生成大模型的关键算法研发和优化;
2、负责音视频数据的筛选,清洗和打标工作,为可灵AI音视频联合生成大模型提供数据支持;
3、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向;
4、推动音视频联合生成技术在可灵及快手各业务场景中的落地,探索新玩法和业务创新。
包括英文材料
学历+
大模型+
还有更多 •••
相关职位

logo of kuaishou
实习J1020

1.参与AI与GPU相关项目的性能优化与研发,通过利用CPU、GPU的并行计算优化、架构优化、量化优化和异构调度等高性能优化技术,研发行业领先的高性能异构AI优化技术与编译优化技术; 2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理场景的性能; 3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。

更新于 2025-03-31杭州|北京
logo of kuaishou
实习J1007

1、参与快手音视频大模型研发,内容包括视频处理大模型/编码大模型。其整体目标是用更少的码率,转出画质更好的视频,从而为用户带来更好的体验,实现压缩即智能; 2、负责点播/直播的处理大模型开发,探索超分等处理大模型算法上限,内容包括网络架构设计和优化,大规模数据处理, Diffusion保真性优化等; 3、负责点播/直播的编码大模型开发,探索AI codec的压缩上限,内容包括压缩网络框架设计和优化,与H.265等传统算法性能评估等; 4、跟踪国内外最新的前沿AI技术,融合处理和编码大模型,为公司研发出下一代基于AI的高效视频转码系统。

更新于 2025-03-18北京
logo of kuaishou
实习J1001

1 挖掘海量用户数据,进行音视频场景的画像体系建设,包括但不限于机型画像、网络画像、用户清晰度/流畅度偏好画像等,精准刻画用户音视频属性。 2. 建设音视频体验QoE模型,优化播放和边缘计算相关策略,如预加载、CDN调度、PCDN等; 3. 基于因果模型、机器学习模型等框架进行音视频用户画像研发,全链路优化模型效果,包括特征优化,模型结构优化等 4. 与内外部团队合作,包括商业化、电商等,制定基于用户价值的体验和成本ROI优化策略,并推动优化上线。

更新于 2025-03-04北京
logo of kuaishou
实习J1017

1、负责快手音视频SDK的质量体系建设和交付,达成业界一流的流媒体体验; 2、负责音视频SDK方向的质量交付、竞品对比,给出业务改进方向; 3、参与质量平台建设,通过测试方法、工具创新,努力提升质量及测试效率。

更新于 2025-04-15深圳