logo of kuaishou

快手【快Star-X】音频/音乐AIGC算法工程师

校招全职J1010地点:北京状态:招聘

任职要求


1、硕士及以上学历机器学习模式识别、信号处理等计算机相关专业优先;
2、有较丰富的语音/音频/音乐生成大模型相关领域经验;
3、熟练掌握C/C++Python,有较强的代码实现能力;
4、具有独立解决问题的能力,良好的表达能力、沟通能力和团队合作意识。

加分项:
1、有T2A、V2A、TTS和音乐生成大模型技术研发经验者优先;
2、相关顶会或期刊上发表论文者优先(ICASSP,Interspeech,ISMIR,ICML,AAAI,NIPS等)。

工作职责


1、负责AI音频/音乐生成大模型关键算法研发和优化,包含但不局限于T2A、V2A和AI歌曲生成等方向;
2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向;
3、推动音频/音乐AIGC技术在快手各业务场景中的落地,探索音频/音乐生成技术在业务中的新玩法和业务创新。
包括英文材料
学历+
机器学习+
模式识别+
大模型+
C+
C+++
Python+
ICML+
NeurIPS+
相关职位

logo of kuaishou
实习J1010

1、负责AI音频/音乐生成大模型关键算法研发和优化,包含但不局限于T2A、V2A和AI歌曲生成等方向; 2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 3、推动音频/音乐AIGC技术在快手各业务场景中的落地,探索音频/音乐生成技术在业务中的新玩法和业务创新。

更新于 2025-05-08
logo of tencent
社招5年以上和平精英手游技术

1.负责游戏内音频算法的实现与优化; 2.系统化的设计与研发游戏业内领先的音频算法与音效解决方案; 3.解决游戏音频疑难问题。

更新于 2025-09-02
logo of kuaishou
实习J1001

1、数据特征算法方案制定与效果优化:针对不同模态、多种类目的数据,设计自动化筛选方案;对多模态数据涉及的前沿特征算法(如物体跟踪、ID 重识别、音频分离)进行场景化效果优化。与算法工程师协作,制定数据调整与扩展策略,提升模型在真实场景中的生成能力; 2、数据 pipeline 建设:负责多模态大模型训练数据的构建与管理,参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源,设计有效的数据分布策略,支持模型持续迭代; 3、数据分布分析:对模型训练数据分布进行详细分析,识别数据偏差、不均衡及潜在问题。提供可视化报告及改进建议,确保训练数据覆盖目标场景并满足多样性需求,最终通过数据驱动方法优化视频生成大模型效果。

更新于 2025-07-18
logo of kuaishou
校招J1007

1、打造最适合短视频、直播、搜索推荐、电商、创作者玩法的多模态大模型,为快手的各项业务提供基座模型技术支持。多模态技术是通向AGI的重要方法和里程碑,期待和更多对多模态技术感兴趣的同学一起打造真正带来价值的模型算法技术; 2、深度探索多模态大模型的多阶段预训练、监督微调和RLHF等技术,打造业界第一梯队的多模态大模型,赶超GPT-4o、Gemini Pro等闭源模型的实际使用效果; 3、图片、语音、音频和视频多种模态信号的高效处理方式探索,提供对各类信号最精准的理解能力; 4、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索。

更新于 2025-07-30