快手音乐AIGC大模型算法专家
社招全职3-5年D2861地点:北京状态:招聘
任职要求
1、机器学习、模式识别、信号处理等计算机相关专业的硕士或者博士; 2、有较丰富的语音/音频/音乐生成大模型相关领域经验; 3、熟练掌握C/C++、Python,有较强的代码实现能力; 4、具有独立解决问题的能力,良好的表达能力、沟通能力和团队合作意识。 加分项: 1、有AI音乐生成大模型技术研发经验者优先; 2、相关顶会或期刊上发表论文者优先(ICASSP,Interspeech,ISMIR,ICML,AAAI,NIPS等)。
工作职责
1、负责AI音乐生成大模型(Text-to-Music)架构设计、关键算法研发和优化; 2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 3、推动音乐AIGC技术在快手各业务场景中的落地,探索音乐生成技术在业务中的新玩法和业务创新。
包括英文材料
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
模式识别+
https://www.mathworks.com/discovery/pattern-recognition.html
Pattern recognition is the process of classifying input data into objects, classes, or categories using computer algorithms based on key features or regularities.
https://www.microsoft.com/en-us/research/wp-content/uploads/2006/01/Bishop-Pattern-Recognition-and-Machine-Learning-2006.pdf
Pattern recognition has its origins in engineering, whereas machine learning grew out of computer science.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
ICML+
https://icml.cc/
NeurIPS+
https://neurips.cc/
相关职位
社招3年以上A12914A
字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、与不同职能协作,为音乐技术开发提供完整数据方案与策略,并为整体数据质量负责; 2、负责音乐技术的模型效果评估体系设计并产出结论,根据结论进行系统分析,提出有价值可落地的改进方案,协算法提升模型效果; 3、合理评估和处理数据获取方案及质量; 4、协调数据处理资源,对数据生产的成本、质量、效率等进行整体把控。
更新于 2024-05-08
社招3-5年D2861
1、负责AI音频/音乐生成大模型关键算法研发和优化,包含但不局限于T2A、V2A和AI歌曲生成等方向; 2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 3、推动音频/音乐AIGC技术在快手各业务场景中的落地,探索音频/音乐生成技术在业务中的新玩法和业务创新。
更新于 2025-08-04
校招J1010
1、负责AI音频/音乐生成大模型关键算法研发和优化,包含但不局限于T2A、V2A和AI歌曲生成等方向; 2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 3、推动音频/音乐AIGC技术在快手各业务场景中的落地,探索音频/音乐生成技术在业务中的新玩法和业务创新。
更新于 2025-08-14