logo of xiaohongshu

小红书音频算法实习生

实习兼职多媒体算法地点:北京 | 上海状态:招聘

任职要求


1、可全勤实习,可实习6个月及以上优先;
2、本科及以上学历,了解音频相关基础知识,熟悉python编程;
3、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责音频相关算法预研(语音降噪,增强等),模型训练和评测;
2、负责音频数据收集,梳理和清洗;
3、负责音质竞品调研分析等。
包括英文材料
学历+
还有更多 •••
相关职位

logo of xiaohongshu
实习多媒体算法

工作职责 1.负责音频算法(包括但不局限于3A,音频增强,tts/asr,音乐生成等)优化与开发 2.负责算法效果测试与验证,对算法效果进行把控和调优 3.对接需求,对接各端反馈问题,对问题与需求进行分类汇总 4.参与前沿技术研究与开发,对有关算法以及优化思路进行整理与汇报

更新于 2025-12-04北京|上海
logo of bytedance
实习A170636

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 1、研究和实现部门自研的下一代沉浸智能音频理解和处理算法系统; 2、跟进并参与国内和国际音频标准,撰写高质量的标准技术提案,推动国内和国际沉浸智能音频标准工作; 3、实现并优化沉浸智能音频编解码和处理系统,负责在短视频点播,直播,VR/MR等业务场景的应用迭代。

更新于 2025-02-18北京
logo of bytedance
实习A164153B

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、承担抖音内多元语音交互场景中的语音模型需求,涵盖抖音AI分身音视频对话、客服热线、VOIP场景下的相关音频算法研发工作;包括对语音识别、合成、对话理解等模型展开针对性训练与优化,全力提升对话效果及语音合成稳定性和表现力; 2、深入探索端到端语音大模型的落地与优化举措,致力于降低语音交互延时,显著提升语音对话品质;同时,专注于语音合成/音频AI生成相关算法模型的研发与精进,跟进语音领域前沿技术研究,负责音频表征模型、Seq2Seq底膜的研发优化; 3、紧密跟踪研发业界先进的音频技术进展,积极探索语音/音频领域最新技术,并推动其成功落地于抖音产品之中。

更新于 2025-04-09北京
logo of bytedance
实习A133856

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 1、负责流媒体场景(RTC、点播、直播等)音频编解码压缩需求和功能开发维护; 2、针对流媒体场景(RTC、点播、直播等)特点研发音频编码算法,提升音频体验,降低成本; 3、负责撰写技术方案、专利申请、论文发表和算法集成落地等开发工作。

更新于 2025-04-23北京