字节跳动产品实习生-Data语音
任职要求
1、本科及以上学历在读,计算机、心理学等专业优先;
2、具备较强的问题分析与解决能力、沟通能力,善于团队协作…工作职责
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、定位产品重点关注用户,通过用户调研与数据分析进行产品体验分析,为产品迭代/优化/用户体验提升方向提供指导; 2、负责AI语音交互智能体的功能定义,算法策略讨论,并参与产品需求文档的撰写与维护,推动设计与优化开发落地; 3、参与部分项目管理工作,尤其是与算法/数据专家紧密协同,跟进需求推进,确保项目在每一个节点的迭代进度。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、了解AI模型训练基本原理,协助产品定义AI语音内容创作方向需求,完成各类算法能力评测、效果准出并落地; 2、进行产品/市场/行业分析、用户调研、数据分析,为产品迭代/优化/用户体验提升方向提供指导; 3、跟进具体需求的推进,确保项目的落地进度和交付质量。
Lindorm数据库的定位是AI时代的海量多模数据平台,目前Lindorm针对高并发在线、泛时序数据、搜索和AI几个主要业务场景提供了多模数据的存储、检索、分析与AI推理服务。如何实现针对多个不同业务场景下复杂各异数据模型的高效存储与处理,以及探索如何更好利用AI来对非结构化数据进行分析和理解,实现结构化数据与非结构化数据的融合处理,都存在巨大的挑战。如今AI技术发展迅速,我们希望能够进一步探索多模数据和AI结合的更多场景,将Lindorm数据库打造成AI应用的基础设施。 基于以上背景,本项目重点聚焦如下技术问题的研究: 1、探索如何在一个统一的数据库框架和底座下高效存储和处理包括宽表、时序、JSON、向量等复杂数据模型; 2、探索数据库如何更好地利用Data + AI来增强数据库分析和处理文本、图像、语音和视频等非结构化数据的能力,方便用户开发和部署AI应用,挖掘数据价值。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、为全球企业级客户提供高效的算法服务,包括但不限于传统搜推广、大模型技术与搜推结合以及大模型应用产品; 2、理解不同行业的客户场景和需求,落地相应的算法解决方案,包括但不限于电商/内容推荐、基于大模型技术的搜索方案以及知识库问答等LLM上层应用; 3、探索大模型相关方向的前沿技术,推进相关技术在业务场景的落地,包括但不限于长序列建模/多模态/RAG/智能体; 4、与产品研发团队协作建设平台产品,在多云环境下为全球范围内的客户提供算法解决方案,包括但不限于智能推荐平台和大模型搜推平台。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、支持抖音等国内产品内容算法在VLM相关的基础算法开发和基座模型建设,提升模型的评测分数和下游落地应用效果,支持从训练到在线推理的相关算法能力迭代; 2、从事VLM数据工程、模型结构、训练方法等方向的前沿技术探索和研发,发表学术论文和申请专利; 3、支持包括推荐算法、社区治理、安全审核、对话算法等其他算法团队对VLM基座以及基础多模态技术的需求。