快手多模态内容理解算法实习生-【算法中心】
任职要求
1、本科及以上学历,对视觉前沿技术有浓厚兴趣,时刻跟进学术界最新进展,有自己独立的想法和判断,能够快速复现学术界最新成果; 2、编程基础扎实,熟练掌握C++/Python,熟悉Pytor…
工作职责
1、对图像、视频、文本等进行深入的语义理解,支持短视频、直播、搜索、推荐、商业化等业务需求; 2、推进视觉相关基础技术研发,如大规模分类、检测、分割、序列识别、人脸、自监督学习、内容生成、模型压缩和优化等。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、参与大模型算法、业务及产品团队关于模型应用场景落地的相关工作,协助保障数据质量和生产效率; 2、跟踪行业最新技术动态,尝试先进的方法和工具,参与数据标注质量管理、成本管控、模型数据策略提升以及基础模型评测等多阶段任务; 3、定期开展市场调研工作,收集一线用户需求并进行深入分析,协同产品、研发等团队,参与产品功能的迭代与优化,包括模型策略、C端评测等环节。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、在视频生成和视频理解领域,参与建设高质量、多样性的数据,建设顶尖数据集,探索数据配方的奥秘; 2、参与解决大规模数据生成的成本和分布式性能问题,一起尝试去定义LLM和AI LLM的研发新范式; 3、探索把AI技术应用在大模型的全生命周期中,包括不限于数据建设、数据生成、指令微调、偏好对齐等; 4、建设高质量、多样性的视频数据集,探索更多相关应用的落地场景。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、推动大语言模型代码方向的核心技术建设,持续优化大模型代码理解、推理与生成能力; 2、致力于提升真实生产环境代码库的代码理解推理与生成能力,提升国际化短视频服务代码性能和隐私合规能力; 3、探索适合实际业务生产环境的Code Agent能力,提升国际化短视频研发效率。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、探索把AI技术应用在大模型的全生命周期中,包括不限于数据建设、数据生成、指令微调、偏好对齐等; 2、建设高质量、多样性的视频数据集; 3、探索相关应用落地场景,包括视频生成、视频理解等。