夸克大模型数据工程实习生
任职要求
我们希望你是: 1. 对AGI时代充满热情,积极看待变化、差距,对待成绩不浮躁、对外挑战不抱怨,对未知的可能性充满信心。 2. 具备较好的表达能力,对复杂任务的统筹和优化能力,具备较强的责任心。 3. 对大模型有基本了解,有产品设计、交互界面设计或数据标注经验者优先。 4. 具备充足的实习时间,每周到岗4天及以上,可在北京或杭州工作。 来这里可以收获什么? 全球顶级AI专家指导:直接参与到业内领先大模型的构建,与算法大牛并肩作战、协同工作。 深度业务场景参与:为亿级用户提供智能服务,见证技术实现用户价值,释放个人才华。 职业发展:通过深入理解数据与模型的交互,提升跨学科思维能力,增强职场竞争力。表现优异者可提前获得校招内推机会。
工作职责
我们是谁: 我们是阿里智能信息事业群,专注于AI to C的业务,为2亿用户群体提供AI服务,你或你身边的小伙伴中可能就是我们的用户。我们是一支致力于在AI赛道长期发展、创新务实的团队,欢迎每一位有想法、对AI有热情的小伙伴和我们一起参与这个令人激动的过程。 你会参与到: 1.与算法工程师携手深入探索大模型的底层原理,能够更好地理解数据与模型之间的关系,为模型训练提供更具针对性的标注策略,加速模型的优化与迭代。 2.深度参与数据与模型的交互过程,理解不同领域知识之间的关联和相互影响,从而拓展自己的知识边界,培养跨学科的思维能力,能够从多个角度理解数据、理解知识、理解智能。 3.通过对数据作为人工智能核心驱动因素之一的深刻理解和实战参与,进一步提升快速学习的能力、创新思维激发,对个人未来的职业发展中提供更多的可能性,进一步提升未来在职场的竞争力。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、在视频生成和视频理解领域,参与建设高质量、多样性的数据,建设顶尖数据集,探索数据配方的奥秘; 2、参与解决大规模数据生成的成本和分布式性能问题,一起尝试去定义LLM和AI LLM的研发新范式; 3、探索把AI技术应用在大模型的全生命周期中,包括不限于数据建设、数据生成、指令微调、偏好对齐等; 4、建设高质量、多样性的视频数据集,探索更多相关应用的落地场景。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、在视频生成和视频理解领域,参与建设高质量、多样性的数据,建设顶尖数据集,探索数据配方的奥秘; 2、参与解决大规模数据生成的成本和分布式性能问题,一起尝试去定义LLM和AI LLM的研发新范式; 3、探索把AI技术应用在大模型的全生命周期中,包括不限于数据建设、数据生成、指令微调、偏好对齐等; 4、建设高质量、多样性的视频数据集,探索更多相关应用的落地场景。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、在视频生成和视频理解领域,参与建设高质量、多样性的数据,建设顶尖数据集,探索数据配方的奥秘; 2、参与解决大规模数据生成的成本和分布式性能问题,一起尝试去定义LLM和AI LLM的研发新范式; 3、探索把AI技术应用在大模型的全生命周期中,包括不限于数据建设、数据生成、指令微调、偏好对齐等; 4、建设高质量、多样性的视频数据集,探索更多相关应用的落地场景。