字节跳动大模型算法实习生(质量智能)-开发者服务
任职要求
1、硕士及以上学位在读,计算机、人工智能、自动化、数学相关专业优先; 2、优秀的代码能力、数据结构和基础算法功底,熟练掌握至少一门编程语言,包括但不限于Python、Java、Go等,在ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 3、拥有机器学习领域的研究经历,特别是在大语言模型(LLMs)和生成式人工智能等方…
工作职责
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动开发者服务团队主要负责公司研发工具体系建设,为开发者提供全技术栈框架、工具和研发体系等基础设施。团队目前在服务端、移动端、Web、桌面端均有深入研究,致力于提供公司全产品线工程效能、可观察性以及各终端技术与框架的基础设施建设。团队还在探索前沿AI技术在工程生产力上的落地与应用,探索研发体系与领域模型的深度融合,实现开发者服务的升级与创新。期待对研发工具体系有兴趣、对技术有追求的同学加入,共同成长! 1、参与开发者服务型产品建设和算法研究工作;实习内容涉及大模型相关的Prompt、微调、智能体、RAG等方向探索、智能运维、数据工程、AI评测等; 2、持续跟进LLM前沿技术,为团队提供前沿的知识和见解,支持模型效果的研发落地和持续优化。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动开发者服务团队主要负责公司研发工具体系建设,为开发者提供全技术栈框架、工具和研发体系等基础设施。团队目前在服务端、移动端、Web、桌面端均有深入研究,致力于提供公司全产品线工程效能、可观察性以及各终端技术与框架的基础设施建设。团队还在探索前沿AI技术在工程生产力上的落地与应用,探索研发体系与领域模型的深度融合,实现开发者服务的升级与创新。期待对研发工具体系有兴趣、对技术有追求的同学加入,共同成长! 1、参与开发者服务型产品建设和算法研究工作;实习内容涉及大模型相关的Prompt、微调、智能体、RAG等方向探索、智能运维、数据工程、AI评测等; 2、持续跟进LLM前沿技术,为团队提供前沿的知识和见解,支持模型效果的研发落地和持续优化。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动开发者服务团队主要负责公司研发工具体系建设,为开发者提供全技术栈框架、工具和研发体系等基础设施。团队目前在服务端、移动端、Web、桌面端均有深入研究,致力于提供公司全产品线工程效能、可观察性以及各终端技术与框架的基础设施建设。团队还在探索前沿AI技术在工程生产力上的落地与应用,探索研发体系与领域模型的深度融合,实现开发者服务的升级与创新。期待对研发工具体系有兴趣、对技术有追求的同学加入,共同成长! 1、参与开发者服务型产品建设和算法研究工作;实习内容涉及大模型相关的Prompt、微调、智能体、RAG等方向探索、智能运维、数据工程、AI评测等; 2、持续跟进LLM前沿技术,为团队提供前沿的知识和见解,支持模型效果的研发落地和持续优化。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 1、参与搜索引擎(策略、模型)研发工作,支持抖音/今日头条/电商/番茄小说/红果短剧等具有数亿用户的产品,致力于为数亿用户提供数千亿精准搜索结果,打造极致的搜索体验; 2、探索前沿技术,探索大模型等创新技术在AI搜索场景的落地,参与搜索引擎、搜索大模型的改进,包括而不限于: 1)NLP、大模型:构建大规模高质量数据(数据建设、数据抓取与解析、数据合成等)、分词、NER,文本、多模态预训练、Query分析、基础相关性等,全链路结合应用机器学习/深度学习模型,探索搜索引擎与大模型、LLM、MLLM、多模态、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包含而不限于相关性、权威性、时效性、意图理解能力等;探索新的自然语言处理算法、信息检索技术、LLM适性索引、LLM相关性、生成式召回、排序大模型等,提高搜索引擎的准确性和智能化程度; 2)召回与排序:借助语义理解、个性化预估、机制设计等技术,解决超大规模的视频、商品、直播、POI等搜索业务下的召回、排序、重混排模型; 3)多模态、跨模态匹配技术:基于海量网页图文、抖音视频数据的大规模多模态预训练和视频分析技术,提升视觉搜索的使用体验;在搜索中结合CV+NLP深度学习技术,实现多模态、视频搜索、强大的语义理解和检索能力; 4)页面分析和摘要:从千亿视频/网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验; 5)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动Flow产品研发团队,专注研究AI智能化相关业务落地,目前落地豆包、Cici 等 APP,以及对应的Bot 开发平台等AI智能化创新产品,业务和团队均处于快速发展期,成长空间大,欢迎各位同学加入! 1、算法应用与优化:参与质量保障方向相关算法的设计/优化,能利用LLM等机器学习算法解决测试分析、风险预测领域的具体问题; 2、模型训练与评估:负责大语言模型的训练工作,也能通过评估技术、数据分析等多种方法不断提升模型能力,确保模型在实际应用中能够稳定、高效地运行,有效保障产品线上质量; 3、前沿技术探索:关注行业最新技术动态,积极探索将新技术应用于质量保障领域的可能性,如大模型技术在测试分析、风险识别、自动测试等方面的创新应用,为质量保障体系注入新的活力; 4、工程研发:从事系统设计、代码管理、接口开发等方面工作,实现算法模型与前端交互界面、后端数据存储的有效连接,完成配套工程中服务端应用的开发,为算法的实际应用提供工程支持。