字节跳动AI产品实习生-基础架构
任职要求
1、本科及以上学历在读,计算机科学、信息技术、人工智能或相关专业背景优先;
2、逻辑清晰,具有良好的问题分析能力和问题解决能力;
3、出色的沟通和团队合作能力,能够与多个团队紧密协作;
4、有互联网产品实习经历优先。
工作职责
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动基础架构团队主要负责公司云基础建设,支撑着字节跳动旗下多款APP产品,如抖音、今日头条、番茄小说、西瓜视频、飞书、剪映等,同时也负责支持火山引擎公有云业务。迄今为止,我们通过云技术管理着百万量级的服务器构成的超大数据中心;我们通过字节深度优化的Kubernetes管理超过千万容器实例支持10万+微服务;我们还通过丰富的存储产品矩阵,如NewSQL、NoSQL、云存储等治理EB级的数据资产;我们积极拥抱开源和创新的软硬件架构,致力于构建业界领先的云基础设施,为整个公司的业务和客户发展保驾护航。我们热切期待对技术有追求、对大型系统有深刻见解的同学加入基础架构团队一起构建基础设施系统。 1、参与AI云原生产品的策划,根据市场及用户反馈,制定产品线路、落实项目方案; 2、参与AI相关产品的生命周期管理,包括需求搜集、版本规划、设计研发、客户落地、持续运营、迭代改进产品等,达成业务目标; 3、同开发团队、销售团队、运营团队紧密合作,协调不同岗位人员的工作,推动产品发展; 4、跟进产品关键数据指标,用户反馈,制定产品的迭代计划。
1.完成下一代自动驾驶产品设计和交付,负责模型能力训练、人机交互方案设计、功能体验提升等; 2.与研发团队紧密合作制定自动驾驶产品的训练策略,包括但不限于数据准备、模型微调、强化学习等,确保模型在各应用场景下的性能和效率; 3.负责自动驾驶产品的评测和对标,指导自动驾驶能力的提升和迭代; 4.跟踪最新的人工智能技术和行业趋势,评估其对产品的影响,并提出相应的产品改进建议。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:基础架构-字节云是面向集团内部的私有云团队,为集团提供云计算解决方案。字节云既对集团各业务提供字节内部生态,同时还对各组件方提供多云管理框架。字节云覆盖从研发到运行时的服务全生命周期,包括微服务框架、服务发布、服务治理、多云管理以及经营分析等方向。团队管理着超大规模的微服务数量、全球化的部署体系、复杂的多云场景。极致的服务性能、简单易用的研发体验、一致的多云体验以及全视角的经营分析是团队持续追求的目标。 1、协助收集和分析字节云PaaS平台(云计算引擎、FaaS等)需求,参与行业市场的功能拆解与趋势研究,形成需求文档与市场分析报告; 2、辅助产品经理完成PaaS平台的原型设计(Axure/Figma等工具)、PRD撰写,跟进开发进度与测试验收; 3、参与用户场景调研,协助分析平台使用数据(如资源利用率、客户痛点反馈),为功能优化提供数据支撑; 4、协助对接研发、设计、测试团队,推动需求按时交付; 5、关注云原生、AI与PaaS融合趋势,为产品规划提供参考。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:IT部门面向字节跳动员工提供全球IT技术支持。我们既负责企业内部IT基础架构的设计和优化,也肩负着保护企业信息安全,降低企业运营风险的使命;同时,IT团队还会直接面向字节各业务线,承接企业级的网络、系统、终端、资产、服务台、多媒体、办公管理等多业务场景的研发需求,打造符合业界标准的商业化企业解决方案和产品,运用大数据和AI技术,提供更加自动化和智能化的企业技术服务。 1、负责IT-Service-AI方向产品的日常工作,包括需求分析、文档撰写、产品调研、行业信息收集等; 2、与上下游团队合作,推动AI应用层产品相关运营推广工作顺利进行,跟进用户日常反馈问题,根据优先级判断与产品研发团队合作,推进产品迭代; 3、总结常见问题,优化观察到的团队内流程问题,配合产品研发团队更好的交付。
团队介绍:字节跳动基础架构团队主要负责公司云基础建设,支撑着字节跳动旗下多款APP产品,如抖音、今日头条、番茄小说、西瓜视频、飞书、剪映等,同时也负责支持火山引擎公有云业务。迄今为止,我们通过云技术管理着百万量级的服务器构成的超大数据中心;我们通过字节深度优化的Kubernetes管理超过千万容器实例支持10万+微服务;我们还通过丰富的存储产品矩阵,如NewSQL、NoSQL、云存储等治理EB级的数据资产;我们积极拥抱开源和创新的软硬件架构,致力于构建业界领先的云基础设施,为整个公司的业务和客户发展保驾护航。我们热切期待对技术有追求、对大型系统有深刻见解的同学加入基础架构团队一起构建基础设施系统。 课题介绍: 课题背景: 在大语言模型蓬勃发展的当下,本课题聚焦于智能云基础设施与数据处理关键技术的多维度研究,旨在全面提升云服务在 AI 场景下的综合性能与效率。 课题挑战: 1、新一代搜索型数据库:当前产业界广泛应用的ElasticSearch面临数据与用户需求的深刻变革。需实现语义检索升级,突破关键词匹配限制,以满足学术研究等领域对语义理解和精准检索的要求;具备处理和融合多模态数据的能力,应对互联网图像、音视频多模态数据的爆发式增长;优化检索过程,更好地支持检索增强生成(RAG)技术,为语言模型提供优质信息;同时,需应对各行业海量数据存储检索压力,提升搜索实时性与跨语言能力; 2、面向LLM的下一代智能云基础架构:一方面,自动化和智能化管理基础架构各系统生命周期,深度融合人工智能与基础架构关键系统,建设大规模LLM for Infra 服务;另一方面,针对新涌现的LLM应用场景,在基础架构各个领域进行前沿技术创新,与字节工程团队合作,设计和开发高性价比且简单易用的下一代大模型基础架构,为火山引擎奠定技术与业务增长基础; 3、面向 AI 场景的serverless高性能弹性文件系统关键技术研究:大模型时代数据量爆炸式增长,当前文件系统多采用中心化元数据架构,难以水平扩展,限制文件系统规模及元数据性能。本研究将围绕元数据扩展性、与大模型深度结合提供Data Insight、设计高性能元数据单机引擎、实现任意目录快照、融合文件系统和对象存储元数据、内存加速、提供QoS(性能租户隔离和目录隔离)、故障处理(故障域隔离和故障无损)以及研发高性能客户端(用户态文件协议和DPU卸载)等关键技术展开; 4、面向大规模AI集群的高速通信和稳定性优化:随着大模型训练/推理业务规模增长,底层高速网络面临挑战。一方面,需解决GPU服务器硬件资源利用率偏低问题,包括充分利用CPU和内存空闲资源,以及研发计算通信融合的高性能集合通信库,实现通信算子与计算任务的深度融合;另一方面,在稳定性方面,提升故障快速发现和根因定位能力,解决网络吞吐不达预期等典型故障。