字节跳动后端开发实习生-集团信息系统
任职要求
1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先; 2、热爱计算机科学和互联网技术,精通至少一门编程语言,包括但不仅限于:Java、C、C++、PHP、 Python、Go(Jav…
工作职责
ByteIntern:面向2026届毕业生(2025年6月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:集团信息系统部(Corporate Information System)负责字节跳动信息系统建设。通过构建领先的信息系统,助力公司业务和组织的长期高效经营与发展。与此同时,在安全、隐私、合规层面持续治理,为公司的稳健发展保驾护航。字节跳动的员工分布在全球超过120个城市,业务模式复杂,用户规模大。到现在,集团信息系统部已经覆盖人事、财务、法务、采购、审批、职场等多个领域,隐私安全工作同步开展,AIGC创新孵化也在逐步落地实现。 1、负责架构设计和开发,为亿级用户提供优质顺畅的信息服务和极致体验; 2、参与设计系统技术方案,代码开发和系统调优; 3、参与制定代码规范、测试规范,建立起开发质量控制方法; 4、协助团队攻克各种高并发、数据隔离、系统解耦等方面的技术难关; 5、参与各专项技术调研,新技术引入等前瞻项目。
【我们是谁?】 阿里云智能是阿里巴巴集团的技术基石,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力。我们的团队专注于机器学习系统(MLSys)的前沿研究与工程实践,特别是为“通义”系列大规模语言模型(LLM)的训练、推理提供坚实的系统支撑。在这里,你将有机会参与构建和优化支撑万亿参数级别模型的超级工程,直接影响亿万用户的AI体验。 【为什么这个机会不容错过?——来自工业界的真实挑战与机遇】 大规模语言模型的研发是一项复杂的端到端系统工程。从海量数据的高效处理、万卡集群的分布式训练、精细化的后训练调优,到低延迟高吞吐的推理服务和云上弹性部署,每一个环节都充满了挑战,也孕育着巨大的创新机会。我们认为,虽然算法创新是驱动力,但在LLM的整个生命周期中,系统扮演着至关重要的角色。 以下是我们正在“通义”大模型及相关场景下积极探索并期待与你共同攻克的挑战: 1.超大规模预训练系统优化:追求极致效率与稳定性 ·系统行为的深度洞察:在万卡集群并行训练的极致规模下,如何设计高效、低侵扰的追踪系统(Tracing System)以精准理解系统真实运行状态,本身就是一个难题。例如,仅网络层追踪就面临数据量爆炸性增长的挑战,如何在海量数据中高效提取关键信息,指导性能优化。 ·并行策略的自动化与智能化:随着模型结构的快速迭代,如何针对新型架构自动设计并调整最优的并行策略(张量并行、流水线并行、数据并行、序列并行及其混合),在复杂的内存、计算、通信约束下取得最佳平衡,减少人工调优的巨大成本。 ·大规模集群的韧性与容错:尽管我们拥有先进的异步、跨多级存储的Checkpointing机制,但GPU集群的故障(硬件、软件、网络等)仍会导致训练中断和时间浪费。如何进一步提升系统的容错恢复能力,最大限度减少故障影响,保障训练任务的连续性和效率。 2.后训练(RLHF等)中的算法-系统协同设计:提升“智能”的性价比 ·复杂工作流的高效资源调度:后训练阶段(如RLHF)涉及采样、训练、评估等多个计算特点各异的任务。如何设计智能调度系统,自动、高效地为这些任务分配和管理计算、存储、网络资源,以最小化总体资源消耗,或最大化单位资源投入下模型效果的提升“斜率”。 ·算法与系统协同进化:后训练的算法仍在快速演进,如何设计灵活、可扩展的系统架构,以适应算法的不断变化,并反过来通过系统创新启发新的算法可能性。 3.云原生推理服务:敏捷、高效、经济地赋能万千应用 ·多样化业务负载与SLA保障:云上推理业务场景丰富,客户对吞吐量、延迟、成本等有着不同的服务等级协议(SLA)要求。如何设计统一而灵活的推理服务系统,满足从离线批量推理到在线实时服务的各种需求。 ·推理优化技术的敏捷集成与工程化:学术界和开源社区的推理优化技术(如量化、剪枝、FlashAttention、PagedAttention、投机采样、模型编译等)日新月异。如何构建一套敏捷的工程体系,快速评估、吸收、融合这些前沿技术,并将其稳定部署到在线服务中,持续提升推理效率。 ·极致的资源弹性与成本效益:在云环境中,如何通过精细化的资源调度、高效的多租户管理以及智能的流量预测,应对业务负载的剧烈波动,最大限度地减少空闲资源浪费,为用户提供最具成本效益的LLM服务。
在这里,你可以参与高性能分布式服务端程序的系统设计,为淘宝天猫的产品提供强有力的支持,在海量的网络访问和数据处理中设计并设施最强大的解决方案; 在这里,你会深入理解业务,参与产品的开发和维护,完成从需求到设计、开发和上线等整个项目周期内的工作,为用户提供丰富而有价值的产品; 在这里,你可以参与基础软件的设计、开发和维护,如分布式在线服务、文件系统、缓存系统、Key/Value存储系统、数据库、Linux操作系统和Java优化等; 在这里,你可以背靠世界领先的大模型基座,在丰富的 B/C端应用场景中,探索 AI 技术在电商领域最前沿的应用:你会参与AI Agent开发与优化,基于大语言模型(LLM)或垂直领域模型,开发具备自主决策能力的AI Agent,支持任务分解、工具调用(如API、数据库)和结果反馈;同时你会参与AI应用开发与部署,将AI能力封装为服务,集成到企业级应用中。 在这里,你可以参与海量数据处理和开发,通过sql、pl/sql、java进行etl程序开发,满足商业上对数据的开发需求; 在这里,你会接触超大规模的计算底层核心技术的设计和实现,构建高可靠性、高可用性、高可扩展性的体系结构,满足日趋复杂的业务需求 加入我们,你将与淘天集团广泛的电子商务产品技术为伍,将消费者的喜爱变为极致性能的挑战,为业务产品保驾护航。来吧,我们等你加入!
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:集团信息系统部(Corporate Information System)负责字节跳动信息系统建设。通过构建领先的信息系统,助力公司业务和组织的长期高效经营与发展。与此同时,在安全、隐私、合规层面持续治理,为公司的稳健发展保驾护航。字节跳动的员工分布在全球超过120个城市,业务模式复杂,用户规模大。到现在,集团信息系统部已经覆盖人事、财务、法务、采购、审批、职场等多个领域,隐私安全工作同步开展,AIGC创新孵化也在逐步落地实现。 1、负责架构设计和开发,为用户提供优质顺畅的信息服务和极致体验; 2、参与设计系统技术方案,代码开发和系统调优; 3、参与制定代码规范、测试规范,建立起开发质量控制方法; 4、协助团队攻克各种高并发、数据隔离、系统解耦等方面的技术难关; 5、参与各专项技术调研,新技术引入等前瞻项目。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:商业平台与基础架构团队负责抖音集团广告投放系统、广告AI系统、广告业务平台、广告创意平台和广告研发效能平台的建设。负责抖音、今日头条等各端上的广告业务系统研发,并且构建高并发、高性能、高可用的服务框架,设计和研发多数据中心的广告系统架构。同时推动用户行为长序列、深度学习推荐模型、多模态LLM和AIGC等先进技术在商业化场景中的应用和落地,精准匹配广告与用户需求,让营销更高效、更智能、更可持续。 1、负责架构设计和开发,为亿级用户提供优质顺畅的信息服务和极致体验; 2、参与设计系统技术方案,核心代码开发和系统调优; 3、参与制定代码规范、测试规范,建立起开发质量控制方法; 4、协助团队攻克各种高并发、数据隔离、系统解耦等方面的技术难关; 5、参与各专项技术调研,新技术引入等前瞻项目; 6、参与机器学习与异构计算系统研发。