logo of bytedance

字节跳动高性能异构计算研发实习生-豆包大模型

实习兼职A100044地点:杭州状态:停招

任职要求


1、2025届获得本科及以上学历,计算机、软件工程、人工智能等相关专业优先;
2、熟练掌握Linux环境下的C/C++、Python,具备扎实的编程能力和良好的代码风格;
3、熟悉计算机体系结构,有一定数据分析和数学建模能力;
4、有良好的文档习惯,具备团队合作精神以及项目沟通能力;
5、有强烈的工作责任心,较好的学习能力和自驱力;
5、了解前沿大模型模型结…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。
豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。

1、负责封装异构硬件加速能力,对接业务流程,跟进业务迭代;
2、负责异构硬件上推理和训练的工程优化,降低冗余计算、IO;
3、负责开发异构硬件的高性能算子开发,逼近硬件理论性能极限。
包括英文材料
学历+
Linux+
C+
C+++
还有更多 •••
相关职位

logo of sensetime
实习算法工程

1. 参与大模型推理系统设计和研究,进行服务层、推理层和算法层的优化探索,实现整体效率提升 2. 进行推理性能分析和优化,实现对gpu,npu等异构硬件,云端等各种场景的高效推理技术 3. 探索融合模态大模型的推理技术方案 4. 强化学习训练中的推理框架优化探索

更新于 2026-01-15北京|成都|上海
logo of xiaohongshu
校招引擎

本课题针对百亿级倒排索引的高性能检索需求,研发融合极致压缩算法与LSM Tree磁盘索引的高效倒排索引结构;设计基于异构计算加速、灵活查询DSL和混合存储引擎的检索算法;构建集成多级缓存、秒级实时索引更新和分布式调度的服务框架。 目标是在确保99.9%召回率的基础上,实现毫秒级响应,满足小红书亿级用户的高并发、低延迟检索场景。

更新于 2026-03-25北京|上海|杭州
logo of xiaohongshu
实习引擎

工作职责: 1、参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架; 2、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架; 2、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等; 3、与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成。

更新于 2026-02-12北京
logo of weride
实习研发算法类

团队介绍 我们致力于打造自动驾驶领域的下一代数据闭环系统。我们正在探索如何利用生成式AI重构物理世界,从海量路测数据中提取高保真、可交互的三维场景,构建大规模世界模型。我们寻找热衷于将前沿三维视觉技术转化为数据生产力的伙伴,共同攻克自动驾驶在复杂场景下的仿真与泛化难题。 负责3D高斯泼溅(3DGS)及前馈式生成模型的训练链路优化,提升训练速度、显存效率与模型稳定性; 设计与实现分布式训练框架,支持大规模三维场景数据的高并发训练与高效迭代; 深入硬件与计算栈,进行GPU算子优化、内存调度与混合精度训练策略的研发; 与三维视觉、自动驾驶仿真团队紧密协作,将优化后的训练系统应用于场景生成、神经渲染、高精地图构建等实际业务; 跟踪学术界与工业界在训练加速、模型压缩、系统架构等方面的最新进展,推动技术落地并形成工程实践。

更新于 2026-01-14北京|广州|上海