logo of horizon

地平线智能计算体系研发实习生(软硬协同方向)

实习兼职软件序列地点:北京 | 上海状态:招聘

任职要求


教育背景:计算机,自动化,AI算法等相关专业在读硕士及以上学历。
体系结构与AI基础: 具备扎实的计算机体系结构基础,了解现代AI加速器工作原理;熟悉深度学习基础理论,对强化学习或大语言模型有一定了解。
编程与开发能力: 熟练掌握 C/C++ 与 Python,具备扎实的算…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


前沿算法探索与复现: 跟踪学术界在 AI for Systems、强化学习(RL)等算法应用于编译优化领域的最新进展,探索评估各种算法在实际编译器场景中的潜力。
软硬件协同设计辅助: 参与下一代AI推理芯片的早期架构预研。协助构建AI驱动的性能评估模型,为指令集设计、存储层次划分等提供基于数据的分析支持。
性能基准测试: 针对不同的算子和网络结构,在底层架构(如GPU、TPU类芯片)上进行性能压测与瓶颈分析。
包括英文材料
算法+
学历+
深度学习+
强化学习+
还有更多 •••
相关职位

logo of aliyun
实习阿里云2026届

阿里云持续推进AI技术深化战略布局,围绕AI和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正在招募软硬件结合开发工程师,致力于打造下一代智能化软硬件一体化解决方案。 作为软硬件结合开发工程师,你将参与从底层硬件设计到上层软件优化的全流程研发工作,推动AI、云计算和大数据技术在高性能计算、异构计算等领域的创新与落地。具体职责包括但不限于以下方向: 岗位职责 1. 软硬件协同优化 负责软硬件协同设计,优化计算性能、能耗效率和系统稳定性。 针对特定应用场景(如AI推理、分布式存储、实时计算等),设计并实现高效的软硬件解决方案。 2. 基于FPGA/ASIC芯片的设计与开发 参与FPGA/ASIC芯片的设计与验证,包括算法映射、硬件架构设计和性能调优。 开发硬件抽象层(HAL)和相关工具链,支持硬件加速器与上层软件的无缝集成。 参与硬件加速器及系统仿真模型的开发和调试。 3. 计算平台底层软件开发 研发基于CPU、GPU、FPGA、ASIC等硬件的计算平台,提升AI训练和推理等业务的计算性能。 基于自研芯片平台,进行驱动和固件等开发,支持深度学习框架等软件在硬件平台上高效运行。 4. 操作系统与固件开发 优化Linux内核、设备驱动和固件,提升硬件资源利用率和系统响应速度。 开发针对特定硬件的定制化操作系统模块,满足高性能计算需求。 5. 开发者工具与生态建设 开发软硬件结合的开发者工具链(如SDK、CLI、IDE插件),降低开发门槛。 构建开放的技术生态,推动软硬件一体化解决方案的广泛应用。

更新于 2025-04-29杭州|上海|深圳
logo of horizon
实习芯片序列

前沿算法研究:跟踪具身智能与大模型领域的算子演进,分析其在 NPU 架构上的计算特征与访存瓶颈。 高性能算子研发:利用 AI 自动调优工具或数学建模手段,优化核心算子库,并在 NPU 模拟器上实现预期的能效比目标。 系统级建模优化:参与AI计算系统的建模工作,探索利用 AI 手段优化多核间的调度策略与数据互联架构。 软硬协同预研:作为技术纽带,将算法特征转化为具体的硬件设计建议,输出高质量的技术研究报告。

更新于 2026-03-16北京
logo of bytedance
实习A52265

团队介绍:字节跳动基础设施计算团队,专注构建面向大模型与 AI Agent 时代的 AI-Native Infra。我们从算力、系统到平台,围绕“AI 如何高效运行、持续进化、规模化落地”这一核心问题,重构计算基础设施。我们管理着数十万台服务器组成的超大规模集群,构建统一的异构算力调度与云原生运行体系;通过软硬协同与自研框架,持续突破大模型训练与推理的性能瓶颈;并进一步向上,打造企业级 AI Agent Infra,让 Agent 具备身份、权限、记忆、观测与治理能力,真正成为可运行在生产环境中的新型“应用形态”。 从云服务器、容器、函数,到 AI 网关、可观测与弹性体系,我们构建的是一个为 AI 而生、由 AI 驱动进化的基础设施平台,支撑集团核心业务与企业级客户的智能化升级。 如果你希望参与定义 AI 时代的 Infra 范式,而不仅是优化一个模块或服务——欢迎加入我们,一起构建下一代 AI 云原生基础设施。 课题介绍: 随着大语言模型与AI Agent规模化落地,传统云原生基础设施已难以适配AI负载的极致性能与弹性需求。本课题围绕AI基础设施全栈展开系统性研究: 1、网络与可观测:研究大规模AI集群故障智能定位与根因分析,结合时序数据库智能调优,提升集群稳定性; 2、存储系统:研发AI场景专属的Serverless高性能弹性文件系统与存储加速架构,探索DPU软硬件协同优化,突破AI存储性能瓶颈; 3、算力调度:研究GPU/CPU/MEM异构协同调度技术,面向AI Agent构建Serverless异构算力编排系统,解决负载异构、状态依赖等调度难题; 4、向量检索:优化面向大模型应用的向量检索核心技术,打造云原生分布式向量索引引擎,满足超大规模向量检索的低延迟、低成本需求; 5、智能化与Agent架构:探索基于AI Agent工作流的基础设施自动寻优,构建可自主进化的业务Agent框架,通过AI for Infra赋能全栈智能优化; 本课题旨在构建支撑大模型与AI Agent落地的下一代AI原生基础设施,提升资源利用率、降低成本、支撑弹性扩展,推动AI基础设施技术演进。 课题挑战: 1、全栈协同挑战:覆盖多技术领域,需要从端到端视角实现系统性优化,避免单点优化收益不足; 2、性能成本平衡:AI场景对性能提出极致要求,需要在吞吐、延迟、规模与成本之间找到最优平衡点; 3、云原生适配:需要将传统单机技术方案重构为适配云原生分布式架构,解决扩缩容、容错、调度等新问题; 4、AI系统融合:既需要用AI赋能基础设施优化,又需要基础设施原生适配AI负载,深度融合对技术整合要求高; 5、Agent稳定性:自主进化Agent框架需要解决经验学习、知识一致性、持续安全进化等基础问题,工程化难度大; 6、研发生态平衡:需要平衡前沿理论创新与工程落地,兼顾技术突破与现有业务生态适配。 课题价值: 1、构建大模型/RAG 场景的高性能基础设施底座,支撑大规模向量数据高效检索; 2、优化AI业务存储成本结构与运维复杂度; 3、提升异构算力资源配置效率与技术复用性。

更新于 2026-04-15上海
logo of bytedance
实习A215350

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、调研各类行业问题在AI-Based和经典方法上的软硬件技术栈,洞察模拟和计算的瓶颈; 2、从异构硬件、机器学习、分布式系统等角度入手,加速不同学科的核心软件及其数值计算库; 3、探索科学计算落地云原生设施的最佳实践,开发弹性资源、高通量编排等算力产品。

更新于 2024-05-16上海