logo of bytedance

字节跳动AI芯片架构工程师(上海)

社招全职I1800地点:上海状态:招聘

任职要求


1、熟悉计算体系结构,对典型的AI硬件加速器架构或者GPU架构有深入的了解;
2、有AI模型优化相关的经验,对典型的AI模型计算访存行为有较好的理解;
3、熟悉分布式训练流程,熟悉反向传播和参数更新等过程;
4、熟练掌握c/c++,python等相关编程语言。
以下为加分项:
1、对计算机网络TCP/IP协议栈或者RDMA协议有了解;
2、了解TensorFlowPytorch深度学习框架等;
3、具有ISS、Cycle-Accurate Model及SystemC工程经验。

工作职责


1、负责AI训练芯片架构的探索与设计;
2、负责AI训练系统的软硬件协同设计;
3、负责不同业务场景下AI模型训练流程中的关键任务和典型算子分析;
4、负责芯片架构的systemc建模。
包括英文材料
C+
C+++
Python+
TCP/IP+
TensorFlow+
PyTorch+
深度学习+
相关职位

logo of bytedance
社招5年以上A209177

1、对接需求方,进行系统性需求拆解,转化为SoC架构层面可实现的技术规格; 2、参与SoC架构的顶层设计,负责编写SoC Top规格文档; 3、参与SoC各子系统IP选型、规格定义与架构设计,确保各子系统间高效协同工作; 4、负责SoC的统一地址空间和访问关系规划,满足各子系统数据交互需求; 5、负责SoC的RAS架构设计,满足系统级可靠性指标需求;组织SoC内跨子系统其他架构问题讨论,负责相关SoC顶层方案设计; 6、参与SoC顶层集成、性能调优、功耗分析等方案设计;参与软硬件协同架构讨论,负责相关SoC硬件方案设计。

更新于 2025-02-18
logo of oppo
校招AI/算法类

负责端侧AI大模型的芯片加速方案预研及开发,系统方案分析 及 验证

更新于 2025-07-18
logo of liauto
校招芯片架构

“理想+”是理想汽车面向全球招募优秀AI技术人才的校园招聘计划,涵盖大模型、AIGC、算法部署、推理加速、AI芯片研发等领域方向。理想汽车2023年实现千亿营收、百亿盈利。经过9年的发展,截至2024年6月理想汽车累计交付已突破80万辆。海量的用户规模和持续的盈利能力将支持理想汽车不断扩大在AI前沿技术领域的研发投入,保持从电动化到智能化的持续领先,把握时代机遇,成为全球领先的人工智能企业。 我们期待你的加入,与理想汽车一起成长、分享收获。通过人工智能技术去改变物理世界的效率和体验,造福我们服务的每一个家庭,以及家庭里的每一位成员。 本岗位的主要工作内容为负责AI芯片和系统领域的技术创新研究,包括: 1. 下一代AI芯片架构,如计算和通信; 2. AI芯片计算效率相关加速技术,如AI编译器和高性能算子自动代码生成; 3. 分布式训练,如支持大模型训练的相关技术; 4. 支撑自动驾驶的系统技术,如确定性延时、可靠性、异构资源的调度等。

logo of dji
社招5年以上芯片

1. 负责自研NPU芯片的系统级、微架构级建模与仿真平台的设计与实现; 2. 主导NPU架构的性能、功耗、带宽等多维度建模分析,支持架构设计空间探索与优化; 3. 结合业务需求,建立高效、可扩展的建模工具链,推动软硬件协同设计; 4. 跟踪业界前沿建模技术,推动建模方法和工具的持续创新。

更新于 2025-06-16