logo of aligenie

智能互联达摩院-芯片软件工具链研发专家-计算技术

社招全职8年以上技术-芯片地点:北京 | 杭州 | 上海状态:招聘

任职要求


● 计算机、软件工程、电子工程等相关专业,硕士及以上学历
● 10年以上软件开发经验,3年以上团队管理经验,有完整的工具链/IDE产品交付经验
● 精通C/C++Python,熟悉编译原理、程序分析、性能优化等领域
技术能力
● 深入理解芯片(GPU/NPU/TPU等)架构原理,了解异构计算、并行计算相关技术
● 熟悉主流深度学习框架的内部机制,有框架适配或算子开发经验者优先
● 具备以下一项或多项工具开发经验:
    ○ Profiler/性能分析工具开发
    ○ Debugger/…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


一、团队管理
● 负责芯片工具链团队的组建、管理与梯队建设,打造高效能研发团队
● 制定团队技术路线图,规划产品迭代计划,把控项目进度与质量
● 建立团队技术规范与研发流程,推动工程效率持续提升
二、产品规划与设计
● 主导芯片全流程开发工具链的整体架构设计,构建端到端的AI应用开发解决方案
● 规划并落地以下核心工具模块:
    ○ 算子开发工具:算子设计、工程创建、单元测试、异常检测、调试调优等全链路工具
    ○ 训练开发工具:模型迁移分析、精度调试、性能调优、内存检测等训练场景工具
    ○ 推理开发工具:模型量化压缩、推理精度调试、性能调优、负载均衡、Benchmark评测等推理场景工具
    ○ 可视化工具:模型结构可视化、训练过程可视化、性能数据可视化分析平台
    ○ 诊断分析工具:内存泄漏检测、性能瓶颈分析、精度问题定位等诊断工具
● 跟踪业界主流AI框架发展趋势,确保工具链的兼容性与易用性
● 攻克大模型训练与推理场景下的性能优化、精度调试等关键问题的工具设计与研发难题
三、生态建设
● 与芯片设计、编译器、Runtime等团队紧密协作,推动软硬件协同优化
● 建立开发者社区,输出技术文档、最佳实践与案例教程,赋能开发者生态
包括英文材料
学历+
C+
C+++
Python+
还有更多 •••
相关职位

logo of aligenie
社招3年以上技术-芯片

我们正在寻找一位经验丰富的模块测试工程师,专注于服务器核心模块与子系统的深度测试与验证。您将负责从单元到系统级的测试策略设计、自动化实现与问题定位,确保服务器各关键模块(如内核/虚拟化、高速总线、编解码等)的功能、性能、可靠性及兼容性满足严苛的行业标准。您需要对服务器硬件架构与软件栈有深入理解,并能通过创新的测试方法发现潜在缺陷,为产品的高质量交付提供坚实保障。 岗位职责: 1. 服务器核心模块测试策略与执行:负责制定和执行服务器关键模块的测试计划,特别是在如下某一个或者某几个核心模块有扎实测试专长的候选人加入: a. 内核与虚拟化模块:测试虚拟化技术(如KVM, VMware ESXi)、容器运行时、内核关键子系统(调度、内存管理、网络栈)的功能、性能隔离与稳定性。 b. 高速互连总线模块:负责PCIe, CXL, NVLink等高速总线的功能验证、带宽/延迟性能基准测试、错误注入与容错测试。 c. 硬件加速与编解码模块:测试GPU、视频编解码器(如H.264/HEVC/AV1)、加解密引擎等硬件加速单元的功能正确性、性能提升及驱动兼容性。 d. 固件与BMC模块:参与服务器固件(BIOS/UEFI)、基板管理控制器(BMC)的接口、安全与可靠性测试。 2. 测试框架与自动化开发:针对特定模块,设计并开发高覆盖率的自动化测试套件、压力测试工具和性能基准测试框架。集成到CI/CD流水线,实现模块质量的持续监控。 3. 深度分析与问题定位:执行测试并分析结果,能深入日志、硬件寄存器、性能计数器等,对发现的缺陷进行根因分析,准确定位至硬件、固件、驱动或应用层,并与研发团队紧密协作推动问题解决。 4. 系统级集成与可靠性验证:将模块测试融入整机系统测试,验证多模块协同工作下的功能与性能,设计并执行长时压力、故障恢复、容错等可靠性测试场景。 5. 技术预研与能力建设:跟踪服务器技术演进(如新硬件架构、互联协议、虚拟化技术),预研新的测试方法、工具与标准,提升团队在特定模块领域的测试深度与效率。

更新于 2026-04-07上海
logo of aligenie
社招8年以上技术-芯片

本职位旨在领导和管理SoC的硬件原型验证平台(如基于FPGA或Emulation系统),确保为芯片系统级验证(System Validation)和早期软件开发(Software Bring-up)提供高效、稳定且功能完备的开发基座。对原型平台的资源策略、技术实现及团队能力建设负全面责任。 一、 原型资源战略规划与环境管理 1. 资源评估与基础设施建设:负责硬件原型验证资源(包括Cadence Palladium、Synopsys Zebu、或特定FPGA原型板如HAPS等)的技术评估、容量规划与预算管理。主导**原型验证环境(Prototyping Lab)**的搭建、维护与优化,确保原型平台资源(如功耗、散热、稳定性)高效且持续地满足项目各个阶段的验证需求。 2. 跨项目协同与资源调度:建立有效的原型资源调度机制,优化不同设计与验证团队之间的资源分配,提升原型平台的利用率与周转效率。 二、 平台移植、交付与架构演进 1. 多平台移植架构设计:规划并设计多个代际/功能原型平台(通常为2-3个并行平台)的架构移植方案、功能裁减策略和资源映射。重点关注关键子系统(如PCIe接口、DDR内存控制器、AI计算核阵列)在原型环境中的准确实现和性能匹配。 2. 版本控制与质量交付: 全面负责**原型平台的周期性交付(Version Release)**管理,确保平台版本的稳定性和可追溯性。 领导团队进行复杂硬件/软件协同问题的快速定位(Debugging)和系统级故障排除,确保原型平台的交付质量。 三、 团队能力建设与流程优化 1. 流程与规范建设:制定并完善原型平台开发、集成、测试和维护的标准化操作流程(SOP)和技术规范,提升团队的协作效率和可重复性。 2. 任务管理与绩效提升:负责团队的任务优先级划分、资源分配与进度跟踪。通过定期的技术复盘(Post-Mortem Analysis)和知识分享,推动团队成员在原型技术、调试方法及系统架构理解方面的专业成长。

更新于 2026-04-07上海
logo of aligenie
社招8年以上技术-芯片

本职位旨在领导和管理SoC的硬件原型验证平台(如基于FPGA或Emulation系统),确保为芯片系统级验证(System Validation)和早期软件开发(Software Bring-up)提供高效、稳定且功能完备的开发基座。对原型平台的资源策略、技术实现及团队能力建设负全面责任。 一、 原型资源战略规划与环境管理 1. 资源评估与基础设施建设:负责硬件原型验证资源(包括Cadence Palladium、Synopsys Zebu、或特定FPGA原型板如HAPS等)的技术评估、容量规划与预算管理。主导**原型验证环境(Prototyping Lab)**的搭建、维护与优化,确保原型平台资源(如功耗、散热、稳定性)高效且持续地满足项目各个阶段的验证需求。 2. 跨项目协同与资源调度:建立有效的原型资源调度机制,优化不同设计与验证团队之间的资源分配,提升原型平台的利用率与周转效率。 二、 平台移植、交付与架构演进 1. 多平台移植架构设计:规划并设计多个代际/功能原型平台(通常为2-3个并行平台)的架构移植方案、功能裁减策略和资源映射。重点关注关键子系统(如PCIe接口、DDR内存控制器、AI计算核阵列)在原型环境中的准确实现和性能匹配。 2. 版本控制与质量交付: 全面负责**原型平台的周期性交付(Version Release)**管理,确保平台版本的稳定性和可追溯性。 领导团队进行复杂硬件/软件协同问题的快速定位(Debugging)和系统级故障排除,确保原型平台的交付质量。 三、 团队能力建设与流程优化 1. 流程与规范建设:制定并完善原型平台开发、集成、测试和维护的标准化操作流程(SOP)和技术规范,提升团队的协作效率和可重复性。 2. 任务管理与绩效提升:负责团队的任务优先级划分、资源分配与进度跟踪。通过定期的技术复盘(Post-Mortem Analysis)和知识分享,推动团队成员在原型技术、调试方法及系统架构理解方面的专业成长。

更新于 2026-04-07上海
logo of aligenie
社招5年以上技术-芯片

1. 负责编译器的功能、性能及优化有效性测试 2. 验证代码生成质量,包括基础指令集和扩展指令支持 3. 设计并实现自动化测试框架,开发测试工具和性能分析方案 4. 构建完整的测试验证环境,确保编译工具链的稳定性和可靠性 5. 分析定位编译相关问题,推动问题解决和优化改进

更新于 2026-04-07杭州