logo of aligenie

智能互联智能互联-硬件系统架构师-杭州、深圳、上海

社招全职6年以上技术类-开发地点:深圳 | 杭州 | 上海状态:招聘

任职要求


1. 本科及以上学历,电子、通讯、自动化相关科系。
2. 熟悉移动、穿戴、智能硬件主流SOC平台特性和路标演进; 精通存储、电源与功耗、传感器、显示、触控、音频、接口协议、EMC与ESD、互连等领域技术。
3. 10年以上硬件领域开发经验,主导过8款以上手机、平板、AI眼镜等消费电子或智…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 主导新平台或新模块导入的产品特性及硬件系统方案的设计和优化,包含主导相关创新技术的技术预研、产品预研、架构设计及专项攻关。
2. 从用户需求和行业动态中挖掘硬件创新机会点,推动并主导内部提前做好相关技术布局,形成产品卖点及技术壁垒。
3. 拉通硬件、软件,整机架构等领域对新技术新想法进行研讨,并转化为产品特性。
4. 负责承接产品软硬结合相关功能,并主导对应各场景解决方案疏理。
5. 负责主导项目过程中,软硬结合相关问题攻关解决。
包括英文材料
学历+
SOC+
相关职位

logo of vivo
社招5年以上研发类

1、负责端云算法架构设计及落地: - 负责设计和优化端云结合的算法框架,保证系统的高性能、可扩展性和可靠性; - 结合云计算资源特性,设计支持大规模数据处理和高并发计算的算法架构; - 开发和优化适用于端云结合部署的算法,包括机器学习、深度学习、数据分析等算法; - 监控算法在云端运行的性能,进行调优以降低计算成本和延迟; - 跟踪云端算法架构和云计算领域的最新技术,推动技术创新。 2、负责 芯算算法架构设计及落地: - 负责芯片架构与算法的协同设计和优化,确保硬件设计与算法需求高度匹配; - 针对特定应用场景,优化算法以适应芯片硬件特性; - 负责流片过程中的效果验证; - 负责芯片与算法的系统集成,确保功能与性能达标; - 跟踪芯算一体领域的前沿技术,推动技术创新。

上海|杭州|深圳
logo of aliyun
实习阿里云2026届

阿里云持续推进AI技术深化战略布局,围绕AI和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正在招募软硬件结合开发工程师,致力于打造下一代智能化软硬件一体化解决方案。 作为软硬件结合开发工程师,你将参与从底层硬件设计到上层软件优化的全流程研发工作,推动AI、云计算和大数据技术在高性能计算、异构计算等领域的创新与落地。具体职责包括但不限于以下方向: 岗位职责 1. 软硬件协同优化 负责软硬件协同设计,优化计算性能、能耗效率和系统稳定性。 针对特定应用场景(如AI推理、分布式存储、实时计算等),设计并实现高效的软硬件解决方案。 2. 基于FPGA/ASIC芯片的设计与开发 参与FPGA/ASIC芯片的设计与验证,包括算法映射、硬件架构设计和性能调优。 开发硬件抽象层(HAL)和相关工具链,支持硬件加速器与上层软件的无缝集成。 参与硬件加速器及系统仿真模型的开发和调试。 3. 计算平台底层软件开发 研发基于CPU、GPU、FPGA、ASIC等硬件的计算平台,提升AI训练和推理等业务的计算性能。 基于自研芯片平台,进行驱动和固件等开发,支持深度学习框架等软件在硬件平台上高效运行。 4. 操作系统与固件开发 优化Linux内核、设备驱动和固件,提升硬件资源利用率和系统响应速度。 开发针对特定硬件的定制化操作系统模块,满足高性能计算需求。 5. 开发者工具与生态建设 开发软硬件结合的开发者工具链(如SDK、CLI、IDE插件),降低开发门槛。 构建开放的技术生态,推动软硬件一体化解决方案的广泛应用。

更新于 2025-04-29杭州|上海|深圳
logo of vivo
社招3年以上研发类

• 负责端云算法架构设计及落地: - 负责设计和优化端云结合的算法框架,保证系统的高性能、可扩展性和可靠性 - 结合云计算资源特性,设计支持大规模数据处理和高并发计算的算法架构 - 开发和优化适用于端云结合部署的算法,包括机器学习、深度学习、数据分析等算法 - 监控算法在云端运行的性能,进行调优以降低计算成本和延迟 - 跟踪云端算法架构和云计算领域的最新技术,推动技术创新。 • 负责 芯算算法架构设计及落地: - 负责芯片架构与算法的协同设计和优化,确保硬件设计与算法需求高度匹配 - 针对特定应用场景,优化算法以适应芯片硬件特性 - 负责流片过程中的效果验证 - 负责芯片与算法的系统集成,确保功能与性能达标 - 跟踪芯算一体领域的前沿技术,推动技术创新

上海|杭州|深圳
logo of tencent
社招2年以上公共技术

1.负责深度学习训练相关算子的设计、实现与优化( CUDA/CUTLASS/Triton ); 2.面向大模型训练场景,对算子进行端到端性能分析与调优,持续挖掘吞吐、延迟、显存利用率等指标的优化空间; 3.参与或主导 3D 并行(Data / Tensor / Pipeline Parallel 等)训练体系下的算子与通信方案设计与优化; 4.与分布式训练、系统、模型算法团队密切协作,共同提升大规模训练任务的整体效率与稳定性; 5.跟踪业界前沿的硬件架构与系统软件(GPU 架构、网络、编译器、库等),将最新技术转化为实际性能收益。

更新于 2025-12-01深圳