美团GPU硬件架构师

社招全职3年以上核心本地商业-基础研发平台2025-01-14地点：北京状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历，熟悉通用CPU平台架构，有良好且全面的计算机/服务器软硬件知识；熟悉NVIDIA、华为的软件生态，熟悉GPU的硬件属性、芯片架构以及服务器系统设计；
2、三年以上GPU测试经验，熟悉AI常用框架、模型，熟悉一种或多种主流GPU架构（NVIDIA/华为昇腾/其他国产GPU），熟悉GPU服务器系统拓扑以及集群互联的网络方案；
3、掌握GPU原理与测试方法，了解P…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责GPU部件/GPU服务器的选型评估、准入测试、验收方案，推动GPU选型的标准化、流程化、自动化；支撑GPU产品的高质量交付；
2、能够定位GPU故障、性能异常调优，并结合业务场景，设计贴近业务场景的Benchmark测试方案；有模型性能调优经验者优先；
3、主动收集和了解业务需求，跟进主流GPU架构演进，基于业务和服务器硬件特性，制定合理套餐配置；
4、与网络/IDC/业务研发团队协同配合，参与技术方案讨论，从单卡、单机，拓展到超节点集群互联的方案设计，兼顾性能、稳定性与成本；
5、负责GPU服务器的稳定性保障工作，如监控、诊断、故障治理、数据运营等；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

系统设计+

NLP+

还有更多 •••

登录查看完整学习资料

相关职位

模型架构工程师-抖音直播

社招A44801A

团队介绍：字节跳动直播推荐架构团队，负责抖音全场景直播体裁推荐系统的设计和开发，工作内容覆盖离在线推荐链路全流程，包括策略架构、模型架构、数据架构等子方向，支撑算法团队的高效迭代，解决海量吞吐带来的系统性能/成本/稳定性挑战，在业务中抽象/沉淀基础服务/框架、服务组件以及效率工具等核心基建。 1、策略架构，负责推荐在线链路的服务建设和迭代，串联请求处理全流程，解决链路延迟、吞吐瓶颈、数据的高效传递等核心问题，支持业务策略的快速和可持续迭代，不断优化系统的性能/成本/稳定性，动态逼近优化上界，提升策略ROI； 2、模型架构，负责精粗召等推荐模型的在线推理、离线训练以及部分平台化工作，支持模型的持续复杂化演进，解决计算和存储瓶颈，突破模型复杂度X海量离在线样本X模型数量带来的巨大工程挑战，紧贴前沿框架、算法和加速硬件，支撑推荐算法的持续突破。

更新于 2025-05-13北京

模型架构工程师-抖音电商

社招A256680

团队介绍：字节跳动电商推荐架构团队，负责抖音全场景电商体裁推荐系统的设计和开发，工作内容覆盖离在线推荐链路全流程，包括策略架构、模型架构、数据架构等子方向，支撑算法团队的高效迭代，解决海量吞吐带来的系统性能/成本/稳定性挑战，在业务中抽象/沉淀基础服务/框架、服务组件以及效率工具等核心基建。 1、参与大规模机器学习在线预估和离线训练系统的研发与优化，支撑今日头条、抖音等字节跳动旗下电商场景高效模型推理； 2、紧贴前沿框架和社区工作，支持模型的持续复杂化演进，解决计算和存储瓶颈，突破模型复杂度X海量离在线样本X模型数量带来的巨大工程挑战； 3、参与大规模特征及样本的处理与流转、模型训练与调度等相关问题的研究与突破； 4、与推荐算法同学紧密合作，分析并解决上述问题及任务，并应用到实际业务中。

更新于 2025-05-13北京

服务器硬件系统架构师-智能计算

社招A65081

1、负责字节跳动服务器产品硬件架构设计，确保跨产品、跨代次硬件架构的一致性、系统性； 2、主导服务器技术选型，负责制定和更新服务器设备级架构路标，确保满足业务需求和技术先进性，对产品架构的领先性、关键技术准备节奏、可实施性负责； 3、研究和跟进服务器行业的最新技术，和业务团队、操作系统团队紧密配合，实现硬件方案创新，提升性能、降低成本，并确保系统的高可用性和高效运行； 4、与硬件研发、网络、IDC规划团队紧密协作，确定硬件架构总体设计方案，确保服务器硬件系统在TCO、性能、易部署、易运维方向竞争力领先。

更新于 2025-10-20杭州

钉钉-AI Infra架构师-大模型推理优化

社招5年以上技术类-开发

1. 推理引擎应用与优化：负责AI模型的性能优化与部署，应用业界主流推理框架（如vLLM、SGLang、TensorRT、ONNX Runtime、 TVM、OpenVINO等）对模型进行加速 2. 模型性能深度分析与调优：针对公司业务场景，对各类AI模型（包括但不限于大语言模型LLM、VL、ASR、TTS等）在不同硬件平台（GPU、PPU、昇腾、海光等）上进行深度性能分析、定位瓶颈并制定优化方案 3. 模型轻量化技术实践：熟练运用模型量化（PTQ/QAT）、剪枝、蒸馏等技术，在满足业务精度要求的前提下，最大化提升模型推理速度、降低资源消耗 4. 自动化部署与MLOps流程建设：建立并完善模型部署、监控和迭代的自动化流程（CI/CD、MLOps），确保模型稳定、高效地服务内外部客户 5. 前沿技术跟进与引入：持续跟进行业前沿的AI推理加速技术，探索并引入新的优化方案、工具及硬件（如LLM推理优化库、新型AI芯片等），持续提升业务模型的部署效率和运行性能

更新于 2025-08-18杭州