logo of bytedance

字节跳动服务器硬件系统工程师(异构计算方向)

社招全职5年以上A22555A地点:上海状态:招聘

任职要求


1、至少5年以上异构硬件系统方案分析经验,有大规模异构计算系统的方案设计和实现经验;
2、熟悉计算机体系结构、硬件设计和实现,熟悉CPU、GPU、FPGA等异构计算硬件;
3、熟悉PCIe、D…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、理解上层业务应用,结合异构芯片应用特点,负责异构硬件系统需求分析,输出异构芯片需求规格,输出异构硬件系统方案;
2、和业务团队、软硬件研发团队紧密配合,分析工作负载模型,帮助业务团队实现硬件方案创新,提升性能、降低成本;
3、与芯片、网络、IDC、软件等团队紧密协作,负责异构芯片需求规格和异构硬件系统方案分析,确保异构硬件系统在TCO、性能、可靠性、DFX等方向竞争力领先;
4、跟进行业组织、开放标准组织,研究分析最新的技术、标准;结合产业链的最新技术能力和硬件产品特点提供综合竞争力领先的异构硬件系统方案。
包括英文材料
FPGA+
相关职位

logo of bytedance
社招5年以上A5253

1、结合对混合云平台应用特点,深入理解上层应用迭代路标,整理输出清晰的混合云硬件产品支持路标,确保硬件方案的领先性; 2、负责混合云各类业务组件资源需求画像、跨代跨平台场景化性能收益测试验证,设计性能测试方案,执行性能测试,针对系统性能瓶颈分析,提出调优建议并协助调试验证完成,输出性能测试报告;协调解决新硬件、新技术落地过程中遇到的技术问题; 3、混合云产品业务场景收益对比评估,确定选型方案,输出方案迭代标准算力/资源折算方案; 4、结合产业链的最新技术能力和硬件产品架构特点,提供综合竞争力领先的异构硬件解决方案,输出自研硬件服务器产品资料; 5、监控和分析异构云硬件在实际应用中的质量、性能表现,并提供系统的技术支持能力,推动改进识别和落地。

更新于 2022-10-10上海
logo of bytedance
社招A147267

1、负责内部机器学习平台训练框架的研究与开发(包括数据预处理/训练/推理),服务于广告、推荐、搜索等场景; 2、负责实时高性能推理系统设计与开发,如算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 3、负责性能优化与架构升级,持续提升数据预处理/训练/推理性能; 4、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。

更新于 2024-04-26北京
logo of bytedance
社招A105196

负责机器学习引擎的设计与开发,包括: 1、负责内部机器学习平台训练框架的研究与开发(包括数据预处理/训练/推理),服务于广告、推荐、搜索等场景; 2、负责实时高性能预估系统设计与开发,如算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 3、负责性能优化与架构升级,持续提升数据预处理/训练/预估性能; 4、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。

更新于 2024-04-26上海
logo of bytedance
社招A181972

AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责火山引擎机器学习训练和推理框架的研发和性能优化,支撑火山引擎机器学习平台和方舟大模型平台的相关需求和架构迭代; 2、负责解决系统高并发、高可靠性、高可扩展性等技术难关; 3、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、任务编排、模型训练、模型推理、模型管理、数据集管理、工作流编排、ML for System等; 4、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、GPU 优化技术的引入落地; 5、研究基于机器学习方法,实现对集群/服务资源使用情况的分析和优化。

更新于 2023-10-23上海