logo of bytedance

字节跳动火山引擎-机器学习平台研发工程师

社招全职3年以上A162146地点:杭州状态:招聘

任职要求


1、熟悉Linux平台下的分布式系统的开发及运维,三年及以上Golang/Python/C/C++/Java/Scala的开发经验,ACM/ICPC/Codeforces等获奖者优先;
2、能够从产品思维、机器性能和稳定性、团队协作等多种视角,高标准要求自己的技术方案和每一行代码;
3、对如下一个或多个领域有经验,或者无经验但有浓厚的兴趣(须额外付出时间进行深入研究和探索):
a. 云原生:Kubernetes(调度器/CSI)、容器系统、大规模训练任务和推理服务的编排、在离线混部及资源调度、微服务网格和流量治理、Terraform等;
b. 云计算:云存储、网络虚拟化、云安全、混合云、技术商品化探索等;
c. 机器学习Pytorch/Tensorflow/JAX/PaddlePaddle/Mindspore等机器学习框架、GPU/NPU/ARM等最新异构计算系统与架构、RDMA高性能网络。

工作职责


1、负责火山引擎-机器学习平台的研发,聚焦AI算法工程师的体验,从机器学习系统、云原生、云计算架构等多个层面进行技术探索和攻坚,帮助客户实现高性能、高资源利用率的高性能计算平台;
2、设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中;
3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。
包括英文材料
Linux+
分布式系统+
Go+
Python+
C+
C+++
Java+
Scala+
Kubernetes+
微服务+
Terraform+
机器学习+
PyTorch+
TensorFlow+
PaddlePaddle+
相关职位

logo of bytedance
社招3年以上A157282

1、负责火山引擎-机器学习平台的研发,聚焦AI算法工程师的体验,从机器学习系统、云原生、云计算架构等多个层面进行技术探索和攻坚,帮助客户实现高性能、高资源利用率的高性能计算平台; 2、设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。

更新于 2023-10-23
logo of bytedance
社招3年以上A89432

1、负责火山引擎-机器学习平台的研发,聚焦AI算法工程师的体验,从机器学习系统、云原生、云计算架构等多个层面进行技术探索和攻坚,帮助客户实现高性能、高资源利用率的高性能计算平台; 2、设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。

更新于 2023-10-23
logo of bytedance
社招A105196

负责机器学习引擎的设计与开发,包括: 1、负责内部机器学习平台训练框架的研究与开发(包括数据预处理/训练/推理),服务于广告、推荐、搜索等场景; 2、负责实时高性能预估系统设计与开发,如算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 3、负责性能优化与架构升级,持续提升数据预处理/训练/预估性能; 4、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。

更新于 2024-04-26
logo of bytedance
校招A252493

团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、参与国内万卡级别机器学习平台基础功能研发,参与调度、存储、网络模块的迭代升级,攻克各种高并发、数据隔离、系统解耦等方面的技术难关; 2、参与开发易用、弹性、稳定的算力云产品开发。

更新于 2025-08-06