logo of bytedance

字节跳动公有云机器学习系统工程师-推理方向

社招全职A49714地点:北京状态:招聘

任职要求


1、熟练掌握Linux环境下的Go/Java/Python等1-2种语言;
2、具备扎实的计算机科学功底和编程能力,熟悉常见算法数据结构,具有良好的编程习惯;
3、熟悉至少一种主流的机器学习框架(TensorFlow / PyTorch 或其他自研框架);
4、熟悉 Kubernetes 架构和生态,有丰富的云原生机器学习系统实践和开发经验,对在线服务治理、 部署架构有深入理解和落地经验;
5、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护;
6、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;
7、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动;
8、有良好的工作文档习惯,及…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责机器学习系统推理架构和产品的设计开发,支持火山方舟大模型平台和机器学习平台的产品业务;
2、负责深度模型推理任务为核心的在线架构设计与优化,充分利用各种异构计算(GPU、CPU、其他异构硬件)、存储(各种云存储)、网络(VPC、RDMA)等资源,构建多租环境下的稳定性、观测体系,实现高并发、高吞吐的大规模在线系统;
3、负责推理系统的产品化落地,打造稳定、可观测、体验一流的公有云推理平台。
包括英文材料
Linux+
Go+
Java+
Python+
算法+
数据结构+
编程规范+
还有更多 •••
相关职位

logo of bytedance
社招A11907

1、负责机器学习系统资源调度的设计和开发,支持火山方舟大模型平台和机器学习平台的产品业务; 2、负责多机房、多集群环境下的,各种异构计算(GPU、CPU、其他异构硬件)、存储(各种云存储)、网络(VPC、RDMA)等资源的最优化编排调度,在严格的多租隔离环境下,支持各种离线训练、在线推理等负载场景的调度需求,并实现整体资源的合理化、最大化利用。

更新于 2024-06-28北京
logo of kuaishou
社招3-5年J0011

1、构建领先的全球化混合云异构AI推理集群,负责云端服务架构设计,基于云原生技术构建高可用、可扩展的大规模分布式AI推理系统; 2、选型与优化云中间件(消息队列、缓存、分布式数据库等),解决高并发、低延迟问题; 3、设计基于混合云的生产环境部署策略,保障多环境稳定运行,制定监控、灾备及扩容方案; 4、支持B端业务和C端业务多种商业模式的持续探索和落地,比如公有云部署、专有云部署、模型授权等工作; 5、建设面向全球化业务和混合云异构算力的智能分配和流量优先级调度系统,实现多国家、多租户、多场景下极致优化算力使用效率并提升业务收益。

更新于 2026-04-09北京
logo of bytedance
社招2年以上A252507

1、负责AML-机器学习平台的开发与优化,打造国内领先的聚焦AI开发者体验的机器学习平台; 2、从机器学习系统架构、云原生架构、公有云架构,等多个层面,进行技术探索和攻坚,帮助客户实现高性能、高资源利用率的高性能计算平台。

更新于 2023-09-06北京
logo of bytedance
社招2年以上A247110

1、负责AML-机器学习平台的开发与优化,打造国内领先的聚焦AI开发者体验的机器学习平台; 2、从机器学习系统架构、云原生架构、公有云架构,等多个层面,进行技术探索和攻坚,帮助客户实现高性能、高资源利用率的高性能计算平台。

更新于 2023-11-15北京