logo of zhihu

知乎机器学习平台开发工程师(golang)

社招全职地点:北京状态:招聘

任职要求


1. 熟悉k8sistio,具有线上k8s集群开发运维经验;
2. 熟悉Linux平台下的分布式系统的开发与运维工作;
3. 具有Golang/Python/C++等至少一种高级语言开发经验;
4. 具有Alluxio/Juicefs等分布式存储系统工作经验者优先;
5. 熟悉Kubeflow/Airflow等MLOps、流程编排系统者优先;
6. 具有机器学习平台、模型训练、模型推理工作经验者优先;
7. 熟悉GPU架构,具有GPU集群日常维护工作经验者优先。

工作职责


1. 负责自研机器学习平台的研发,设计和实现机器学习平台相关的基础设施和工具链;
2. 负责机器学习平台的需求落地,关注模型训练、推理过程中的稳定性、资源利用率等问题;
3. 负责GPU集群的运维工作。
包括英文材料
Kubernetes+
Istio+
Linux+
分布式系统+
Go+
Python+
C+++
Kubeflow+
Airflow+
机器学习+
相关职位

logo of bytedance
社招3年以上YW6P

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与设计并实现高可用、可扩展、分布式机器学习平台,支撑字节跳动智能语音相关业务算法生产与高效迭代; 2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与机器学习平台的设计、开发和维护; 3、持续提升平台效率、易用性、降低算法使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台中。

更新于 2021-04-27
logo of bytedance
社招5年以上A79191A

团队介绍:字节跳动产品研发和工程架构端智能团队,负责端智能基建和业务算法落地。团队产品在字节跳动核心应用的推荐、广告、直播、电商、消息、社交等场景中应用。在这里,你可以深入钻研机器学习算法,通过云端协同推荐、横向联邦学习等前沿技术,结合对产品的理解和思考,优化核心应用、核心场景的商业效率;还可以探索 SLM、VLM 等新技术,开拓未来产品方向。 1、负责端智能平台服务端开发,包括架构设计、功能研发、性能优化、技术难题攻关等; 2、构建端智能特征管理和监控平台,满足云端特征的复用、淘汰,更新等需求; 3、追求极致,探索机器学习平台前沿方向,构建业内领先的端智能平台服务。

更新于 2024-06-27
logo of bytedance
社招5年以上A249047

团队介绍:字节跳动产品研发和工程架构端智能团队,负责端智能基建和业务算法落地。团队产品在字节跳动核心应用的推荐、广告、直播、电商、消息、社交等场景中应用。在这里,你可以深入钻研机器学习算法,通过云端协同推荐、横向联邦学习等前沿技术,结合对产品的理解和思考,优化核心应用、核心场景的商业效率;还可以探索 SLM、VLM 等新技术,开拓未来产品方向。 1、负责端智能平台服务端开发,包括架构设计、功能研发、性能优化、技术难题攻关等; 2、构建端智能特征管理和监控平台,满足云端特征的复用、淘汰,更新等需求; 3、追求极致,探索机器学习平台前沿方向,构建业内领先的端智能平台服务。

更新于 2024-06-27
logo of 4paradigm
社招5年以上技术类

1. 参与大规模机器学习平台的研发和维护2. 参与模型训练,模型服务,样本管理,资源调度等机器学习相关问题的开发3. 能深入理解产品和业务,解决产品需求和推荐算法工程化的问题,支撑业务快速发展

更新于 2025-01-06