知乎机器学习平台开发工程师(golang)
任职要求
1. 熟悉k8s,istio,具有线上k8s集群开发运维经验; 2. 熟悉Linux平台下的分布式系统的开发与运维工作; 3. 具有Golang/Python/C++等至少一种高级语言开发经验; 4. 具有Alluxio/Juicefs等分布式存储系统工作经验者优先; 5. 熟悉Kubeflow/Airflow等MLOps、流程编排系统者优先; 6. 具有机器学习平台、模型训练、模型推理工作经验者优先; 7. 熟悉GPU架构,具有GPU集群日常维护工作经验者优先。
工作职责
1. 负责自研机器学习平台的研发,设计和实现机器学习平台相关的基础设施和工具链; 2. 负责机器学习平台的需求落地,关注模型训练、推理过程中的稳定性、资源利用率等问题; 3. 负责GPU集群的运维工作。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与设计并实现高可用、可扩展、分布式机器学习平台,支撑字节跳动智能语音相关业务算法生产与高效迭代; 2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与机器学习平台的设计、开发和维护; 3、持续提升平台效率、易用性、降低算法使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台中。
团队介绍:字节跳动产品研发和工程架构端智能团队,负责端智能基建和业务算法落地。团队产品在字节跳动核心应用的推荐、广告、直播、电商、消息、社交等场景中应用。在这里,你可以深入钻研机器学习算法,通过云端协同推荐、横向联邦学习等前沿技术,结合对产品的理解和思考,优化核心应用、核心场景的商业效率;还可以探索 SLM、VLM 等新技术,开拓未来产品方向。 1、负责端智能平台服务端开发,包括架构设计、功能研发、性能优化、技术难题攻关等; 2、构建端智能特征管理和监控平台,满足云端特征的复用、淘汰,更新等需求; 3、追求极致,探索机器学习平台前沿方向,构建业内领先的端智能平台服务。
团队介绍:字节跳动产品研发和工程架构端智能团队,负责端智能基建和业务算法落地。团队产品在字节跳动核心应用的推荐、广告、直播、电商、消息、社交等场景中应用。在这里,你可以深入钻研机器学习算法,通过云端协同推荐、横向联邦学习等前沿技术,结合对产品的理解和思考,优化核心应用、核心场景的商业效率;还可以探索 SLM、VLM 等新技术,开拓未来产品方向。 1、负责端智能平台服务端开发,包括架构设计、功能研发、性能优化、技术难题攻关等; 2、构建端智能特征管理和监控平台,满足云端特征的复用、淘汰,更新等需求; 3、追求极致,探索机器学习平台前沿方向,构建业内领先的端智能平台服务。