
文远知行深度学习平台开发工程师
任职要求
计算机及相关专业 熟悉 Python/Golang/C++/C 任一开发语言,并有关相关的项目经验 参与过社区开源项目,如 kubernetes/kubeflow/horovod 等加分 了解通用 GP…
工作职责
工作地点:[上海/广州] 寻找对计算机底层系统以及 AI Infra 相关技术充满热情的同学 职位概述: 负责 GPU 训练集群的资源管理与调度,保证 GPU 资源的高效使用 提升分布式训练任务的稳定性,包括开发鲁棒的训练框架以及方便易用的可视化工具等 提升分布式训练任务的训练效率,系统性地解决 IO/通信/运算等方向的性能问题 负责对接训练平台在自动驾驶数据流中的上下游,具体包括提升数据预处理的效率,提供用户友好的模型管理工具等

工作地点:[上海/广州] 寻找对计算机底层系统以及 AI Infra 相关技术充满热情的同学 职位概述: 负责 GPU 训练集群的资源管理与调度,保证 GPU 资源的高效使用提升分布式训练任务的稳定性,包括开发鲁棒的训练框架以及方便易用的可视化工具等提升分布式训练任务的训练效率,系统性地解决 IO/通信/运算等方向的性能问题负责对接训练平台在自动驾驶数据流中的上下游,具体包括提升数据预处理的效率,提供用户友好的模型管理工具等
负责B站机器学习平台相关的架构设计和研发工作,服务于B站个性化视频推荐、搜索相关核心业务场景。 1.负责大规模分布式训练、推理框架、模型平台的系统设计和实现 2.负责机器学习相关平台能力、服务调度、业务组件的功能设计&开发工作 3.深入业务流程,制定应用机器学习/深度学习技术的系统优化方案 4.参与前瞻性技术的研究,研究并应用前沿技术 。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与设计并实现高可用、可扩展、分布式机器学习平台,支撑字节跳动智能语音相关业务算法生产与高效迭代; 2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与机器学习平台的设计、开发和维护; 3、持续提升平台效率、易用性、降低算法使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台中。