logo of weride

文远知行深度学习平台开发工程师

社招全职地点:广州状态:招聘

任职要求


计算机及相关专业
熟悉 Python/Golang/C++/C 任一开发语言,并有关相关的项目经验
参与过社区开源项目,如 kubernetes/kubeflow/horovod 等加分
了解通用 GP…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


工作地点:[上海/广州]

寻找对计算机底层系统以及 AI Infra 相关技术充满热情的同学

职位概述:
负责 GPU 训练集群的资源管理与调度,保证 GPU 资源的高效使用
提升分布式训练任务的稳定性,包括开发鲁棒的训练框架以及方便易用的可视化工具等
提升分布式训练任务的训练效率,系统性地解决 IO/通信/运算等方向的性能问题
负责对接训练平台在自动驾驶数据流中的上下游,具体包括提升数据预处理的效率,提供用户友好的模型管理工具等
包括英文材料
Python+
Go+
C+++
C+
还有更多 •••
相关职位

logo of weride
校招其他

工作地点:[上海/广州] 寻找对计算机底层系统以及 AI Infra 相关技术充满热情的同学 职位概述: 负责 GPU 训练集群的资源管理与调度,保证 GPU 资源的高效使用提升分布式训练任务的稳定性,包括开发鲁棒的训练框架以及方便易用的可视化工具等提升分布式训练任务的训练效率,系统性地解决 IO/通信/运算等方向的性能问题负责对接训练平台在自动驾驶数据流中的上下游,具体包括提升数据预处理的效率,提供用户友好的模型管理工具等

更新于 2025-06-19广州|上海
logo of bilibili
实习技术类

负责B站机器学习平台相关的架构设计和研发工作,服务于B站个性化视频推荐、搜索相关核心业务场景。 1.负责大规模分布式训练、推理框架、模型平台的系统设计和实现 2.负责机器学习相关平台能力、服务调度、业务组件的功能设计&开发工作 3.深入业务流程,制定应用机器学习/深度学习技术的系统优化方案 4.参与前瞻性技术的研究,研究并应用前沿技术 。

更新于 2025-03-04上海
logo of bytedance
社招3年以上YW6P

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与设计并实现高可用、可扩展、分布式机器学习平台,支撑字节跳动智能语音相关业务算法生产与高效迭代; 2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与机器学习平台的设计、开发和维护; 3、持续提升平台效率、易用性、降低算法使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台中。

更新于 2021-04-27北京
logo of tencent
社招TEG技术

1.负责腾讯混元机器学习平台的设计与开发,包括:性能优化,持续提升训练性能,包括多机多卡大规模训练优化,数据交换优化等; 2.深入理解跟踪业界AIGC动态,优化平台技术方案,提升平台易用性,降低大模型研发门槛,不断推进平台的LLMOps能力升级; 3.积极追踪业内AI动态,优化内部技术方案,改进产品性能,不断推进AI架构升级。

更新于 2025-05-18深圳