哔哩哔哩大模型平台研发工程师 - 训练方向
社招全职3年以上技术类地点:上海状态:招聘
任职要求
1.计算机科学、软件工程、人工智能或相关专业本科及以上学历,3年以上AI平台相关经验; 2.具备良好编码能力与扎实的算法功底,熟练掌握Python/Go/C++等至少一种主流编程语言,能高效完成模块开发与调试; 3.熟悉至少一种主流深度学习框架(PyTorch优先),了解其核心原理与分布式训练机制; 3.具备扎实的机器学习/深度学习基础,熟悉Transformer等核心算法,了解大模型训练逻辑与行业应用方向。 加分项: 1.参与过大模型训练平台…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.参与B站大模型训练平台建设,配合团队完成训练平台的架构细化与技术落地,参与训练任务调度、数据加载、模型checkpoint管理等核心模块的开发与迭代,保障训练平台基础功能稳定可靠; 2.参与大模型主流训练范式(预训练/后训练)的平台化集成工作,协助完成训练流程的标准化、自动化落地,降低算法团队训练门槛; 3.大模型训练全链路可观测性,参与设计并落地训练过程中的核心监控指标,为训练效率提升与问题定位提供数据支撑; 4.参与训练链路问题排查,配合算法与框架团队,跟踪大模型训练全链路,参与定位并解决训练过程中出现的平台层技术问题,如数据传输瓶颈、分布式训练通信异常等,保障训练任务顺利推进。
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
还有更多 •••
相关职位
社招3年以上机器学习平台
1、负责模型训练平台核心功能开发和架构设计,包括传统CN/NLP/SD/LLM等多场景支持 2、负责大模型后训练工具平台化建设,包括后预训练、微调、对齐等技术落地 3、设计和实现高性能分布式训练系统,打造端到端训练解决方案 4、优化训练调度和资源管理,提升集群利用率和训练效率 5、开发模型训练监控诊断工具,建设可观测性体系
北京|上海|深圳
社招A199302
1、负责火山引擎-方舟大模型平台的研发,研究大模型在千行百业应用落地的系统化解决方案,大幅降低大模型应用的IT成本,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、模型训练、模型推理、数据管理、工作流编排等。
更新于 2023-11-01杭州
社招A96161
1、负责火山引擎-方舟大模型平台的研发,研究大模型在千行百业应用落地的系统化解决方案,大幅降低大模型应用的IT成本,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、模型训练、模型推理、数据管理、工作流编排等。
更新于 2023-11-01北京