logo of bilibili

哔哩哔哩【B-UP】大语言模型(LLM)算法工程师(实习)

实习兼职技术类地点:上海状态:招聘

任职要求


我们希望你:
1. 深度学习基础扎实,熟悉当前主流LLM架构
2. 熟悉常见大模型训练框架(Megatron/DeepSpeed/Verl)
3. 有LLM相关项目经验:CPT、SFT、RL 任意方向即可
4. 有阅读论文与复现能力,能快速上手实…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与大规模MoE模型的持续预训练(CPT):数据清洗与混合策略、训练调优与结果分析
2.参与RLVR/RLAIF强化学习训练流程:数据构建、reward shaping、训练调优
3.参与多语种机器翻译(MT)方向:语料处理、模型微调、评测
4.参与Long horizon agentic RL(长程智能体强化学习)方向:搭建复杂交互环境与任务流、多步骤推理轨迹(Trajectory)收集、Reward设计与策略网络优化
5.编写实验脚本、构建评测工具,支持模型上线前的质量验证
包括英文材料
深度学习+
大模型+
Megatron+
还有更多 •••