哔哩哔哩【B-UP】大语言模型（LLM）算法工程师（实习）

实习兼职技术类2026-06-22地点：上海状态：招聘

扫码手机上打开

任职要求

我们希望你：
1. 深度学习基础扎实，熟悉当前主流LLM架构
2. 熟悉常见大模型训练框架(Megatron/DeepSpeed/Verl)
3. 有LLM相关项目经验：CPT、SFT、RL 任意方向即可
4. 有阅读论文与复现能力，能快速上手实…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.参与大规模MoE模型的持续预训练（CPT）：数据清洗与混合策略、训练调优与结果分析
2.参与RLVR/RLAIF强化学习训练流程：数据构建、reward shaping、训练调优
3.参与多语种机器翻译(MT)方向：语料处理、模型微调、评测
4.参与Long horizon agentic RL（长程智能体强化学习）方向：搭建复杂交互环境与任务流、多步骤推理轨迹（Trajectory）收集、Reward设计与策略网络优化
5.编写实验脚本、构建评测工具，支持模型上线前的质量验证

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

深度学习+

大模型+

Megatron+

还有更多 •••

登录查看完整学习资料