哔哩哔哩【B-UP】大语言模型(LLM)算法工程师(实习)
实习兼职技术类地点:上海状态:招聘
任职要求
我们希望你: 1. 深度学习基础扎实,熟悉当前主流LLM架构 2. 熟悉常见大模型训练框架(Megatron/DeepSpeed/Verl) 3. 有LLM相关项目经验:CPT、SFT、RL 任意方向即可 4. 有阅读论文与复现能力,能快速上手实…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.参与大规模MoE模型的持续预训练(CPT):数据清洗与混合策略、训练调优与结果分析 2.参与RLVR/RLAIF强化学习训练流程:数据构建、reward shaping、训练调优 3.参与多语种机器翻译(MT)方向:语料处理、模型微调、评测 4.参与Long horizon agentic RL(长程智能体强化学习)方向:搭建复杂交互环境与任务流、多步骤推理轨迹(Trajectory)收集、Reward设计与策略网络优化 5.编写实验脚本、构建评测工具,支持模型上线前的质量验证
包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
还有更多 •••