哔哩哔哩算法实习生(基础模型)【2027届】
实习兼职技术类地点:上海状态:招聘
任职要求
我们希望你: 1. 深度学习基础扎实,熟悉Transformer原理,熟悉当前主流LLM架构 2. 熟悉常见大模型训练框架(Megatron/DeepSpeed/Verl) 3. 有LLM相关项目经验:CPT、SFT、RL 任意方向即可 4. 有阅读论文与复现能力,能快速…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.参与大规模MoE模型的持续预训练(CPT):数据清洗与混合策略、训练调优与结果分析 2.参与RLVR/RLAIF强化学习训练流程:数据构建、reward 分析、训练调优 3.参与多语种机器翻译(MT)方向:语料处理、模型微调、评测 4.参与生成式推荐基础模型方向:构建用户行为与内容特征序列数据、生成式任务设计与模型微调(SFT/RFT)、离线评测与线上效果分析 5.参与Agentic RL(智能体强化学习)方向:搭建复杂交互环境与任务流、多步骤推理轨迹(Trajectory)收集、Reward设计与策略网络优化 6.编写实验脚本、构建评测工具,支持模型上线前的质量验证
包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
还有更多 •••
相关职位
实习技术类
1.探索视频多模态大模型的前沿技术,负责数据建设、模型训练与评测框架搭建。 2.深入研究并实践视频多模态大模型的全套训练流程,包括pretraining、mid-training、SFT、RL、on-policy distillation等。 3.跟踪并复现主流的开源视频多模态模型,进行前沿论文的调研、复现与创新。 4.协助优化视频内容理解、dense video caption、视频生成/编辑中的用户意图理解等相关任务上的模型效果,持续提高算法的性能与效率。
更新于 2026-05-13上海
实习淘天集团日常实习
我们正在寻找对AI视觉生成怀有极致热情的你,成为我们AIGC团队的新晋创想家! 在这里,你将深入前沿,亲手参与工作流的搭建与算法模型的迭代。你的任务是:追踪行业浪潮,洞察用户心声,将天马行空的创意注入AI的灵魂。你将与优秀的伙伴们并肩作战,通过工作流实验,构建数据和效果评测,共同见证并亲手打造颠覆性的产品。 这不只是一份实习,更是一次接触AIGC核心技术实践,提升艺术和技术结合能力的宝贵机会。
更新于 2025-10-31杭州
实习淘天集团日常实习
加入我们,你会和一群年轻小伙伴共同为用户创造更智能的电商购物体验,将成为新一代前沿AIGC科技在电商行业创新探索的参与者及践行者。 工作内容: 1、矩阵运营:理解产品能力及用户场景,并负责各平台官方矩阵号内容策略的输出,打造爆款内容并扩大品牌声量。 2、体系梳理:结合对穿搭等特定场景理解,梳理专业标签知识体系及案例,帮助AI大模型算法持续迭代; 3、活动运营:设计运营活动并活跃群氛围,及时答疑,提升用户留存; 4、产品宣发:配合产品迭代、市场宣发,更新产品对外宣发资料; 5、用户反馈:各渠道获取用户反馈以推动问题修复,并思考如何系统化运营,提升用户对产品忠诚度。
更新于 2025-11-10杭州