贝壳算法工程师/研究员(J65868)
任职要求
整体要求: ✓工作0-3年,年轻高潜 ✓985,211有亮点,或者QS100,硕士,博士优先 ✓软性素质:对AI有热情,心态open,接受AI可能带来的各种改变并且不断尝试探索 ✓重要:自主解决问题的能力,拆解问题的能力 目标人才: ✓企业:字节豆包、阿里通义、腾讯混元、deepseek、kimi、百度、智谱大模型基座团队或者大模型应用团队的同学 ✓学术:北京通用人工智能实验室、智源研究院、上海人工智能实验室、清华、北大、人大、北航、上交、复旦等实验室的研究员或者top实验室的硕士博士 ✓竞赛:大赛获奖优先 ✓创业经验:在AI创业组织担任项目owner,或者在上述目标企业或者学术单位有项目owner经验优先
工作职责
各类大模型算法岗位:包括不限于 ✓大模型应用(Rag、Agent的研究等) ✓大模型技术研究 (指令微调、强化学习、推理等) ✓多模态理解与生成研究(文本、图像、视频、音频等)
参与或主导以下一个或多个关键领域的工作: 1. 大语言模型/多模态大模型SFT微调、指令跟随、后训练RLHF精调与偏好对齐; 2. 大语言模型/多模态大模型强化学习Reasoning模型算法、Reward模型、Verifier等算法研发; 3. 大语言模型/多模态强化Reasoning大模型长CoTs效率效果优化与RL Scaling-law研究; 4. 大语言/多模态大模型Agent算法研发; 5. 大语言/多模态大模型强化学习Test-time Compute在线推理算法研发。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责代码预训练数据的合成、清洗、权重分配、来源扩充等一系列工作,持续提高代码预训练、中程训练等阶段的数据质量;负责探究预训练小领域数据的配比和最终效果之间的关系;开发数据合成链路,解决代码模型中的关键问题; 2、负责探究深度推理技术,探究Test-time Compute和模型效果的Scaling laws,参与后训练奖励模型、强化学习算法的一系列优化流程,探究线上代码补全数据到RL过程的数据飞轮; 3、专注于代码强化学习中的奖励模型(Reward Model)的优化和创新;包括和SFT阶段配合解决判别能力较差的场景、探究合成数据进行代码奖励模型的预训练、组织标注人员进行代码奖励模型的标注、Critic的前沿探究、强化学习过程中的可执行代码与单元测试的质量过滤和扩充。
1、负责自动化软件开发领域中的AI应用,利用前沿算法和工程技术,持续突破各环节能力天花板,维持国际领先水平; 2、与产品研发和标注团队协作,持续建设和应用高质量代码数据,完善业务数据飞轮,保持长期竞争力; 3、前沿算法技术的持续跟踪和创新,包括但不限于代码生成、多智能体系统、强化学习、数据合成等领域。