logo of jd

京东大模型算法工程师/研究员

社招全职算法开发岗地点:北京状态:招聘

任职要求


1. 硕士及以上学历,计算机、数学、人工智能及STEM等相关专业;
2. 拥有扎实的计算机科学功底和编程能力,熟悉常见算法数据结构,具有良好的编程习惯;
3. 熟悉语言或多模态模型的基本算法、模型结构及基础技术,相信AGI和对相关工作抱有热情;
4. 工作认真务实,科学规划,具有极致的探究精神且知行合一,具备较强的责任感;
加分项:
1. 有大模型相关的顶会论文的工作者优先;有STEM竞赛经历者优先;
2. 熟悉强化学习算法和框架相关技术和细节,曾深度参与后训练/强化推理大模型/Agent等项目;
3. 具有扎实的工程能力,熟悉开源大模型相关工具使用,有积极提升效果效率的意识。

符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。

工作职责


参与或主导以下一个或多个关键领域的工作:
1. 大语言模型/多模态大模型SFT微调、指令跟随、后训练RLHF精调与偏好对齐;
2. 大语言模型/多模态大模型强化学习Reasoning模型算法、Reward模型、Verifier等算法研发;
3. 大语言模型/多模态强化Reasoning大模型长CoTs效率效果优化与RL Scaling-law研究;
4. 大语言/多模态大模型Agent算法研发;
5. 大语言/多模态大模型强化学习Test-time Compute在线推理算法研发。
包括英文材料
学历+
算法+
数据结构+
编程规范+
大模型+
强化学习+
AI agent+
相关职位

logo of bytedance
社招A82922A

团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责代码预训练数据的合成、清洗、权重分配、来源扩充等一系列工作,持续提高代码预训练、中程训练等阶段的数据质量;负责探究预训练小领域数据的配比和最终效果之间的关系;开发数据合成链路,解决代码模型中的关键问题; 2、负责探究深度推理技术,探究Test-time Compute和模型效果的Scaling laws,参与后训练奖励模型、强化学习算法的一系列优化流程,探究线上代码补全数据到RL过程的数据飞轮; 3、专注于代码强化学习中的奖励模型(Reward Model)的优化和创新;包括和SFT阶段配合解决判别能力较差的场景、探究合成数据进行代码奖励模型的预训练、组织标注人员进行代码奖励模型的标注、Critic的前沿探究、强化学习过程中的可执行代码与单元测试的质量过滤和扩充。

更新于 2024-10-21
logo of bytedance
社招A213132

1、负责自动化软件开发领域中的AI应用,利用前沿算法和工程技术,持续突破各环节能力天花板,维持国际领先水平; 2、与产品研发和标注团队协作,持续建设和应用高质量代码数据,完善业务数据飞轮,保持长期竞争力; 3、前沿算法技术的持续跟踪和创新,包括但不限于代码生成、多智能体系统、强化学习、数据合成等领域。

更新于 2024-11-20
logo of ke
社招0-3年XYZ

各类大模型算法岗位:包括不限于 ✓大模型应用(Rag、Agent的研究等) ✓大模型技术研究 (指令微调、强化学习、推理等) ✓多模态理解与生成研究(文本、图像、视频、音频等)

更新于 2025-02-18
logo of bytedance
社招A128692

团队介绍:BandAI 团队致力于探索智能的极限在交易场景的可能性。团队研究方向涵盖LLM、Multimodal、Agent,在北京、上海设有实验室和岗位。加入我们,你可以享受与正式员工同等的资源,参与到前沿的大语言模型的研究课题,和优秀的研究员一起探索智能极限。探索抖音电商、生活服务的下一代产品和技术,通过技术变革为用户带来前所未有的体验。 课题介绍:探索抖音电商、生活服务、广告的下一代产品和技术,通过技术变革为用户带来前所未有的体验。在你热爱的课题方向上,探索大语言模型领域最具挑战的长期关键问题;探索 Agent 评估的新范式;探索 RL,更多的计算能力=更好的性能表现;探索如何拓展 Reward System 判断边界;研究&复现 Deep Research,Computer Using Agent,Useful Image Generation,Native Multimodality。

更新于 2025-05-27