字节跳动大语言模型算法研究工程师（模型架构优化方向）-Seed

社招全职A1294172025-04-01地点：北京状态：招聘

扫码手机上打开

任职要求

1、扎实的代码能力与算法基础，熟练掌握Python/C++；IOI、NOI、ACM/ICPC、Kaggle、NeurIPS等竞赛获奖经历者优先；
2、熟悉大模型训练与优化技术，有模型参数调优经验或CUDA/Tr…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。
Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。

1、设计高效且可靠的模型架构优化方案，确保模型在不同规模下的稳定Scaling；
2、探索超大规模模型性能边界，通过混合精度分布式训练，量化部署等方式优化训练和推理过程；
3、研究下一代模型架构，拓展模型在长文本，推理，科学计算、多模态和具身智能等领域的应用场景。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

Python+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

【北斗】大模型算法工程师（服务零售）

校招核心本地商业-业

以大模型对话技术为核心，探索前沿技术问题，研究方向主要为垂域模型的研究与构建。目标是为用户提供专属的玩乐变美便捷生活小助手，实现“技术驱动业务范式”的升级转变，最终助力商业价值全面提升。研究方向一：Agent能力增强基于Agent的用户助理，研究提升Agent自主规划能力，并通过Agent构建和基于后训练的优化，实现数字助理的能力复刻和增强。研究方向二：强化学习算法研究参与大语言模型后训练阶段的强化学习算法研究，包括基于AI和环境反馈的强化学习（RLXF）算法。同时探索奖励模型与反馈机制，研究可泛化的细粒度过程监督和奖励建模，探索基于细粒度反馈的强化学习算法。研究方向三：垂域模型定制化构建领域认知智能突破，探索小样本场景自演进架构设计、可信推理机制构建等方向，同时建立面向AGI的模型评价体系新范式。研究方向四：精准上下文理解与长程依赖建模研究如何高效、准确地捕获和利用复杂的项目级上下文信息（如整个代码库、依赖关系、API文档、Issue跟踪等），探索能够处理超长代码序列、理解跨文件依赖和项目架构的先进模型结构与表征方法，以支持更精准、更全局的代码智能，从而提升业务研发在存量代码中迭代的效率。

更新于 2025-05-23北京|上海

【北斗】大模型算法研究员（RL/推理/RAG/多模态技术）

校招核心本地商业-业

研究方向一：垂域LLM研究与构建 1.基座模型架构设计与优化：参与大语言模型基座架构的设计，研究前沿技术，如稀疏激活、混合精度训练等，同时优化模型的训练和推理流程。 2.技术创新与突破：参与前沿技术研究，如多任务学习、跨模态理解等，推动模型在复杂任务上的性能提升；探索Transformer替代架构，突破现有模型scaling law限制；同时挑战学术benchmark，为模型的性能树立新的行业标杆。 3.强化学习算法研究：参与大语言模型后训练阶段的强化学习算法研究，包括基于AI和环境反馈的强化学习（RLXF）算法。同时探索奖励模型与反馈机制，研究可泛化的细粒度过程监督和奖励建模，探索基于细粒度反馈的强化学习算法。 4.垂域模型定制化构建：领域认知智能突破，探索小样本场景自演进架构设计、可信推理机制构建等方向，同时建立面向AGI的模型评价体系新范式。 5.跨部门协作与落地：与公司数据科学家、算法工程师、产品团队紧密合作，将研究成果快速转化为实际应用，推动大语言模型在更多场景的落地。研究方向二：垂域MLLM研究与构建 1.研究多模态表征与大语言模型融合的前沿技术，设计和实现创新算法，研究异质数据的统一编解码模型，适配多种模态下的特征统一，实现高效微调与优化。 2.探索强化学习（RL）在多模态大模型中的应用，包括强化学习增强的多模态生成、跨模态对齐、偏好建模及自适应优化，提升多模态理解与推理能力。 3.持续追踪多模态与强化学习结合的最新研究进展，优化现有多模态系统架构，提升性能、效率与可扩展性，推动多模态强化学习在智能体交互、决策推理等任务中的应用。 4.构建技术评估体系，通过多场景验证推动多模态理解、生成及强化学习优化策略的落地应用，提升多模态大模型的泛化能力和实际应用价值。研究方向三：基于角色扮演的虚拟数字助理 1. 角色扮演技术（Role-Playing）：通过模型优化、Agent构建，在人设、拟人性、情感等取得显著提升。 2. 记忆管理与增强（Memory）：通过模型长上下文，记忆抽取与管理，提升系统的记忆能力。 3. 个性化技术：通过用户行为数据挖掘与建模，结合多轮对话上下文理解，分析用户情感状态，提升模型的个性化回复能力。 4. 基于Agent的数字助理：通过Agent构建和基于RL的优化，实现数字助理的能力复刻和增强

更新于 2025-05-23北京

搜索算法工程师/大模型应用算法工程师

社招核心本地商业-业

1.负责美团搜索查询理解、召回、排序各阶段的算法模型优化，提升搜索效果。 2.负责美团搜索前沿技术探索，包括大模型技术在搜索场景的落地应用。

更新于 2025-04-03北京

大语言模型AI搜索Agent算法工程师-Seed

社招A102569

1、深入探索LLM在搜索场景中的推理能力与深度研究（Deep Research）模式，优化信息整合与总结效果，打造高效、精准的智能搜索产品，推动AI技术在实际应用中的突破； 2、AI搜索总结Agent研发： 1）设计并实现基于LLM的搜索总结Agent，提升搜索结果的理解、推理与结构化总结能力； 2）探索LLM Reasoning技术（如思维链、多步推理），优化复杂查询的Deep Research模式，实现长文本理解与跨文档信息融合； 3）构建端到端系统，涵盖意图识别、知识检索、结果生成与偏好对齐，提升用户体验； 3、模型优化及应用： 1）通过指令微调（Instruction Tuning）、偏好对齐（RLHF/DPO）等技术优化模型在搜索场景的适应性； 2）探索多模态信息（文本、代码、结构化数据）融合的搜索与生成技术； 3）研究未来生活中的创新应用场景（如个性化知识助手、自动化研究工具），探索技术边界。

更新于 2025-03-11北京