字节跳动代码质量大模型算法实习生-质量技术

实习兼职A2535612026-01-14地点：北京状态：招聘

扫码手机上打开

任职要求

1、2027届硕士及以上学位在读，计算机、软件工程、人工智能等相关专业；
2、熟悉NLP、CV、ML等相关的技术，深入理解大模型相关技术栈（如Reward Model、GRPO/PPO/DPO、SFT/RFT、CT、P…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。
团队介绍：字节跳动质量技术团队，我们聚焦质量领域前沿创新，打造稳定、高效、领先的质量技术，深度赋能抖音、今日头条、豆包、电商等亿级用户产品。
当前，我们通过AI来检测代码、架构、产品的缺陷、风险和效果，用AI重构质量保障模式，提升研发效能。聚焦智能缺陷检测、GUI agent、AI评测等前沿方向，希望通过质量技术的突破，用AI改变测试行业。欢迎加入，与我们一起，定义和构建下一代质量技术，推动行业前进。

1、负责大模型技术在软件智能交付领域的相关应用技术研发，业务场景包括但不限于知识图谱、代码生成、智能交互、风险预测挖掘、智能归因、缺陷修复、故障自愈；
2、洞察AIGC等前沿技术领域的最新研究成果，探索工业领域落地可行性，并持续提升算法应用效果；
3、探索大模型技术在研发效能领域中的落地应用，为研发效率提升提供智能服务；
4、深度参与项目研发，与产品和业务团队同学保持密切配合，不断优化项目整体效益，提升用户体验。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

NLP+

还有更多 •••

登录查看完整学习资料

相关职位

代码质量大模型算法实习生-质量技术

实习A196606A

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：字节跳动质量技术团队，我们聚焦质量领域前沿创新，打造稳定、高效、领先的质量技术，深度赋能抖音、今日头条、豆包、电商等亿级用户产品。当前，我们通过AI来检测代码、架构、产品的缺陷、风险和效果，用AI重构质量保障模式，提升研发效能。聚焦智能缺陷检测、GUI agent、AI评测等前沿方向，希望通过质量技术的突破，用AI改变测试行业。欢迎加入，与我们一起，定义和构建下一代质量技术，推动行业前进。 1、负责大模型技术在软件智能交付领域的相关应用技术研发，业务场景包括但不限于知识图谱、代码生成、智能交互、风险预测挖掘、智能归因、缺陷修复、故障自愈； 2、洞察AIGC等前沿技术领域的最新研究成果，探索工业领域落地可行性，并持续提升算法应用效果； 3、探索大模型技术在研发效能领域中的落地应用，为研发效率提升提供智能服务； 4、深度参与项目研发，与产品和业务团队同学保持密切配合，不断优化项目整体效益，提升用户体验。

更新于 2026-01-14上海

低代码编程智能体的自动化质量校验能力研究

校招多模态大模型与应

1、研究电商领域低代码CodingAgent全链路质量校验方法（涵盖代码/测试生成、依赖安装及构建运行），提升智能体产出代码的正确性与可维护性； 2、设计低代码质量评测体系，结合静态分析、端到端测试及LLM-as-a-Judge等手段，构建可复用的自动化校验框架； 3、研发适配智能体平台的校验Harness、任务回放与失败归因能力，实现从需求理解到验证报告的闭环度量与落地； 4、探索基于多Agent协同的代码审查、缺陷定位与自动修复策略，提升智能体在复杂仓库、多语言与多框架场景下的泛化能力； 5、参与课题验证与业务落地，沉淀相关技术文档、专利或高质量学术论文，推动成果在京东研发效能及运营场景中的应用。

更新于 2026-06-16北京

代码大模型算法工程师

校招通义2026届秋

通义千问（Qwen）是由通义实验室自主研发的超大规模语言模型，具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型，涵盖参数量从亿级到万亿级的基座大语言模型，并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成，从逻辑推理到内容创作，从单一多模态到全模态统一理解生成，Qwen正在打造全球领先的全模态模型技术体系，推动AI在企业服务、开发者生态、个人用户等领域的深度应用，引领下一代人工智能的发展。 Coder团队致力于构建能够执行、扩展并自我进化的自主系统，通过构建超智能的coding agent/digital agent，扩展数字世界，为迈向真实世界的智能奠定基础。工作职责： 1. 负责通用模型 Qwen 的代码能力和代码专有模型 Qwen-Coder 的构建。（1）包括但不限于数据收集、预训练、后训练（强化学习）、评测等方向上的探索。（2）通过Large-scale Pre-training 和 Large-scaleRL来提升Code Reasoning能力，在专家级编程竞赛超越人类，并构建 Coding Agent 来解决真实世界软件开发任务； 2. 负责Computer-Use Agent (GUI-Agent）的建设，以最直观的方式—鼠标、键盘、编码等操作来代替人类执行数字世界任务。（1）通过Scaling海量数字世界数据结合大规模合成数据，来提升Computer-Use Agent的Grouding能力。（2）通过Long Horizon的方式进行强化训练，结合可扩展的多模态环境反馈来提升CU Agent的Reasoning的能力。

更新于 2025-08-22北京|杭州|上海

代码场景的Agentic RL与数据合成-阿里星

实习阿里巴巴2027

负责 Agentic Model 的训练方法、能力提升与数据合成体系研究，探索大模型在自主决策、规划与工具调用等方面的强化路径，包括但不限于： 1. 针对Agentic模型的训练特点，探索Agentic数据的合成策略与后训练数据配比策略，探索稳定高效的Agentic RL 方案，持续迭代模型在Agent场景的应用性能； 2. 应用并改进Agentic RL算法，提升模型在代码场景中的成功率和鲁棒性； 3. 将业务突破转化为学术成果，支持在 NeurIPS、ICLR、ICML 等顶会发表高质量论文，或推动相关算法在社区的开源，建立行业影响力。

更新于 2026-05-09北京|杭州