小米GUI Agent 强化学习环境研发实习生

实习兼职2025-10-28地点：北京状态：招聘

扫码手机上打开

任职要求

任职要求：
1. 本科或硕士在读，计算机/自动化/电子相关专业。
2. 掌握 Python 基础，能阅读与修改现有脚本。
3. 了解基本深度学习或强化学习概念（如状态、动作、奖励）。
4. 具备移动端或 Web 自动化兴趣，愿意学习 ADB/Appium 等工具。
5. 具备快速排查问题与自我驱动学习…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

岗位职责：
1. 协助搭建大模型与真机/手机模拟器交互环境（屏幕采集、UI树解析、事件注入）。
2. 协助封装强化学习环境（状态/动作空间定义、奖励信号采集、数据缓存）。
3. 支持多设备并发调试与脚本维护（ADB、模拟器远程调试）。
4. 协助风险与风控用例验证（权限弹窗处理、敏感操作拦截、异常日志分类）。
5. 编写与完善自动化测试脚本与基础评估指标（成功率、时延、稳定性）。
6. 整理交互数据与标注（截图、操作序列、UI结构、异常样本）。
7. 对接模型推理接口，进行调用与基本性能记录。
8. 输出技术笔记、使用文档与问题复盘。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Python+

脚本+

深度学习+

强化学习+

还有更多 •••

登录查看完整学习资料

相关职位

研究型实习生 - 面向多领域任务泛化的GUI Agent多轮强化学习方法研究

实习通义研究型实习生

1. 探索研究多模态大模型、GUI agent、AI memory、多模态RAG等前沿技术。 2. 参与研发多模态、全模态大模型等下一代人工智能核心技术，探索面向真实环境的多模态智能体多轮强化学习，提升大模型能力。 3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。

更新于 2025-11-12杭州

研究型实习生 - 自我进化的多模态智能体方法研究

实习通义研究型实习生

更新于 2025-11-12北京

多模态世界模型算法实习生-Seed

实习A171437

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索应用多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术； 2、探索大规模/超大规模多模态理解与生成交织的基础模型，并进行极致系统优化；数据建设、指令微调、偏好对齐、模型优化；提升数据合成、Scalable Oversight、模型推理、规划能力，构建全面客观准确的评测体系，探索提升大模型能力； 3、探索突破包括而不限于多模态RAG，视觉COT与Agent等在内的多模态模型、世界模型进阶能力，构建GUI/游戏等虚拟世界的通用多模态Agent、应用； 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模，提供多模态交互探索的基本能力，推动应用落地，研发以人工智能技术为核心的新技术、新产品。

更新于 2023-03-29上海

多模态世界模型算法实习生-Seed

实习Z3823A

ByteIntern：面向2026届毕业生（2025年9月-2026年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索应用多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术； 2、探索大规模/超大规模多模态理解与生成交织的基础模型，并进行极致系统优化；数据建设、指令微调、偏好对齐、模型优化；提升数据合成、Scalable Oversight、模型推理、规划能力，构建全面客观准确的评测体系，探索提升大模型能力； 3、探索突破包括而不限于多模态RAG，视觉COT与Agent等在内的多模态模型、世界模型进阶能力，构建GUI/游戏等虚拟世界的通用多模态Agent、应用； 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模，提供多模态交互探索的基本能力，推动应用落地，研发以人工智能技术为核心的新技术、新产品。

更新于 2023-04-19北京