logo of mi

小米GUI Agent 强化学习环境研发实习生

实习兼职地点:北京状态:招聘

任职要求


任职要求:
1. 本科或硕士在读,计算机/自动化/电子相关专业。
2. 掌握 Python 基础,能阅读与修改现有脚本。
3. 了解基本深度学习强化学习概念(如状态、动作、奖励)。
4. 具备移动端或 Web 自动化兴趣,愿意学习 ADB/Appium 等工具。
5. 具备快速排查问题与自我驱动学习…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


岗位职责:
1. 协助搭建大模型与真机/手机模拟器交互环境(屏幕采集、UI树解析、事件注入)。
2. 协助封装强化学习环境(状态/动作空间定义、奖励信号采集、数据缓存)。
3. 支持多设备并发调试与脚本维护(ADB、模拟器远程调试)。
4. 协助风险与风控用例验证(权限弹窗处理、敏感操作拦截、异常日志分类)。
5. 编写与完善自动化测试脚本与基础评估指标(成功率、时延、稳定性)。
6. 整理交互数据与标注(截图、操作序列、UI结构、异常样本)。
7. 对接模型推理接口,进行调用与基本性能记录。
8. 输出技术笔记、使用文档与问题复盘。
包括英文材料
Python+
脚本+
深度学习+
强化学习+
还有更多 •••
相关职位

logo of tongyi
实习通义研究型实习生

1. 探索研究多模态大模型、GUI agent、AI memory、多模态RAG等前沿技术。 2. 参与研发多模态、全模态大模型等下一代人工智能核心技术,探索面向真实环境的多模态智能体多轮强化学习,提升大模型能力。 3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。

更新于 2025-11-12杭州
logo of tongyi
实习通义研究型实习生

1. 探索研究多模态大模型、GUI agent、AI memory、多模态RAG等前沿技术。 2. 参与研发多模态、全模态大模型等下一代人工智能核心技术,探索面向真实环境的多模态智能体多轮强化学习,提升大模型能力。 3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。

更新于 2025-11-12北京
logo of bytedance
实习A171437

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索应用多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent、应用; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2023-03-29上海
logo of bytedance
实习Z3823A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索应用多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent、应用; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2023-04-19北京