logo of ke

贝壳python开发工程师(GUI工程方向)(J67024)

社招全职3年以上质量架构部地点:北京状态:招聘

任职要求


1、计算机、通信等专业本科以上学历,3年以上工作经验
2、基本功扎实、编码习惯优秀,熟练掌握Python开发语言,深入了解语言特性,数据结构算法,体系结构等计科知识出色;
3、熟悉Web前后台开发技术栈,有大模型/agent/知识库等工程化应用经验;

加分项:
1.基于多模态大模型的上层应用开发,了解RAG工…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与基于多模态大模型的GUI智能化能力的设计开发,实现多端(web/安卓/ios/鸿蒙/小程序)大模型手眼配套能力全覆盖;
2.跟踪业界前沿技术发展,参与大模型应用评测、企业内部场景化落地、GUI智能体建设等;
包括英文材料
学历+
Python+
数据结构+
算法+
Web+
还有更多 •••
相关职位

logo of kuaishou
社招3-5年J0012

1、参与快手大流量大型活动场景下会场研发,包括但不限于复杂动效实现、基于 WebGL 的互动游戏开发等; 2、参与大型活动的横向 AI 基建建设,包括但不限于性能/稳定性智能分析、动效AI生产、基于 GUI Agent 的 AI 测试/巡检等; 3、参与 AI 场景下的新渠道探索,包括但不限于 AIGC 生产、GEO 优化等; 4、参与复杂业务场景下架构升级,包括但不限于基于低码协议的端到端架构升级、统一物料生产消费平台等。

更新于 2026-03-30北京
logo of bytedance
社招T9813

招聘介绍:通过GUI,VUI等多种交互形态连接用户与服务,让人工智能在抖音、西瓜视频、今日头条、教育、办公等多个产品上实现智能价值,提升用户体验,实现商业价值。在这里你有机会同全球顶尖的AI科学家合作,接触最前沿的技术,并为服务于全球数亿人的人工智能产品提供质量保障。 1、负责语音/图像产品前端及服务端项目交付的质量把控; 2、负责语音/图像算法迭代质量体系的建设,及算法效果评测及算法竞对的评测; 3、负责语音/图像模型、推理引擎、服务测试框架的搭建; 4、负责测试场景和测试用例的设计,测试工具的设计、开发和标准化输出。

更新于 2023-09-22北京
logo of alibaba
社招2年以上

关于我们 我们致力于打造具备“感知-理解-规划-行动”闭环能力的下一代多模态 AI Agent:团队聚焦 GUI Agent(图形用户界面智能体) 与 多模态交互能力 的前沿探索,让 Agent 不仅能“看懂”屏幕、理解用户意图,还能自主操作界面、完成任务,真正实现从“问答助手”到“执行代理”的跃迁。我们相信,多模态感知与 GUI 操作能力是 Agent 走向通用智能的关键一步。期待你加入,共同将“看得见、做得对”的智能体能力转化为业务核心竞争力。 你将获得什么 ● 在真实的业务场景中探索GUI Agent的价值:在淘宝、千牛等页面复杂、流量巨大的电商APP中,规模化的落地GUI Agent,自动完成消费者、商家、公司内部产研同学的任务。也可以让GUI Agent成为其他各种业务Agent的工具,让各种Agent具备视觉感知和GUI操作能力。 ● 充分探索多模态大模型理解与规划能力的极限:让大模型理解电商垂域场景异常复杂的任务指令、UI界面,使用包括但不限于自动化轨迹数据生成、模型训练、多模态记忆系统、multi-agent架构设计等多种手段,构建最懂电商域的GUI Agent ● 充分的业务场景真实数据与计算资源:团队训练资源充足,能在不同架构/不同规模模型上完成微调、对齐与能力专项提升,并形成可复用的训练范式,充分利用各种开源/闭源模型的能力。 ● 个人技术成长:支持多元化方向发展,鼓励对外分享与论文/专利沉淀。 岗位职责 1.主导基于大模型的AI Agent全生命周期研发,重点聚焦多模态Agent建设,包括但不限于GUI Agent/图文理解Agent/图文评估Agent,构建具备视觉感知和推理能力的多模态Agent应用; 2.运用SFT、RL等Post-training训练方法,探索多模态与RL的结合,提升大模型/多模态大模型在自主规划(Planning)、多步推理、多模态RAG、工具调用、UI界面理解、复杂图文理解、局部细节感知等方面的能力; 3.跟踪LLM、VLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破任务规划与复杂推理、研发测试自动化、computer use、大规模商品图文分析、图文细节理解与评估等方向的应用创新; 4.持续优化多模态能力与已有Agent架构的集成,快速构建具备多模态能力的Agent应用,提升Agent系统性能与效率,提供AI Agent技术方案。

更新于 2026-01-28杭州
logo of mi
实习

职位职责 1. 参与 AI Native 软件工程体系建设,探索大模型、Agent、多模态等技术在软件测试中的落地应用; 2. 研究并构建 GUI Agent / Mobile Agent 等智能体能力,提升 AI 对软件系统的理解、规划、执行与交互能力; 3. 参与 AI 驱动的软件验证与质量评估体系建设,包括任务规划、自动执行、结果分析与反馈闭环; 4. 探索 AI 在复杂长链路场景中的自主决策、稳定执行、自反馈与持续优化机制; 5. 参与多模态软件理解相关能力建设,包括 UI Understanding、Screen Grounding、视觉交互等方向; 6. 推动 Agent、LLM、多模态等技术在移动端、自动化验证、探索式交互等真实业务场景中的工程化落地; 7. 跟踪 AI Agent、AI4SE(AI for Software Engineering)、多模态模型等前沿技术,并结合业务场景进行创新实践。

更新于 2026-05-19南京