logo of ke

贝壳python开发工程师(GUI工程方向)(J67024)

社招全职3年以上质量架构部地点:北京状态:招聘

任职要求


1、计算机、通信等专业本科以上学历,3年以上工作经验
2、基本功扎实、编码习惯优秀,熟练掌握Python开发语言,深入了解语言特性,数据结构算法,体系结构等计科知识出色;
3、熟悉Web前后台开发技术栈,有大模型/agent/知识库等工程化应用经验;

加分项:
1.基于多模态大模型的上层应用开发,了解RAG工…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与基于多模态大模型的GUI智能化能力的设计开发,实现多端(web/安卓/ios/鸿蒙/小程序)大模型手眼配套能力全覆盖;
2.跟踪业界前沿技术发展,参与大模型应用评测、企业内部场景化落地、GUI智能体建设等;
包括英文材料
学历+
Python+
数据结构+
算法+
Web+
还有更多 •••
相关职位

logo of bytedance
社招T9813

招聘介绍:通过GUI,VUI等多种交互形态连接用户与服务,让人工智能在抖音、西瓜视频、今日头条、教育、办公等多个产品上实现智能价值,提升用户体验,实现商业价值。在这里你有机会同全球顶尖的AI科学家合作,接触最前沿的技术,并为服务于全球数亿人的人工智能产品提供质量保障。 1、负责语音/图像产品前端及服务端项目交付的质量把控; 2、负责语音/图像算法迭代质量体系的建设,及算法效果评测及算法竞对的评测; 3、负责语音/图像模型、推理引擎、服务测试框架的搭建; 4、负责测试场景和测试用例的设计,测试工具的设计、开发和标准化输出。

更新于 2023-09-22北京
logo of kuaishou
社招3-5年J0012

1、参与快手大流量大型活动场景下会场研发,包括但不限于复杂动效实现、基于 WebGL 的互动游戏开发等; 2、参与大型活动的横向 AI 基建建设,包括但不限于性能/稳定性智能分析、动效AI生产、基于 GUI Agent 的 AI 测试/巡检等; 3、参与 AI 场景下的新渠道探索,包括但不限于 AIGC 生产、GEO 优化等; 4、参与复杂业务场景下架构升级,包括但不限于基于低码协议的端到端架构升级、统一物料生产消费平台等。

更新于 2026-03-30北京
logo of antgroup
社招3年以上技术类-算法

1. 遥操作系统开发: ‒ 设计并实现机器人遥操作系统的核心功能,包括实时控制、低延迟通信和人机交互模块; ‒ 开发和优化远程控制算法,确保系统的响应速度和精确性。 2. 通讯与数据传输: ‒ 实现高效的远程通信协议(如TCP/IP、UDP、WebRTC),优化数据传输的低延迟和高可靠性; ‒ 处理远程视频流传输、传感器数据融合以及控制信号反馈。 3. 系统集成: ‒ 集成机器人硬件(如机械臂、移动平台、无人机)与遥操作软件模块; ‒ 实现机器人与远程操作终端之间的无缝交互。 4. 人机交互开发: ‒ 开发直观的遥操作界面(GUI)或VR/AR交互系统,提升用户的操作体验; ‒ 设计力反馈、触觉反馈等增强操控感知的功能。 5. 仿真与测试: ‒ 基于仿真工具(如Gazebo、V-REP、Unity)设计并测试遥操作系统; ‒ 在实际场景中测试系统性能,确保其稳定性和可靠性。 6. 系统优化与迭代: ‒ 分析遥操作过程中出现的问题,优化系统性能; ‒ 实现智能化辅助功能(如路径规划、碰撞检测、自动校准等)。 7. 技术文档撰写: ‒ 编写清晰的技术文档,包括设计方案、开发流程和操作手册; ‒ 为团队成员提供技术支持与培训。

更新于 2026-03-23上海
logo of bytedance
社招A101286

团队介绍:字节跳动Stone-Cross Platform团队成立于2023年,致力于开发业界前沿的应用框架,构建AI模型驱动的前沿系统和基础设施,提升开发者和用户体验。 课题介绍: 课题背景:随着AI大模型研究的不断发展,文本生成、多模态理解以及Agent规划能力有了巨大的提升和突破,以豆包多模态交互、UI-TARS和Operator等GUI Agent、Deepseek-R1推理模型为典型案例,应用的构建以及交互方式迎来了巨大的机遇和变革。我们希望结合AI模型的多模态理解和生成、深度思考,深入AI Agent所需的交互和基础设施,探索大模型在AI应用构建效率和为智能交互体验上的创新。 研究方向: 本课题旨在利用大模型技术开发智能应用交互框架,研究内容包括:围绕大模型设计应用框架,利用大模型提升应用构建效率,如UI理解及代码生成等;使用大模型来理解应用的多模态context及用户意图,进行意图规划及推理执行,完成用户交互;优化编程语言的设计,使其容易被大语言模型理解,自动验证和实现编程语言的自动生成,和编程语言之间的相互转译,从而加速新编程语言生态的构建;通过该课题的研究,我们希望实现更加智能、便捷和高效的应用框架,推动AI驱动的应用交互的普及与发展。 1、参与大模型在应用框架中的算法研究,探索和优化模型对应用的理解和生成能力、AI Agent等技术; 2、研究和开发智能UI交互技术,提升GUI Agent的智能水平、UI的智能化交互和个性化水平; 3、设计跨平台、高性能、大模型便于理解和生成的编程语言; 4、建设和优化应用中Agent Context、Planning、Tool using等能力,提升应用的理解和响应水平; 5、探索多模态数据融合技术,解决复杂场景下的精准推理与决策问题; 6、整理研究数据,撰写技术报告和发表研究论文。

更新于 2025-05-22广州