阿里巴巴业务技术-AI生成界面方向设计专家 / 研究员-Generative UI Design Researcher
任职要求
基础能力要求 1、对生成式AI、特别是多模态大模型(如GPT-4, Gemini, Claude等)有深刻理解 2、熟悉AI工作流、数据标注、Prompt工程、模型训练与评估等AIGC相关流程 3、理解界面设计原则,具备较强的视觉与交互设计基础 4、对设计系统有深度经验,熟悉组件化设计与工程化实现流程(如Figma Tokens, Storybook, Design Tokens 等) 背景要求 1、计算机、人工智能、设计、认知科学等…
工作职责
我们正在寻找一位对生成式人工智能(AIGC)与产品设计交叉领域充满热情的设计专家或研究员,加入我们AI生成界面方向的前沿研究与产品落地探索。 你将主导基于大模型驱动的界面自动生成相关工作,参与制定智能化工作流与设计系统训练策略,推动我们设计系统从“组件库”升级为“智能设计引擎”,助力实现从规范到界面的自动化生成。 你将获得: 1、参与构建下一代“AI驱动界面设计范式”的机会 2、与大模型团队、产品、设计、前端工程师跨学科紧密协作 3、将个人在AIGC领域的研究与洞察落地为真实可用的产品能力 4、与一线技术平台协同,共建开源组件库与智能生成能力 工作内容: 1、研究并定义AIGC生成应用界面的底层方法、流程和最佳实践; 2、主导构建从设计规范到界面生成的AI工作流:包括数据格式、Prompt设计、训练流程等; 3、与开发团队协作,将组件库工程化能力与AI模型结合,探索设计系统的可学习结构表达; 4、参与AI辅助设计工具的原型构建,推动设计生成质量与交互效率提升; 5、撰写设计与技术文档,总结研究成果,形成具备参考价值的方法论; 6、对接模型团队,推动针对UI场景的模型微调、能力评估与持续优化;
关于我们 我们致力于打造具备“感知-理解-规划-行动”闭环能力的下一代多模态 AI Agent:团队聚焦 GUI Agent(图形用户界面智能体) 与 多模态交互能力 的前沿探索,让 Agent 不仅能“看懂”屏幕、理解用户意图,还能自主操作界面、完成任务,真正实现从“问答助手”到“执行代理”的跃迁。我们相信,多模态感知与 GUI 操作能力是 Agent 走向通用智能的关键一步。期待你加入,共同将“看得见、做得对”的智能体能力转化为业务核心竞争力。 你将获得什么 ● 在真实的业务场景中探索GUI Agent的价值:在淘宝、千牛等页面复杂、流量巨大的电商APP中,规模化的落地GUI Agent,自动完成消费者、商家、公司内部产研同学的任务。也可以让GUI Agent成为其他各种业务Agent的工具,让各种Agent具备视觉感知和GUI操作能力。 ● 充分探索多模态大模型理解与规划能力的极限:让大模型理解电商垂域场景异常复杂的任务指令、UI界面,使用包括但不限于自动化轨迹数据生成、模型训练、多模态记忆系统、multi-agent架构设计等多种手段,构建最懂电商域的GUI Agent ● 充分的业务场景真实数据与计算资源:团队训练资源充足,能在不同架构/不同规模模型上完成微调、对齐与能力专项提升,并形成可复用的训练范式,充分利用各种开源/闭源模型的能力。 ● 个人技术成长:支持多元化方向发展,鼓励对外分享与论文/专利沉淀。 岗位职责 1.主导基于大模型的AI Agent全生命周期研发,重点聚焦多模态Agent建设,包括但不限于GUI Agent/图文理解Agent/图文评估Agent,构建具备视觉感知和推理能力的多模态Agent应用; 2.运用SFT、RL等Post-training训练方法,探索多模态与RL的结合,提升大模型/多模态大模型在自主规划(Planning)、多步推理、多模态RAG、工具调用、UI界面理解、复杂图文理解、局部细节感知等方面的能力; 3.跟踪LLM、VLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破任务规划与复杂推理、研发测试自动化、computer use、大规模商品图文分析、图文细节理解与评估等方向的应用创新; 4.持续优化多模态能力与已有Agent架构的集成,快速构建具备多模态能力的Agent应用,提升Agent系统性能与效率,提供AI Agent技术方案。
1. 主导AI驱动的硬件操作系统架构设计,参与定义AIOS的交互框架,确保系统级体验的易用性与先进性; 2. 负责AI应用的体验创新,规划OS层级智能体行为逻辑与特征,将复杂算法转化为用户可理解的直观界面; 3. 协同硬件与产品团队,利用传感器等特性优化多模态输入体验,建立包含系统性能与智能准确率在内的综合体验评估体系; 4. 打通OS底层能力与上层AI服务,设计全局智能入口及跨应用智能流转机制,实现系统功能与智能服务的无缝融合; 5. 构建动态自适应设计系统,使界面布局与功能推荐能根据用户场景、习惯及设备状态实时调整,打造意图驱动的AI操作系统体验。

1. 主导AI驱动的硬件操作系统架构设计,参与定义AIOS的交互框架,确保系统级体验的易用性与先进性; 2. 负责AI应用的体验创新,规划OS层级智能体行为逻辑与特征,将复杂算法转化为用户可理解的直观界面; 3. 协同硬件与产品团队,利用传感器等特性优化多模态输入体验,建立包含系统性能与智能准确率在内的综合体验评估体系; 4. 打通OS底层能力与上层AI服务,设计全局智能入口及跨应用智能流转机制,实现系统功能与智能服务的无缝融合; 5. 构建动态自适应设计系统,使界面布局与功能推荐能根据用户场景、习惯及设备状态实时调整,打造意图驱动的AI操作系统体验。

在这里,你将直面阿里巴巴这一超大规模组织中最复杂、最多元的员工服务场景;同时,你也将拥有集团在AI领域最前沿的技术资源与战略支持。作为HRSSC智能化变革的核心推动者,你将与我们一同,用AI重新定义“服务员工”的方式——不止于效率,更关乎体验、尊严与归属。 ● 深耕HR业务本质,绘制智能员工服务的未来蓝图:深入理解HRSSC整体产品架构及各子系统的演进逻辑。你不仅是功能的建设者,更是AI原生服务模式的探索者——从组织提效到个体体验,系统性构建面向未来的员工服务产品体系。 ● 以战略眼光驱动AI原生创新,重构服务范式:超越“流程自动化”的思维局限,通过深度洞察业务逻辑与员工真实需求,融合行业最佳实践与前沿技术(如生成式AI、智能体Agent、企业知识图谱、多模态交互等),推动SSC服务从“响应式”向“预测式、陪伴式、个性化”跃迁。 ● 端到端主导高复杂度解决方案,实现价值闭环:作为产品Owner协同一切资源完成产品高质量交付。你需要在纷繁复杂的业务诉求中厘清本质,确保产品设计都精准回应真实痛点,并最终转化为可衡量的业务价值与员工获得感。