logo of alibaba

阿里巴巴AI Business-Agent框架平台开发-杭州

社招全职技术类-开发地点:杭州状态:招聘

任职要求


1.精通 Golang/Java/Python 中至少一种编程语言,有跟算法合作经验,对深度学习机器学习的流程和应用场景比较了解。
2.有大规模AI工程方面经验, 比如搜索推荐工程经验,或者AI应用架构经验,Agent智能体架构的经验,或者做平台框架,通用平台的工程能力
3.国际电商业务场景工程经验,对电商业务流程熟悉,对商家需求了解加分。
4.作为技术架构师有复杂业务场景的架构经验加分
5.具备很强的学习能力和动手能力,对AI前沿的探索方向充满热情和敏感度,乐于分享,有良好的团队合作意识。

工作职责


我们正在寻找一位经验丰富的高级开发工程师,加入我们的AI技术团队,负责Agent框架平台的研发工作。您将参与设计和实现先进的Agent系统架构,开发智能Agent框架和相关工具链,推动多Agent协同能力的突破。你负责的内容会包括以下但不限于:

1.负责Agent框架核心能力的设计与开发,包括异步化框架、执行引擎的实现与优化
2.研发Agent Development Kit (ADK),提供完善的开发工具和接口
3.设计并实现multi-agent协同框架,解决Agent间的通信、协作和资源分配问题
4.开发和维护MCP (Model Control Protocol) Server,管理模型调用和资源调度 -参与制定Agent能力评估标准,构建测试框架和基准测试
5.优化Agent系统性能,提高可扩展性和稳定性
6.与产品、算法团队紧密合作,将前沿AI研究成果落地到框架中
包括英文材料
Go+
Java+
Python+
算法+
深度学习+
机器学习+
AI agent+
相关职位

logo of alibaba
实习阿里国际2026

关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。

更新于 2025-03-21
logo of alibaba
社招2年以上技术类-数据

作为大模型评测研发工程师,将负责“大模型通用Benchmark评测体系”与“业务领域Benchmark构建”的全链路研发:从评测数据集设计、智能化自动化评估方法探索研究、指标实现,到平台化落地,精准衡量模型能力边界,持续驱动模型语料优化与模型迭代 通用 Benchmark 研发 • 持续迭代覆盖语言理解、推理、知识、幻觉、对齐、代码、多模态、Agent 等各个维度的自动化评测框架; • 研究并实现更贴合业务发展的评测方法与指标,构建高效、可扩展、可复现、可解释的评测引擎 业务领域 Benchmark 构建与评测 • 深入跨境电商各个业务领域,构建领域Benchmark,真实反馈模型业务表现 • 设计场景化评估方案,如RAG、Agent、COT、 In-Context Learning等,并形成端到端评测能力; 评测方法研究 • 探索基于 LLM-as-a-Judge、人类偏好对齐、模型解释性等前沿评测技术 • 跟踪 ACL / EMNLP / NeurIPS / ICML / ICLR 等会议,高效复现SOTA方法,形成可比对可参考的评估系统

更新于 2025-09-19
logo of bytedance
校招A86996

Team Introduction: Dedicated to building an industry-leading large-model dialogue system, the team serves hundreds of millions of daily active users, with application scenarios covering the entire Douyin e-commerce ecosystem. This includes core business scenarios such as platform customer service, platform merchant service, merchant customer service, influencer customer service, and innovative intelligent shopping guides. Through continuous technological innovation and optimization, the team has successfully established a complete intelligent dialogue solution, delivering significant efficiency improvements and user experience enhancements to e-commerce operations. Research Objectives: Develop an LLM-based customer service chatbot for TikTok and Douyin E-commerce, enabling intelligent customer service interactions. The LLM will handle the entire user inquiry process, including request clarification, solution negotiation, and execution. Necessity: LLM's strong conversational and reasoning abilities make it especially suitable for intelligent customer service, capable of potentially reaching the service standards of excellent human representatives. Research Content: Design a multi-agent framework based on LLM, integrating planning-agent, reply-agent, and tool-agent. Each agent will specialize in different functions, working collaboratively to manage the complete service process—from issue identification and solution negotiation to solution implementation and feedback. 1) Reply-agent ensures the proposed solutions comply with platform policies and service guidelines, avoids excessive improvisation or hallucinations, and maintains smooth communication and negotiation with the user. 2) Planning-agent identifies user demands and problem scenarios, sourcing relevant service guidelines and constraints as well as recognizing risk scenarios. 3) Tool-agent validates the legality of tool usage, accurately interprets the results from tool interactions, and manages execution dependencies of various actions. Research Challenges: Compliance with service guidelines: Ensuring the chatbot's solutions adhere to platform service guidelines (such as available refund within xx days of parcel arrival and coupon limits per user per week). Dynamic feedback adaptation: Static adherence to service rules and providing fixed solutions can limit the flexibility of reply-agents, preventing them from acting like excellent human customer service representatives. By enabling reply-agents to interact in real-time with their environment, considering user's behavioral trends, demands expressed during inquiries, and feedback on proposed solutions, personalized service can be provided. This approach fosters adaptive responses and progressive services and solutions, closely mirroring the flexibility and excellence of human customer service. Self-reflection: Employing LLM's capabilities to understand, analyze, and evaluate its own behavior, fostering self-supervision and decision refinement through reflection on outputs, particularly with complex and ambiguous tasks. Complex image processing: Handling scenarios involving numerous complex images (including shipping order photos, bank transaction screenshots, images of damaged goods received, and seller qualification certifications). These images contain key information crucial to enhancing the chatbot's problem resolution capabilities. 团队介绍: 智能对话团队,致力于打造业界领先的大模型对话系统。团队服务的日活用户超过数亿,应用场景覆盖抖音电商全链路,包括平台客服、平台商服、商家客服、达人客服,以及创新的智能导购等核心业务场景,通过持续的技术创新和优化,成功构建了一套完整的智能对话解决方案,为电商业务带来了显著的效率提升和用户体验改善。 课题目标: 构建基于LLM的电商客服机器人(Chatbot),服务TikTok和抖音电商智能客服场景,由LLM完成一次用户进线的完整接待过程,包括诉求澄清、方案协商、方案执行等阶段。 必要性: LLM具有强大的对话和推理能力,智能客服是LLM能够发挥价值的最典型场景,有机会能够达到匹配优秀人工客服的服务能力。 课题内容: 设计一个基于LLM 的 multi-agent framework,将 planning-agent、reply-agent、tool-agent 集成到一起,每个 agent 负责不同能力,互相协同,完成从问题定位、方案协商,到方案执行、结果反馈等服务全流程。reply agent 需要确保给用户提供的方案是符合平台的相关政策和service policy的,不自行过度发挥、不出现幻觉,顺滑的完成和用户的沟通协商过程;planning agent 完成定位用户诉求和问题场景,以便从外部获取该场景的服务准则和约束,如何识别风险场景;tool agent 需要确保工具调用的合法性、接收和解析工具调用的返回结果,另外一些动作的执行存在前后依赖的问题。 课题挑战: 1、遵循服务准则:如何确保方案Chatbot提供的方案是follow平台服务准则的,例如到货xx天之内可以申请退款、同一用户一星期内最多发送xx额度的优惠券; 2、感知环境反馈:reply agent如果只能死板的follow当前场景服务准则,提供一层不变的方案,是无法像优秀客服一样做到灵活变通的。让Agent能够实时的和环境打通,通过结合当前用户进线前的行为动线、进线后表达的诉求和用户对 agent 提供方案的反馈,为用户提供个性化的服务,对用户的实时反馈有响应,像优秀客服一样能随机应变,递进式的提供服务和解决方案; 3、进行自我反思:利用LLM理解、分析和评价其自身的行为,使LLM能够自我监督,通过对自身输出的反思,改进其所做的决策,以便在处理复杂、有歧义的任务时,能有更好的表现; 4、复杂图片理解:电商场景存在大量复杂的图片,包括运费订单实拍图、银行流水截图、买家收货缺件破损的、商家各类资质证明等,这类图片往往包含重要的信息,对提升Chatbot解决能力非常重要。

更新于 2025-05-26
logo of bytedance
校招A19978A

Team Introduction: Through algorithm optimization and collaboration with business teams, the team conducts comprehensive quality and ecosystem governance for ByteDance's e-commerce products. This involves combating risks, violations, and low-quality issues, as well as constructing and optimizing a healthy e-commerce ecosystem. The team aims to maximize platform governance effectiveness while improving operational efficiency and reducing costs. Additionally, the team is dedicated to advancing cutting-edge AI technologies to drive business transformation and development through technical innovation, covering diverse fields including but not limited to NLP, CV, multimodal models, large models, graph algorithms, and sequence algorithms. 团队介绍: 平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 课题目标和必要性: 电商智能审核业务比较复杂,随着审核技术的不断演进,各个领域面临着新的风险问题和对抗形式,这对大模型的应用提出了新的挑战。例如,在电商审核业务中,涉及审核PBR变更、长文本、长时序、多语言、少样本和AIGC生成对抗等问题时,现有的开源大模型表现往往不尽人意。因此,针对这些挑战,我们亟需研发专门针对电商智能审核的大模型,以提升其在电商治理中的有效性和适应性。特别的,针对电商业务特点,我们需要探索高质量的数据自动生成、高效的MOE Embedding、Auto-prompt生成、高质量 COT输出、大模型知识蒸馏等。此外,该模型应能够满足电商审核业务的需求,实现高准确率的自主决策和可解释性的COT生成,显著减少误判。针对动态变化的审核PBR变更,它能够通过RAG模块自动检索类似的审核案例,将复杂的审核PBR分解为简单的原子任务,自动拆分出驳回和豁免原子任务,并自动调用相应的Tools来解决这些任务,从而建立“知道拒绝并且知道为何拒绝”的业内领先智能审核系统。最终,大模型智能审核系统的审核效果需要接近或者超过人工审核,往全机审的路线上演进。 课题内容: 电商智能审核多模态大模型,主要研究点包括但不限于: 1、模态融合能力:提升文本、音频、图像、视频和直播等多模态的细粒度理解能力,实现高准确率的自主决策和可解释性的COT生成; 2、Few-Shot能力:探索电商多语言、长时序和少样本问题,增强Few-Shot和Zero-Shot能力,针对多变的业务规则具备复杂指令和Auto-prompt生成能力; 3、攻防对抗能力:研究AIGC图像视频的判别,增强审核大模型对隐晦、抽象的生成式内容的攻防对抗能力; 4、 Agent能力:具备调用RAG模块,使用Tools,和Auto-planning能力;提升大模型的动态推理和反思能力。 涉及的研究方向:大模型,多模态大模型,Few-Shot,AIGC判别,AIGC数据生成,强化学习,Agent。

更新于 2025-05-26