你对着手机说“帮我点一杯冰美式”,智能体帮你选好了口味、找到了最近门店、下了单,然后弹出一个支付页面,等你输密码、点确认。
这是当前大多数所谓智能体支付的真实写照,智能体只是帮你把商品放到了收银台,但掏钱的动作还是必须由人来完成。
6月11日,京东正式发布国内首个专门为智能体自主支付设计的协议:A2P(Agent Autonomous Payment Protocol)。它标志着智能体支付正从“概念炒作”走向“基础设施建设”的关键节点。
在我看来,A2P2协议的真正价值,不在于它让AI能“花钱”了,而在于它为这个全新的支付范式划定了一套可验证、可追责、可监管的边界体系,这在当前全球智能体支付标准尚处混沌期的背景下,具有里程碑意义。
四层架构的“巧思”与“深意”:对“信任”的工程化拆解
A2P2协议最核心的贡献,不是某一项单点技术,而是首次系统性地将智能体支付中“信任”这个模糊概念,拆解成了可工程化、可验证、可审计的四层架构。每一层解决一个根本性问题,四层合在一起,构成了完整的信任闭环。
1,意图层:解决“AI懂没懂”的问题
用户说“帮我订周五去上海的机票”,这句自然语言背后,包含了出行偏好、舱位选择、时间习惯等一系列隐含信息。意图层做的事情,是把用户的自然语言转化为机器可校验的“任务委托凭证”(Mandate),即一个结构化的Intent Object。这里面不仅有任务类型(机票预订)、目的地(上海),还有Agent基于用户画像理解的偏好(经济舱、白天出发、不坐红眼航班)。
更关键的是,意图层不只生成任务对象,还会签发“订单生成凭证”(OGC),记录Agent理解用户意图的完整过程,包括和协作Agent的协作链路。进入支付受理后,支付侧也会独立理解用户原始意图,双方比对,确保Agent没有理解偏差。在Agent时代,用户意图的模糊本身不是缺陷,而是这个时代的特点,意图层的价值,就是把模糊变成可校验,把“我大概的意思”变成“可执行、可验证、可追溯的凭证”。
2,身份层:解决“谁在付钱”的问题
当智能体自己发起支付,“这是谁的钱”变成一个前所未有的复杂命题。A2P2首创了ARI(Agent Runtime Identity,智能体运行时身份)机制,在支付瞬间实时绑定三方信息:KYC,这笔钱最终由哪个真实用户承担;KYA,执行支付的是哪个智能体,基于什么模型,权责范围是什么;运行时环境,这个智能体当前跑在什么设备上,工作流是什么,设备指纹是否可信。
京东A2P2协议产品经理打了个比方:“这就像给每个智能体发了一张带芯片的身份证,支付时不仅要看脸,还要看现场环境和动作指令,三合一才能通过。”如果智能体被“劫持”,试图在用户不知情的情况下转账,ARI会在第一时间发现运行环境异常,直接拦截。
与此同时,身份层还设计了“资金载体”隔离机制,用户主账户不会被智能体直接调用,而是新设立一个严格受限的“专用账户”,对金额上限、使用场景、有效时间和允许的收款方都设有硬性规定。就像给智能体发了一张“零钱包”或“工资卡”,花完就花完了,触碰不到主账户。用户可以随时查看每个智能体被分配了多少钱、花在了哪里,也可以随时收回授权。
3,决策层:解决“能不能付”的问题
决策层不是简单的通过/拒绝二元判断,而是引入了“增强确认”(Step-up)机制。当支付请求落入灰色地带,比如金额接近上限、场景略有偏移,系统不会一刀切地通过或拒绝,而是触发“增强确认”,要求用户进行二次授权。这种方式既保证了安全底线,又不过度打断体验流畅度。
决策层最终会生成一个单次可用的最小边界执行令牌,只有持有这个令牌的请求,才能进入支付结算层。这意味着,每一笔支付都是“一事一令”,令牌不可复用、不可转让,从根本上杜绝了越权风险。
4,支付结算层+存证链:解决“付完怎么查”的问题
在支付与结算层,系统将支付结果与前序的任务委托凭证、ARI身份、决策裁决及执行令牌强行绑定,形成完整的证据闭环。而为了解决智能体支付关键事实分散在不同架构层、传统日志排查信息不全的问题,A2P2引入了“存证链”作为统一的事实锚点,意图理解、身份校验、决策过程、关键事件,全链路留痕,不可篡改。
结合一个具体场景来理解:某员工需要下周出差上海,他对智能体下达指令:“下周团队去上海出差,预算3000以内,帮忙安排一下。”,智能体自动拆解为机票、酒店、用车、保险等子任务,从HR系统获取证件信息,调用协同Agent进行多元比价,最终选定一张1500元的机票。A2P2的意图层记录了预算的委托边界,身份层验证了Agent身份和运行环境,决策层判定1500元在授权范围内并签发执行令牌,支付结算层完成扣款并存证链全程留痕。如果事后产生争议,任何一个环节都可以回溯还原。
四层架构的核心智慧可以归结为十二个字:信任分层、风险隔离、全程留痕。它破局的,正是智能体支付面临的身份困境(谁在替谁付钱)、授权困境(能不能付)、风控与追溯困境(出了事怎么查)这三大根本挑战。
智能体支付的“自动驾驶分级”:不是保守,而是负责
A2P2协议另一项重要贡献,是参照自动驾驶L0到L5的分级体系,首次为智能体支付划分了清晰的等级:
L0是完全由人确认每一笔支付;L1是智能体提供支付建议,人确认后执行;L2是智能体在单一场景下可自主发起支付请求,但需逐笔人工确认;L3是智能体在单一任务内可自主发起支付请求,系统在用户设定的边界内裁决是否放行;L4是预设范围内,智能体可自主完成多步骤、跨场景支付;L5是理论上的完全自主支付。
A2P2重点聚焦L3和L4,这体现了京东的务实判断:智能体支付不追求无约束的完全自动化,而是先跑通“可监管的有监督自主支付”。
这不是保守,而是负责任。当下,小额高频的API调用计费、工具购买等L3场景已经具备落地条件,京东此前推出的ClawTip微支付基础设施,基于X402协议构建A2A交互框架,让不同平台的Agent可以用统一语言协作,自助结算,人不需要在场。而L4的企业采购、差旅规划、家庭开支管理等复杂场景,还需要随着智能体和大模型的升级逐步推进。
纵观当前全球范围的智能体支付标准,多数协议要么过于保守(停留在L1-L2的条件自动支付),要么过于激进(直接跳到L5的理论完全自主)。京东选择聚焦L3-L4,既回应了市场对效率提升的真实需求,又守住了金融安全的底线。这不是妥协,而是务实,在监管框架尚未完全适配智能体支付形态的今天,“负责任地推进”比“激进地颠覆”更有长期价值,也更符合国内金融合规语境。
不止是产品,更是行业基础设施
京东发布A2P2,意义重大。对普通用户而言,它让AI花钱省心更安心,你不再需要为每一笔小额支付手动确认,但你的资金始终处于可控边界之内。对产业而言,它赋能B端智能化转型,企业采购、差旅规划、供应链协同等复杂场景将获得更高效的支付闭环。对支付行业而言,它填补了行业标准空白,引领规则建设。对监管层面而言,它适配新型支付形态,助力合规监管。
管理学家彼得·德鲁克说过:“效率的本质,是系统和目标的匹配。”当整个支付系统都围绕“人类账户持有者”设计时,智能体的自主经济目标注定无法匹配。
A2P2协议,表面是为AI花钱定规则,实质上是智能经济时代支付基础设施的第一次系统定义。它回答的不是一个技术问题,而是一个时代命题:当机器开始参与价值交换,我们该如何构建一套既开放又可信、既高效又可审计的支付新秩序?
这不是一个产品发布,而是一个行业坐标的确立。尤其在全球科技巨头均在布局智能体支付协议,标准之争已然开启的大背景下,此举更显重要。
为什么率先迈出关键步伐的是京东?因为京东是行业内少有的同时具备实际产业供应链优势、金融科技能力与自研AI产品矩阵的企业,其涵盖零售、物流、健康、工业、外卖、家政等众多场景,覆盖千行百业的供应链流转和千家万户的生活消费,这是A2P2最天然的应用试验场。今年京东体系的AI相关研发投入增长超过200%,已构建全栈AI产品矩阵,这种"场景+技术+金融"的三位一体能力,是其他纯技术公司或纯金融机构难以复制的。
更重要的是,京东选择了一条开放共建的路径。A2P2并非京东一家的封闭产品,而是面向智能体时代的通用基础设施。京东在协议框架下已推出ClawTip作为首发产品,让不同平台、不同系统的Agent可以拥有统一语言的协作能力。而且,京东明确表示将在监管合规体系下推动协议完善与落地,联合Agent平台与Skill生态、商户与服务方、开源社区与技术开发者等合作伙伴共同打磨规范。
上一个十年,中国在移动支付上弯道超车,让全世界惊叹。这一个十年,智能体支付的标准之争才刚刚开始,京东A2P2协议的发布,标志着中国在这场全球竞赛中,迈出了规则先行的关键一步。
正如研讨会上一位专家所言:“智能体支付正在从工具的辅助角色向半自主乃至执行跨越的关键时刻。”A2P2协议所做的,正是为这一跨越铺设轨道,让AI不仅会花钱,更会“负责任地花钱”,而这正是智能体经济真正发展并行稳致远的关键。


























