EDA入门

本文参考分析整理总结了AMBA AXI and ACE Protocol Specification文档的AXI总线协议规范部分，错误之处欢迎指出

1: Introduction

1.1 About the AXI protocol

AMBA AXI协议支持高性能高频的系统设计，该协议拥有以下优点：

适合高带宽和低延迟的设计
不需要复杂的桥即可提供高频操作
可以满足多种组件的接口需求
适合高初始访问延迟的存储器控制器
提供互联架构实现的灵活性
向后兼容AHB与APB接口

同时，该协议还拥有以下特点：

分离的地址/控制和数据阶段
通过使用字节选通信号的方式支持非对齐数据传输
使用突发传输时只需要传输起始地址v
允许地址信息提前于实际数据传输发送
分离的读写数据通道，这可以提供低损耗的DMA
支持发出多个未完成的地址
支持乱序传输完成
允许简单添加寄存器阶段以提供时序收敛

AXI协议同时包含了低功耗操作所需的信号扩展，也包含了AXI4-Lite协议，该协议是AXI4的子集，有着更简单的控制寄存器接口和组件

1.2 AXI架构

AXI协议基于突发传输，定义了下列5个独立事务（一个事务可能包含多次传输）通道：

Read address，以AR做信号前缀
Read data，以R做信号前缀
Write address，以AW做信号前缀
Write data，以W做信号前缀
Write response，以B做信号前缀

地址通道携带控制信息，数据在主设备和从设备间通过以下方式传输：

写数据通道，从主设备传输数据到从设备
- 在写传输时，从设备使用写响应通道通知主设备传输完成
读数据通道，从从设备传输数据到主设备

一个使用aw, w, b channel的write transaction如下图所示：

读写事务Timing diagrams

一个使用ar, r channel读数据的过程如下图所示：

1.2.1 通道定义(channel)

五个独立通道都具有双向握手机制的valid和ready
VALID信号表示通道的地址、数据或控制信息已经可用
READY信号则表示接收方已准备好接收信息
w,r channel还拥有LAST信号，该信号用于指示当前传输是否为当前事务中的最后一次传输

AW, AR 读地址与写地址通道，读事务与写事务都拥有其自己的地址通道，对应的地址通道会携带一次事务所需的全部地址和控制信息

R 读数据通道，读数据通道携带从设备传送给主设备的数据和响应信息，该通道包括两部分：

位宽可为8、16、32、64、128、256、512、1024bit的数据总线 data bus
表示读事务完成状态的读响应信号 response

W 写数据通道，写数据通道携带主设备传送给从设备的数据，该通道包括两部分：

位宽可为8、16、32、64、128、256、512、1024bit的数据总线data bus
为每一个8bit数据准备的字节选通信号，用于指示数据的哪几个字节是有效的 strobe
写数据通道的内容被视为带buffer，因此主设备可以在未收到前一次写事务的从设备响应消息时再次执行写操作

B 写响应通道，从设备使用写响应通道回应写事务，全部的写事务都需要写响应通道的完成信号，并且完成信号仅在一个写事务彻底完成时才产生，而并不会在每次数据传输时都产生

1.2.2 AXI互联结构(Interface and interconnect)

典型的系统有多个manager和subordinate组成，这些设备通过某种Interconnect互联在一起：

AXI协议为以下接口提供了单一的接口定义：

一个主设备(Manager)和一个互联器(Interconnect)之间
一个从设备(Subordinate)和一个互联器(Interconnect)之间
一个主设备(Manager)和一个从设备(Subordinate)之间

该接口定义支持不同的互联器实现

NOTE

一个与不同devices连接的Interconnect等价于，一个同时具有Manager和Subordinate端口并可以与真正devices连接的device

三种经典系统拓扑结构：

共享(Shared)的地址数据总线(address and data buses)
- 总结：就一条*地址数据总线
共享(Shared)的地址总线(address buses)、多条数据总线(multiple data buses)
- 总结：一条*地址总线，多条数据总线
多层，具有多条地址数据总线(Multilayer, multiple address and data buses)
- 总结：多条地址数据总线，各发各的

在大多数的系统中，地址通道带宽需求远小于数据通道带宽需求。使用共享地址总线、多条数据总线（第二种）结构，实现并行数据传输时，可以在系统效率和互联复杂性间取得平衡

1.2.3 在AXI中使用寄存器(Register slices)

每一个AXI Channel都是单向的，通道间彼此独立

这意味着寄存器可以插入到任何通道的任何位置，不过这会带来额外的延迟(Latency)

NOTE

以下两点是可能的：

在延迟和最大操作频率之间取得trade-off

processor和high-performaance memory之间建立直接、快速的连接，使用register slices来isolate一个less performance关键外设

1.3 AXI术语(Terminology)

1.3.1 AXI组件与拓扑

下列术语描述了AXI组件：

组件（Component）
主组件（Mangaer component）
从组件（Subordinate component），从组件包含存储器子组件(Memory Subordinate components)和外设子组件(Peripheral Subordinate components)
互联组件(Interconnect components)

对于特定的AXI事务中，上游(Upstream)与下游(Downstream)指代AXI拓扑中AXI组件的相对位置

1.3.2 AXI事务(transactions)与存储器类型(memory types)

当AXI主设备初始化一个AXI操作时，且目标是AXI从设备：

AXI总线上所需的一整套操作构成了AXI Transaction
任何所需的有效负载数据(payload data)都将作为AXI Brust
Brust可包括多个数据传输(multiple data transfers)或AXI Beats

The complete set of required operations on the AXI bus form the AXI Transaction(Transaction)
Any required payload data is transferred as an AXI Burst(Burst)
A burst can comprise multiple data transfers, or AXI Beats(Beat)

1.3.3 Caches 和 cache operation

本规范未定义标准cache术语，cache属于是在具体工作中定义的。不过本规范的cache和cache line中仍然提到了cache术语在本文档中的使用方式

1.3.4 暂态(Temporal description)

协议无法定义必须发生事件的绝对时间。然而，在一个足够空闲的系统中，它将取得进展并完成，而无需任何明确的操作

2: AXI信号描述

本章介绍AXI接口信号。大多数信号都是协议的AXI3和AXI4实现所需的，相关总结表格会提示这两种类型的区别。本章包括以下部分：

Global singals
Write address channel signals
Write data channel singals
Wrtie response channel signals
Read address channel signals
Read data channel signals

2.1 全局信号

下列信号被用于AXI3和AXI4

信号名	来源	描述
ACLK	时钟源	全局时钟信号
ARESETn	复位源	全局复位信号，低有效

所有信号都在公共时钟的上升沿被采样。

2.2 Write address channel signals 写地址信号

AXI写入地址通道信号。除非说明中另有说明，否则是AXI3和AXI4都支持的信号

信号名	来源	描述
AWID	主设备	写地址ID，该信号用于写地址事务(Identification tag for a write transaction. )
AWADDR	主设备	写地址，写突发操作中第一次数据传输的地址
AWLEN	主设备	突发长度，写突发事务中的数据传输的确切次数，决定与地址有关的传输的次数 AXI4与AXI3有变化
AWSIZE	主设备	突发大小，这个字段此次写突发事务中的每次传输的大小
AWBURST	主设备	突发类型，包括突发类型和突发大小信息，该字段决定了每次突发传输时地址的计算方法
AWLOCK	主设备	锁定类型，提供关于传输时原子特性的额外信息 AXI4与AXI3有变化
AWCACHE	主设备	存储器类型，指示如何要求写入事务在系统中进行
AWPROT	主设备	写突发事务的保护类型，包括： privilege, security level, and access type三种信息
AWQOS	主设备	服务质量，即每次写传输的QoS标识符仅AXI4支持
AWREGION	主设备	区域标识符，允许一个从设备的单个物理接口用作多个逻辑接口仅AXI4支持
AWUSER*	主设备	用户定义信号，可选仅AXI4支持
AWVALID	主设备	主设备给出的地址和相关控制信号有效
AWREADY	从设备	从设备已准备好接收地址和相关的控制信号

2.3 Write data channel signals 写数据信号

信号名	来源	描述
WID	主设备	写数据ID，该信号用于标识写数据传输仅AXI3支持
WDATA	主设备	写出的数据
WSTRB	主设备	数据的字节选通，指示那些字节通道保存有效数据，数据中1byte对应这里的1bit
WLAST	主设备	该信号用于标识当前传输是否为写突发事务中的最后一次传输
WUSER*	主设备	用户定义信号，可选仅AXI4支持
WVALID	主设备	主设备给出的数据和字节选通信号有效
WREADY	从设备	从设备已准备好接收数据选通信号

2.4 Write response channel signals 写响应信号

信号名	来源	描述
BID	从设备	写响应ID，该信号用于标识写响应传输（这里AXI3和AXI4都支持要注意）
BRESP	从设备	写响应，该信号表示一个写事务的状态
BUSER*	从设备	用户定义信号，可选
BVALID	从设备	从设备给出的写响应信号有效
BREADY	主设备	主设备已准备好接收写响应信号

2.5 Read address channel signals 读地址信号

信号名	来源	描述
ARID	主设备	读地址ID，该信号用于标识读地址组（这里AXI3和AXI4都支持要注意）
ARADDR	主设备	读地址，读突发事务中第一次数据传输的地址
ARLEN	主设备	突发长度，这个字段标识每次突发传输的传输次数 AXI4与AXI3有变化
ARSIZE	主设备	突发大小，这个字段表示每次突发传输的大小
ARBURST	主设备	突发类型，包括突发类型和突发大小信息，该字段决定了每次突发传输时地址的计算方法
ARLOCK	主设备	锁定类型，提供关于传输时原子特性的额外信息 AXI4与AXI3有变化
ARCACHE	主设备	存储器类型，指示如何要求读取事务在系统中进行
ARPROT	主设备	一次读事物的保护类型，包括： privilege, security level, and access type三种信息
ARQOS	主设备	服务质量，即每次读传输的QoS标识符仅AXI4支持
ARREGION	主设备	区域标识符，允许一个从设备的单个物理接口用作多个逻辑接口仅AXI4支持
ARUSER*	主设备	用户定义信号，可选仅AXI4支持
ARVALID	主设备	主设备给出的地址和相关控制信号有效
ARREADY	从设备	从设备已准备好接收地址和相关的控制信号

2.6 Read data channel signals 读数据信号

信号名	来源	描述
RID	从设备	读数据ID，该信号用于标识读数据传输（这里AXI3和AXI4都支持要注意）
RDATA	从设备	读出的数据
RRESP	从设备	读响应，这信号表示读传输的状态
RLAST	从设备	该信号用于标识当前传输是否为突发传输中的最后一次传输
RUSER	从设备	用户定义信号，可选仅AXI4支持
RVALID	从设备	从设备给出的数据和响应信息有效
RREADY	主设备	主设备已准备好接收读取的数据和响应信息

低功耗接口信号

信号名	来源	描述
CSYSREQ	时钟控制器	系统退出低功耗状态请求，外设的系统时钟控制器通过该信号发出请求用于离开低功耗状态
CSYSACK	外设	退出低功耗状态响应，外设响应系统低功耗状态退出请求时使用的信号
CACTIVE	外设	时钟激活，该信号表示外设需要时钟信号

3: 单接口需求

本章内容：单主设备与单从设备之间的基本AXI协议事务需求：

clock and reset
basic read and write transactions
relationships between the channels
transaction structure

3.1 时钟和复位

3.1.1 Clcok

每个AXI接口都需要一个单独的ACLK，所有的信号都在ACLK的上升沿采样，所有的输出信号只能在上升沿之后发生改变

在主从接口之间的输入输出信号间不能有组合路径

3.1.2 Reset

AXI协议使用低有效复位信号ARESETn，该信号是可以异步拉低，但必须在ACLK的上升沿同步释放

在复位期间，下列信号需要遵循特定的要求：

Master 接口：必须拉低ARVALID、AWVALID与WVALID信号
Slave 接口：必须拉低RVALID与BVALID信号
其它信号：则可以为任意值

在ARESETn被释放后的下一个时钟上升沿，主设备可以拉高ARVALID、AWVALID与WVALID信号，如下图所示：

3.2 基本读写事务

基本机制( basic mechanisms)：

The Handshake process 握手过程
The Channel signaling requirementes 通道的握手信号条件

3.2.1 握手过程

五个事务通道都使用VALID/READY作为握手信号来传输：地址、数据和控制信息。使用这种握手方式，主从双方都可以对传输速度进行控制

源端产生VALID信号意味着其地址、数据或控制信息有效
目的端产生READY信号意味着它可以接收信息
只有当双方的VALID与READY信号都为高时传输才会开始

在主从接口之间的输入输出信号间不能有组合路径

下面三个Timing Diagram描述了三种握手情况

第一种情况，正常情况，一个握手过程实例，握手消耗了两个时钟周期

源端在T1之后给出地址、数据或控制信息，同时让VALID有效
在T2之后，目的端检测到VALID有效并给出READY有效信息
在T3阶段传输会发生，因此在T3阶段及之前，源端不能释放或改变需要传输的信息

VALID有效之后：

源端必须在令VALID信号有效之后再等待READY信号有效，一旦VALID有效，源端必须等待握手发生，即在保持VALID不变的情况下，等待目的端的READY信号有效

第二种情况，目的端的READY比源端的VALID提前，握手只消耗了一个周期

死锁问题：

目的端可以在自身READY信号无效的情况下，等待源端的VALID信号有效，这一条规则和上一条规则必须同时遵守，否则可能造成死锁等待，同时，在VALID有效前，即使READY已经有效，也可以再次令READY无效

第三种情况，两端的VALID/READY信号同时有效，则传输立刻在下一个时钟周期开始

3.2.2 通道信号条件

每个通道都有自己的握手信号对：

AW写地址通道：AWVALID, AWREADY
A写数据通道：WVALID, WREADY
B写响应通道：BVALID, BREADY
AR读地址通道：ARVALID, ARREADY
R读数据通道：RVALID, RREADY

AW 写地址通道：

AWVALID：主设备仅当输出有效的地址和控制信息时才能使能AWVALID信号，在从设备的AWREADY信号有效后的第一个时钟上升沿，主设备的AWVALID信号必须保持有效
AWREADY：信号的默认状态可以为高也可以为低电平，规范推荐默认状态为高电平。当该信号为高电平时，意味着从设备一定可以接受任何有效的地址

NOTE

规范不推荐AWREADY信号默认为低电平是因为这会强制使传输周期拉长到至少两个时钟周期，一个周期用于使能AWVALID信号，另一个周期则用于使能AWREADY信号

W 写数据通道：

WVALID：在写突发过程中，主设备可以仅当它输出有效数据时才使能WVALID信号，同样的，该信号必须在从设备WREADY信号有效后的第一个时钟上升沿保持有效
WREADY：信号默认可以为高电平，但这意味着从设备总是可以在一个时钟周期内接收待写入的数据
WLAST：主设备在进行突发事务中的最后一次写传输时，必须令WLAST信号有效

B 写响应通道：

BVALID：从设备输出有效的写响应信号后才能使能BVALID信号，该信号在BREADY信号有效后的第一个时钟上升沿保持有效
BREADY：信号默认可以为高电平，但此时主设备必须总能在一个时钟周期内接收写响应

AR 读地址通道：

ARVALID：主设备仅当输出有效的地址和控制信息时才能使能ARVALID信号，在从设备的AWREADY信号有效后的第一个时钟上升沿，主设备的ARVALID信号必须保持有效
ARREADY：信号的默认状态可以为高也可以为低电平，规范推荐默认状态为高电平。当该信号为高电平时，意味着从设备一定可以接受任何有效的地址。

NOTE

规范不推荐ARREADY信号默认为低电平是因为这会强制使传输周期拉长到至少两个时钟周期，一个周期用于使能ARVALID信号，另一个周期则用于使能ARREADY信号

R 读数据通道：

RVALID：从设备只有在输出有效读数据时才能使能RVALID信号，同时在主设备的RREADY信号有效后的第一个时钟上升沿必须保持有效。即使从设备只有一个读数据源，它也必须在收到数据请求时才令RVALID信号有效
RREADY：主接口使用RREADY信号表示它可以接收数据，RREADY信号默认可以为高电平，但此时主设备启动读事务时必须能立即接收数据
RLAST：从设备在进行突发传输事务中的最后一次传输时必须使能RLAST信号。

3.3 通道间的关系

AXI协议要求各个通道间必须保持如下关系（之后表示前者的下一个周期）：

B必须紧跟所属写事务的最后一次写传输之后
R必须紧跟着它的读地址传输之后
通道握手必须符合通道握手依赖关系(A3.3.1节中的定义)

你甚至可以把写数据优先于写地址之前：

除此上述关系外，协议没有规定其它的任何关系，这意味着，在一个事务中，写数据信号可以提前于写地址信号，这种情况通常发生在写地址的通道的寄存器阶段要更多时，同样，写数据可以和写地址信号同时出现。

NOTE 互联器与地址空间【重要】

当互联器需要决定目标地址空间或从设备地址空间时，必须对地址和写数据重排，以确保写数据仅对其关联的从设备有效

3.3.1 通道握手信号间的依赖关系

为了避免死锁，握手信号必须遵守依赖规则

1）通道内部握手信号的依赖关系

作为A3.2.1的总结，在任何事务中：

发送信息的AXI接口的VALID信号，不能依赖于接收信息的AXI接口的READY信号
接收信号的AXI接口在其自身的READY信号有效前可以等待对方的VALID信号

NOTE

VALID信号可以在READY信号之前有效，READY信号也可以在检测VALID信号之前有效，这些方式都会提升传输效率

2）通道间握手信号的依赖关系

除此之外，不同的通道上的握握手信号之间存在依赖关系。除此之外，AXI4定义了额外的写响应后，写事务时通道之间的依赖关系将在下面几节中提出：

Read transaction dependencies
AXI3 write transaction dependencies
AXI4 and AXI5 write transaction dependencies

在下面的依赖图中：

单头箭头指向的信号可以在始端信号有效前或有效后有效
双头箭头指向的信号只有在始端信号有效后才能有效

1）Read transaction dependencies 读事务依赖（AR -> R）

在一个读传输中：

AR：主设备使能ARVALID，禁止等待从设备使能ARREADY
AR：从设备在使能自身的ARREADY前，可以等待主设备使能ARVALID（可以的意思是，等不等待无所谓，即不等待也可使能，下面提到可以时将不进行解释）
AR->R：从设备在使能RVALID前，必须等待ARVALID和ARREADY信号都使能
R：从设备在使能RVALID后，才能等待主设备使能RREADY
R：主设备在使能RREADY前，可以等待从设备使能RVALID

总结就是：VALID信号发出方，必须首先使能VALID，才能等待READY信号；READY信号发出方，不必等待VALID有效，就可以发出READY信号，也可以等待VALID有效，再发出READY信号，同时，读数据通道的VALID信号不能保持常态有效

依赖关系图如下：

2）AXI3 write transaction dependencies AXI3写事务依赖

AW/W：主设备在使能AWVALID或WVALID后，才能等待从设备使能AWREADY或WREADY
AW：从设备在使能AWREADY前，可以等待AWVALID或WVALID有效
W：从设备在使能WREADY前，可以等待AWVALID与WVALID有效
W：从设备必须等待WVALID与WREADY都有效后才能使能BVALID
B：从设备必须等待WLAST有效后，才能使能BVALID。需要等待的原因是，写响应BRESP，必须发生在一次写事务中的最后一次数据传输之后
B：从设备在使能BVALID后，才能等待主设备使能BREADY
B：主设备使能BREADY前，可以等待BVALID

CAUTION !

如果从设备在使能AWREADY前等待WVALID，会造成死锁

依赖关系图如下：

3）AXI4 and AXI5 write transaction dependencies 写事务依赖（AW -> W -> B）

AXI4和AXI5 定义了一个额外的从设备的写响应相关依赖[1]：从设备使能BVALID前，必须等待AWVLID, AWREADY, WVALID, WREADY信号使能

这个依赖关系是AXI3所期望的，因为AXI3不希望任何组件在接收到有效的地址前接收写数据并提供写响应信号
通过这种写响应，从设备负责对写事务和所有后续事务进行冒险检查

具体依赖关系如下：

AW/W：主设备在使能AWVALID或WVALID后，才能等待从设备使能AWREADY或WREADY
AW：从设备在使能AWREADY前，可以等待AWVALID或WVALID有效
W：从设备可以在使能WREADY前，可以等待AWVALID与WVALID有效
B[1]：从设备等待AWVALID、AWREADY、WVALID、WREADY有效后，才能使能BVALID
B：从设备等待WLAST有效后，才能使能BVALID。因为写响应BRESP必须发生在一次写事务中的最后一次数据传输后
B：从设备在使能BVALID后，才能等待主设备使能BREADY
B：主设备使能BREADY前，可以等待BVALID

依赖关系图如下：

3.3.2 Legacy considerations AXI3遗留问题

AXI4与AXI5的额外的写响应依赖关系意味着，不兼容所有写响应在接收写地址之前的AXI3从设备，而主设备完全兼容

将AXI3的主从设备转为AXI4或AXI5时，应确保额外的修正wrapper会在从设备接收写地址前，不应发送写响应

NOTE

任何AXI3的主设备，都符合AXI4和AXI5写响应要求

本规范强烈建议任何新的AXI3依赖关系都遵守上面提到的额外写响应依赖实现

3.4 事务结构

事务结构主要定义了address, data, response等结构：

Address structure
transfer伪代码描述
Data read and write structure
Read and write response structure

3.4.1 地址结构

AXI协议是基于突发的：

主设备向从设备传送事务的控制信息和第一个字节的地址
接收到控制信息和第一个字节地址后，从设备必须在此后的每次传输中计算数据地址
突发传输不能跨越4KB地址边界

NOTE【重要】

避免突发传输跨越两个从设备的边界，同时必须使用从设备支持的地址增加范围

1）Burst length

AXI4 突发长度由下列字段指定：

对于读传输，ARLEN[7:0]
对于写传输，AWLEN[7:0]

AXI3：

支持1~16的突发长度

AXI4：

对于INCR突发类型，支持1~256的突发长度
对于其它突发类型，支持1~16的突发长度

具体定义：

AXI3中突发长度 = AxLEN[3:0] + 1
AXI4为适应INCR扩充的长度定义，突发长度 = AxLEN[7:0] + 1

具体规则：

对于wrapping bursts回绕传输，突发长度必须为2、4、8或16
突发传输不能跨越4KB地址边界
突发传输不支持过早结束
- 没有组件可以提前终止突发。然而，为了减少写入突发中的数据传输数量，管理器可以通过取消所有写入选通来禁用进一步的写入。在这种情况下，管理器必须完成突发中的剩余传输。在读突发中，管理器可以丢弃读数据，但必须完成突发中的所有传输

NOTE 访问FIFO等读敏感设备时

在访问读敏感设备（如FIFO）时，丢弃不需要的读取数据可能会导致数据丢失。访问此类设备时，主设备必须使用与所需数据传输大小完全匹配的突发长度

INCR且突发长度大于16的情况：在AXI4中，突发类型为INCR且突发长度大于16的突发传输可以转换为多个长度更短的突发传输，即使突发属性表明事务是不可修改的。在这种情况下，生成的突发事务必须保持与原始事务相同的事务特征，唯一的例外是：

突发长度变小
突发地址被适当调整

NOTE

为了实现AXI3兼容性，将长突发传输转换为多个短突发传输是必要的，同时这也可以减少长突发对QoS保证的影响

2）Burst size

该字段表示每次突发数据传输或每个节拍中中数据的字节数，由以下字段指定：

对于读传输，ARSIZE[2:0]
对于写传输，AWSIZE[2:0]

AxSIZE[2:0]	Bytes in transfer
0b000	1
0b001	2
0b010	4
0b011	8
0b100	16
0b101	32
0b110	64
0b111	128

当接口的实际宽度大于Brust size规定的大小时，AXI接口必须根据地址判断使用哪几条数据线，且任何一次transfer 的data size都不能超过事务中任一代理的数据总线宽度

3）Burst type

AXI协议定义了三种突发类型：

固定（FIXED, fixed burst）

AxADDR一致
有效的字节线(AxSIZE)一致，但可通过WSTRB控制实际有效的字节
常用于对同一位置的重复访问，如读取或清空FIFO时

递增（INCR, incrementing burst）

AxADDR在每次传输中递增，递增量为AxSIZE bytes
- 例如大小为4bytes的传输，addr0=0x0000, addr1=0x0004…
常用于访问普通顺序内存

回绕（WRAP, wrapping burst）

与递增方式类似，但地址到达上界后，会回绕到下界
在回绕传输中，有两点需要注意：
- 起始地址必须与每次传输的大小对齐
- Brust length必须为 2, 4, 8, 16个transfers
回绕传输的具体行为：
- 回绕边界wrap boundary：突发所使用的地址下界会对齐到传输数据的总量，这也被称为回绕边界
- 在每次传输后，地址都会像递增突发方式一样递增，但是，一旦递增后的地址超过回绕边界，就会回到回绕边界的开始位置
- 第一次传输的地址可以大于回绕边界的开始位置
此突发类型常用于cache line accesses

突发类型由如下字段指定：

对于读传输，ARBURST[1:0]
对于写传输，AWBURST[1:0]

字段取值如下：

AxBURST[1:0]	突发类型
00	FIXED
01	INCR
10	WRAP
11	Reserved保留

3.4.2 伪代码描述

Start_Address，由主机发起的开始地址
Number_Bytes，一次transfer中最大数据字节数
Data_Bus_Bytes，数据总线上面byte lanes的数量（其实就是说数据总线上有几个字节是用来传数据的）
Aligned_Address，起始地址对齐后的地址
Burst_Length，一次burst中的数据transfer次数
Address_N，一次burst中transfer的序号，首个为1
Wrap_Boundary，一次wrap中最低的那个地址
Lower_Byte_Lane，一次transfer中最低地址对应的字节通道
Upper_Byte_Lane，一次transfer中最高地址对应的字节通道
INT(x)，x向下舍入取整

如何确定一次burst内的transfer地址：

Start_Address = AxADDR
Number_Bytes = 2 ^ AxSIZE
Burst_Length = AxLEN + 1
Aligned_Address = (INT(Start_Address / Number_Bytes)) × Number_Bytes

如何确定一次burst的开始地址：

1	`Address_1 = Start_Address`

对于INCR ，以及地址未wrapped的WRAP，如何确定突发中第一次传输后第N个transfer的地址

1	`Address_N = Aligned_Address + (N – 1) × Number_Bytes`

对于一个WRAP，Wrap_Boundary未

1	`Wrap_Boundary = (INT(Start_Address / (Number_Bytes × Burst_Length)))× (Number_Bytes × Burst_Length)`

对于WRAP，当Address_N = Wrap_Boundary + (Number_Bytes × Burst_Length)时

当前address = Address_N = Wrap_Boundary
随后的address = Address_N = Start_Address + ((N – 1) × Number_Bytes) – (Number_Bytes × Burst_Length)

通过使用以下方程可以确定一次Burst中，哪个字节通道用于首次传输：

1
2

Lower_Byte_Lane = Start_Address – (INT(Start_Address / Data_Bus_Bytes)) × Data_Bus_Bytes
Upper_Byte_Lane = Aligned_Address + (Number_Bytes – 1) – (INT(Start_Address / Data_Bus_Bytes)) × Data_Bus_Bytes

首次传输之后，所有传输都使用了哪些字节通道

1 2	`Lower_Byte_Lane = Address_N – (INT(Address_N / Data_Bus_Bytes)) × Data_Bus_Bytes Upper_Byte_Lane = Lower_Byte_Lane + Number_Bytes – 1`

transfer DATA为

1	`DATA((8 × Upper_Byte_Lane) + 7: (8 × Lower_Byte_Lane))`

transaction container，如果地址对齐并且字节有效位被断言，transaction container描述了该事务可以访问的所有字节

The transaction container describes all the bytes that could be accessed in that transaction, if the address is aligned  and strobes are asserted:
	Container_Size = Number_Bytes x Burst_Length
For INCR bursts:
	Container_Lower = Aligned_Address
	Container_Upper = Aligned_Address + Container_Size
For WRAP bursts:
	Container_Lower = Wrap_Boundary
	Container_Upper = Wrap_Boundary + Container_Size

transfer内部各个属性生成的伪代码

// DataTransfer()
// ==============
DataTransfer(Start_Address, Number_Bytes, Burst_Length, Data_Bus_Bytes, Mode, IsWrite)
// Data_Bus_Bytes is the number of 8-bit byte lanes in the bus
// Mode is the AXI transfer mode
// IsWrite is TRUE for a write, and FALSE for a read
    assert Mode IN {FIXED, WRAP, INCR};
    addr = Start_Address;                         // Variable for current address
    Aligned_Address = (INT(addr/Number_Bytes) * Number_Bytes);
    aligned = (Aligned_Address == addr);          // Check whether addr is aligned to nbytes
    dtsize = Number_Bytes * Burst_Length;         // Maximum total data transaction size
    
    if mode == WRAP then
        Lower_Wrap_Boundary = (INT(addr/dtsize) * dtsize);
        // addr must be aligned for a wrapping burst
        Upper_Wrap_Boundary = Lower_Wrap_Boundary + dtsize;
        
    for n = 1 to Burst_Length
        Lower_Byte_Lane = addr - (INT(addr/Data_Bus_Bytes)) * Data_Bus_Bytes;
        if aligned then
            Upper_Byte_Lane = Lower_Byte_Lane + Number_Bytes - 1
        else
            Upper_Byte_Lane = Aligned_Address + Number_Bytes - 1 - (INT(addr/Data_Bus_Bytes)) * Data_Bus_Bytes; 
            
        // Peform data transfer
        if IsWrite then
            dwrite(addr, low_byte, high_byte)
        else
            dread(addr, low_byte, high_byte);
            
        // Increment address if necessary
        if mode != FIXED then
            if aligned then
					addr = addr + Number_Bytes;
			if mode == WRAP then // WRAP mode is always aligned
                    if addr >= Upper_Wrap_Boundary then addr = Lower_Wrap_Boundary;
            else // All transfers after the first are aligned
                addr = Aligned_Address + Number_Bytes;
                aligned = TRUE;            
    return;

3.4.3 Regular Transaction 常规事务

事务有许多突发、大小和长度选项，但某些接口和事务类型可能只使用这些选项的一个子集

如果从组件连接到仅使用事务选项子集的主设备，则可以简化解码逻辑进行设计

下面定义的常规标准说明了一个常规事务应满足的要求：

AxLEN 为 1, 2, 4, 8, 或 16
如果AxLEN大于1，则AxSIZE与数据总线宽度相同
AxBURST 为INCR或WRAP, 而不是FIXED
AxADDR 在INCR事务中与transaction container对齐
AxADDR 在WRAP事务中与AxSIZE对齐

Regular transactions property：

Regular_Transactions_Only 属性用来定义主设备提交的是否为一个Regular type，或一个从设备是否支持Regular事件
- TRUE：表明只支持Regular事件
- FALSE：表明所有AxBURST, AxSIZE, AxLEN合法组合都支持
- Regular_Transaction_Only在缺省时为FALSE
- 在AXI5, ACE5, ACE5-Lite, ACE5-LiteDVM中这种类型将被支持

主从设备兼容性

	Subordinate：FALSE	Subordinate：TRUE
Manager：FALSE	兼容	不兼容如果主设备提交一个不是Regular的事务，可能发生数据冲突或者死锁
Manager：TRUE	兼容	兼容

3.4.4 数据读写结构

本节介绍AXI读写数据总线上不同大小的传输，以及接口如何执行混合大小端、未对其的传输：

Write Strobes
Narrow transfer
Byte invariance
Unaligned transfers

1）写选通（Write strobes）

当WSTRB[i]为高电平时，对应的WDATA[(8i+7):8i]数据线有效

当WVALID为低电平时，写选通信号可以为任何值，不过标准推荐写选通信号全0或保持上一次的值

2）窄传输（Narrow transfer）

当主设备产生一个数据宽度小于数据总线的传输时，地址和控制信号按照如何方式决定使用哪些字节线：

在INCR或WRAP突发模式中，每拍使用不同的字节线
在固定突发模式中，每拍使用相同的字节线

下面给出窄传输出字节线状态的两个示例，隐单元表示该字节线没有进行传输

Figure A3-8：

5 transfers, INCR Burst
start address 为0
each transfer size 为8bits
transfer的数据总线宽度为32bits

Figure A3-9

3 transfers
start address 为4
each transfer size 为23bits
transfer的数据总线宽度为64bits

3）字节不变性（Byte invariance）：

在访问单个存储器空间中的大小端混合数据时，AXI协议使用字节不变性大小端模式

字节不变性大小端模式是指：

数据元素使用相同连续的内存字节，而不管数据的大小端如何
大小端决定了存储器中的字节顺序，也就是说存储器中的第一个字节是数据元素的MSB还是LSB
字节传输时，只需要将字节传输到地址给定的位置，而不需要考虑该字节是数据元素的哪一部分

通常情况下，大多数小端组件可以直接连接到一个字节不变性接口，而只支持大端的组件则需要一个转换器

4）非对齐传输

AXI支持非对齐传输，对于任何数据宽度大于一个字节的突发传输而言，第一个字节的访问都可能是非对齐的。

一个主设备可以：

使用低位地址线发送一个非对齐的开始地址
提供对齐的开始地址，并使用字节选通信号线发送非对齐的开始地址

NOTE

低位地址线上的信息必须与字节选通信号提供的信息一致

对从设备无要求

下图显示了32位具有对齐和未对齐32位传输的INCR的示例，图中的每一行表示一次传输，阴影单元格表示未传输的字节

这几个示例表明未对齐的数据传输，第一个transfer在未对齐的位置上的数字使用通选信号使其无效
如何找到对齐的位置？正常传输时通选的数据，就是正常应该出现的位置
总而言之，按照对齐多传输第一个transfer的data，并把没对齐的地址的byte lane设为无效

3.4.5 读写响应结构

AXI协议提供了读写事务中的响应信号：

对于读事务，从设备在读数据通道（R）上发送响应信息，使用RRESP[1:0]信号
对于写事务，从设备在写响应通道（B）上发送响应信息，使用BRESP[1:0]信号

响应共有四种类型：

OKAY：一般访问成功。该信号表示一个一般访问成功，也表示一个独占访问失败
EXOKAY：独占访问成功
SLVERR：从设备错误。该信号表示向从设备的访问已成功，但从设备希望向原始主设备返回一个错误条件
DECERR：译码错误。通常由互联器生成，表示根据给定的事务地址找不到从设备

RRESP与BRESP的取值如下：

RRESP/BRESP[1:0]	响应
0b00	OKAY, normal access success
0b01	EXOKAY, exclusive access success
0b10	SLVERR, Subordinate error
0b11	DECERR, decode error

一些特性：

对于写事务而言，只有当整个突发事务结束时才会发出一个响应
对于读事务而言，从设备可以针对突发事务中的每个传输发送不同的响应
协议规定，指定数量的数据传输必须全部被执行，即使发生了错误

下面详细介绍不同的响应所对应的可能情况：

类型	可能出现的情况	备注
OKAY	1. 一个一般访问成功 2. 一个独占访问失败 3. 独占访问指定的从设备不支持独占访问	OKAY是大多数事物的响应
EXOKAY	1. 一个独占访问成功	此响应只能作为对独占读或写的响应给出
SLVERR	1. FIFO或缓冲区已满或已空 2. 尝试不支持的传输大小 3. 尝试写一个只读位置 4. 从设备超时 5. 试图访问已禁用或断电的功能	为了简化系统监控和调试，规范推荐这种错误响应只用于错误条件，而不用于除了事件外的一般通知，具体示例条件如左
DECERR	1. 当互联器不能成功解码找到从设备	规范推荐互联器此时路由到一个默认的从设备，并由该默认从设备返回DECERR响应 AXI协议要求事务中的全部数据传输必须都被完成，即使发生了错误，因此任何给定DECERR响应的组件满足这个需求

4: 事务属性

本章描述确定系统组件（如缓存、缓冲区和内存控制器）应如何处理事务的属性。它包含以下部分：

Transaction types and attributes
AXI3 memory attribute signaling
AXI4 changes to memory attribute signaling
Memory types
Mismatched memory attributes
Transaction buffering
Access permissions
Legacy considerations
Usage examples

4.1 事务类型和属性

从设备可以分为以下两种类型：

存储器：一个需要正确处理全部事务类型的存储器从设备
外设：一个外设从设备实现了定义的访问方法。通常，这被记载在组件的datasheet中。

NOTE 外设的undefined access

对于未定义的访问方法，外设从设备必须能够完成事务，但是规范并不要求从设备能够正确的完成所操作

它之要求从设备能够继续处理接下来的事务，这主要是为了避免系统发生死锁

因为外围从设备只有在定义的访问方法下才能正常工作，所以它可以拥有一组减少的接口信号

AXI协议定义了一系列支持存储器和外设从设备的事务属性，使用ARCACHE与AWCACHE信号来指示这些事务属性，他们控制：

一个事务如何穿过系统
任一系统级cache如何处理事务

这部分内容主要在下面两节：

AXI3 memory attribute signaling
AXI4 changes to memory attribute signaling

4.2 AXI3 存储器属性信号

在AXI3中，AxCache[3:0]指定了事务的：

可Buffer(Bufferable)
可Cache(Cacheable)
分配(Allocate)

AxCACHE	值	事务属性
[0]	0/1	不可Buffer/可Buffer
[1]	0/1	不可Cache/可Cache
[2]	0/1	不可读分配/可读分配
[3]	0/1	不可写分配/可写分配

AxCACHE属性详解：

AxCACHE[0], Bufferable (B) bit：
- 该位断言时，互联器或者其它任何组件都可以将事务到达其最终目的地的时间，延迟任意数量的周期
- 通常该属性仅与写请求相关
AxCACHE[1], Cacheable (C) bit
- 该位取消断言时，传输分配也被取消
- 该位断言时
  - 传输分配被允许，RA与RW将提供额外控制信息
  - 到达最终目的的事务特征，不必与原始特征相符
    - 对于写操作，这意味着可以将多个不同的写入合并在一起
    - 对于读操作，这意味着可以预取位置的内容，或者可以将单个提取的值分解为多个读取事务
AxCACHE[2], Read-Allocate (RA) bit
- 该位断言时，推荐事务进行读分配，但不是强制的
- 当不可Cache时，该位必须为0（取消断言）
AxCACHE[3], Write-Allocate (WA) bit
- 该位断言时，推荐事务进行写分配，但不是强制的
- 当不可Cache时，该位必须为0（取消断言）

4.3 AXI4 对存储器属性信号的变更

AXI4做出了如下变更：

AxCACHE[1] Cacheable重命名为可修改Modifiable
对于不可修改事务，定义了传输顺序要求
更新了读分配和写分配的含义

4.3.1 AxCACHE[1], Modifiable

在AXI4中，AxCACHE[1]位为Modifiable位

当该位为断言时，表示事务特征可修改
当改位为取消断言时，表示事务特征不可修改

NOTE Modifiable与Bufferable

该位仅仅是被重命名，因为新的名字能更好地描述该位的用途，而实际功能并未改变

下面介绍Non-modifiable与modifiable的含义：

1）Non-modifiable 事务

一个 Non-modifiable 事务由取消断言的Cache[1]确定

一个 Non-modifiable 事务不得拆分为多个事务或合并为一个事务，下表中的参数也不能被改变：

参数	信号
传输地址	AxADDR以及AxREGION
突发大小	AxSIZE
突发长度	AxLEN
突发类型	AxBURST
锁定类型	AxLOCK
保护类型	AxPROT

允许修改的内容：

AxCache信号仅被允许由可Buffer修改为不可Buffer，不允许其它的修改
事务ID和QoS可被修改
对于一个突发长度超过16的不可修改事务，可被分割为多个事务，产生的事务仍然必须满足上述要求，除了：
- AxLEN减小
- 生成的突发的地址被适当地调整
对于一个保持总访问字节数不变的独占的不可修改事务，允许修改AxSIZE与AxLEN

NOTE

存在一些无法满足不可修改事务需求的情况

例如：传输降级到更狭窄的总线时，事务的传输大小AxSIZE必须修改

一个组件可以包含自定义的机制来通知事务特征发生了修改，这有助于软件调试

2）Modifiable 事务

一个 modifiable 事务由断言的Cache[1]确定

一个 modifiable 事务允许修改的内容：

一个事务可以被分割为多个事务
多个事务可以被合并为一个事务
一个读事务可以进行预取操作
一个写事务可以访问比所需更大的地址范围，使用WSTRB信号以确保只有合适的位置被更新
在每个生成的事务中，下列信号可以被修改：
- 传输地址 AxADDR
- 突发大小 AxSIZE
- 突发长度 AxLEN
- 突发类型 AxBURST
- 传输ID和QoS可被修改
- 存储器属性AxCACHE可以被修改，但是：
  - 任何修改都必须确保事务的可见性不会因为阻止事务传播到所需的点或更改在Cache中寻找事务的需求而减少
  - 任何对于存储器属性的修改都必须与相同地址范围内的其它事务一致

下列特征不可以被修改：

锁定类型 AxLOCK
保护类型 AxPROT

修改的结果出现如下情况时是不允许的：

导致访问与原始事务不同的4KB地址空间
导致针对单次拷贝原子大小的区域的单次访问变为多次访问操作

3）不可修改事务的顺序要求

AXI4要求满足下列全部条件的任何事务集的顺序被保证：

事务是不可修改的
事务使用了相同的AXI ID
事务目标是相同的从设备

无论事务的地址是什么，只要事务目标是同一个从设备，事务顺序都必须被保证

注意：当读写通道上分别出现独立的事务时，如果一个事务在另一个事务的响应被收到后才发出，则顺序可以被保证，否则顺序不能被保证

4.3.2 更新后的读分配与写分配

在AXI4中：

读分配位表示事务中是否会发生分配
写分配位表示是否可能由于另一个事务而进行了分配

对于读事务，写分配位被重定义用来表示：

由于先前的写事务，该位置可能已经预先在Cache中分配（就像AXI3所定义的那样）
由于先前另一个主设备的行为，该位置可能已经预先在Cache中分配（AXI4的附加定义）

对于写事务，读分配位被重定义用来表示：

由于先前的读事务，该位置可能已经预先在Cache中分配（就像AXI3所定义的那样）
由于先前另一个主设备的行为，该位置可能已经预先在Cache中分配（AXI4的附加定义）

这样变更意味着：

如果AxCACHE[3:2]不等于00，事务必须在Cache中查找。
如果AxCACHE[3:2]等于00，事务不需要在Cache中查找。

新的AWCACHE定义如下：

名称	AXI4定义	描述
AWCACHE[3]	Allocate	当该位AWCACHE[3]有效时，事务必须首先在Cache中查找，因为它可能被预先分配。如果AWCACHE[2]有效，事务同样需要预先在Cache中查找。而如果这两位都为0，事务则不必查找Cache。规则推荐，该位有效时，在cache中分配。
AWCACHE[2]	Other Allocate	当该位有效时，事务必须首先在Cache中查找，因为它可能由于其它的事务，即读事务或来自另一个主设备的事务，在Cache中被预先分配。如果这两位都为0，事务则不必查找Cache，且该事务必须传到最终目的地。
AWCACHE[1]	Modifiable	当该位有效时，事务的特征可以修改，写事务可以被合并
AWCACHE[0]	Bufferable	当该位无效时，如果AWCACHE[3:2]为00，写响应必须来自最终目的端。当该位有效时，若AWCACHE[3:2]为00，写响应可以来自中间点，但写事务必须及时被最终目的端看到。当该位无效时，如果AWCACHE[3:2]不为00，写响应可以来自中间点，但写事务必须及时被最终目的端看到。当该位有效时，如果AWCACHE[3:2]不为00，写响应可以来自中间点，同时写传输可以不必被最终目的端看到

新的ARCACHE定义如下：

名称	AXI4定义	描述
ARCACHE[3]	Other Allocate	当该位有效时，事务必须首先在Cache中查找，因为它可能由于其它的事务，即写事务或来自另一个主设备的事务，在Cache中被预先分配，同样的，如果ARCACHE[2]有效，事务同样需要预先在Cache中查找
ARCACHE[2]	Allocate	当该位有效时，事务必须首先在Cache中查找，因为它可能被预先分配
ARCACHE[1]	Modifiable	当该位有效时，事务的特征可以修改，写事务可以被合并
ARCACHE[0]	Bufferable	当ARCACHE[3:1]为000时该位无用。当ARCACHE[3:2]为00且ARCACHE[1]为1时，若该位无效，则读取的数据必须来自最终目的端，否则可以来自一个指向该目的端正在处理的写事务。当ARCACHE[3]有效或ARCACHE[2]有效时，该位可以用来区分写穿和写回存储器类型

4.4 存储器类型

下列的表中给出了AxCACHE的编码含义，其中有的类型在读通道和写通道上拥有两种编码，其中括号内的是AXI3所采用的编码，其它则为AXI4所采用的编码，这主要是为了让AXI4具有向下兼容能力：

ARCACHE[3:0]	AWCACHE[3:0]	存储器类型
0000	0000	Device Non-bufferable
0001	0001	Device Bufferable
0010	0010	Normal Non-cacheable Non-bufferable
0011	0011	Normal Non-cacheable Bufferable
1010	0110	Write-Through No-Allocate
1110(0110)	0110	Write-Through Read-Allocate
1010	1110(1010)	Write-Through Write-Allocate
1110	1110	Write-Through Read and Write-Allocate
1011	0111	Write-Back No-Allocate
1111(0111)	0111	Write-Back Read-Allocate
1011	1111(1011)	Write-Back Write-Allocate
1111	1111	Write-Back Read and Write-Allocate

4.4.1 存储器类型具体要求

1）Device Non-bufferable

写响应必须来自最终目的地
读数据必须来自最终目的地
事务不可修改
不可预先读取，不可写合并

2）Device Bufferable

写响应可以来自中间节点
写事务必须在最终目的地可见
读数据必须来自最终目的地
事务不可修改
不可预先读取，不可写合并

NOTE Device

对于读事务Device Bufferable与Device Non-bufferable没区别

Device Bufferable与Device Non-bufferable都是内存不可修改的，因此Device memory与Non-modifiable memory叫法可以互换

4.5 匹配失败存储器属性

访问存储器相同区域的多个节点可以使用不同的内存属性，然而为保证功能正确性，必须遵守如下几条规则：

所有访问存储器相同区域的主设备都必须拥有该区域的一致性可Cache视图，表现为：
- 当寻址区域not Cacheable：所有主设备必须使用AxCACHE[3:2]均为00的事务
- 当寻址区域Cacheable：所有主设备必须使用AxCACHE[3:2]非00的事务
不同的主设备可以使用不同的可分配提示(hints)
如果一个寻址区域是Normal Non-cacheable，任何主设备都可用Device memory方式访问
如果一个寻址区域是可Bufferable，任何主设备使用Non-Bufferable的方式的事务都可以访问

NOTE

例如，一个事务需要来自最终目的地的响应，这个事务不允许bufferable行为

4.5.1 改变存储器属性

一个特定存储器区域的属性可以被改变，不过这需要一个合适的流程来执行，通常如下所示：

所有的主设备停止访问该区域
由单个主设备执行Cache所需的维护操作
所有的主设备使用新属性重启对该区域的访问

4.6 事务缓冲

对以下存储器类型，不要求一个来自最终目的地的响应，但需要事务在最终目的地的可见：

Device Bufferable
Normal Non-cacheable Bufferable
Write-Through

对写事务，上面三种memory类型应该有同样的行为

对读事务，上面三种应分别保证以下行为：

对于Devie Bufferable memory, 读数据必须来自最终目的地
对于Normal Non-cacheable Bufferable，读数据必须来自最终目的地，或者一个写事务（这个写事务在去向最终目的地的过程中）
对于Write-Through，读数据来自中间的cache副本

写事务除了要确保及时向最终目的地推进，中间的buffer应该需要满足：

An intermediate buffer that can respond to a transaction must ensure that, over time, any read transaction to
Normal Non-cacheable Bufferable propagates towards its destination. This propagation means that, when
forwarding a read transaction, the attempted forwarding must not continue indefinitely, and any data that is
used for forwarding must not persist indefinitely. The protocol does not define any mechanism for
determining how long data that is used for forwarding a read transaction can persist. However, in such a
mechanism, the act of reading the data must not reset the data timeout period

NOTE

如果没有这条要求，对同一位置的持续轮询可以防止buufer中的读取超时，从而阻止读事务在去向去向它目的地的过程

An intermediate buffer that can hold and merge write transactions must ensure that transactions do not remain
in its buffer indefinitely. For example, merging write transactions must not reset the mechanism that
determines when a write is drained towards its final destination

NOTE

如果没有此要求，对同一位置的连续写入可以防止buufer中的写入超时，从而阻止写事务在去向它目的地的过程

4.7 访问权限

AXI提供了访问权限信号用以阻止非法事务：

ARPROT[2:0]定义了读访问的访问权限
AWPROT[2:0]定义了写访问的访问权限

其中，信号定义如下：

AxPROT	值	功能
[0]	0	非特权访问
[0]	1	特权访问
[1]	0	安全访问
[1]	1	不安全访问
[2]	0	数据访问
[2]	1	指令访问

1）非特权与特权访问

AXI主设备可能会支持多个级别的权限操作，并把权限的概念扩展到内存访问。AxPORT[0]将访问标识为非特权或特权态

NOTE

某些处理器支持多级权限，具体参考所选处理器的文档，以确保到AXI级别的权限映射，AXI仅支持特权态与非特权态

2）安全与非安全访问

AXI主设备可能支持安全和非安全操作状态，并将此安全概念扩展到内存访问。AxPROT[1]将访问标识为安全或不安全

AxPROT[1]可以被视为定义了两个地址空间，一个安全地址空间和一个非安全地址空间。该信号可被视为附加地址位。必须正确处理安全和非安全地址空间之间的任何别名

NOTE

当该位被断言，事务被标识为不安全，这与arm安全扩展中的定义一致

3）指令与数据

此位表示事务是指令访问还是数据访问

在AXI协议规范中，该位仅仅是一种暗示，并不在所有情况下都准确。例如：若某个事务包含指令和数据的混合项，则推荐将该位设置为0，表示当前进行的是数据访问而不是指令访问

总而言之，本规范建议主设备将AxPROT设置为低，以指示数据访问或其他情况，只有在已知访问是指令访问时断言

4.8 遗留问题

AXI4在处理一些AxCACHE存储器属性时引入了额外的要求

在AXI4中，所有使用相同ID，目的从设备相同的设备事务都必须按序排列

NOTE 互联器与AxCACHE

这并不是AXI3的要求，任何依赖该行为的AXI4组件都不能连接到不支持该特性的AXI3互联器上

ARM相信大多数的AXI3互联器都支持所需的AXI4行为

该规范强烈推荐任何新的AXI3设计都应该实现AXI4的要求

对于AxCACHE位名和存储器类型名，AX3组件可以使用AXI3或AXI4的名字，AXI4必须使用AXI4的新术语

4.9 使用示例 Usage examples

4.9.1 设备内存类型的使用 Use of Device memory types

The specification supports the combined use of Device Non-bufferable and Device Bufferable memory types to
force write transactions to reach their final destination and ensure that the issuing Manager knows when the
transaction is visible to all other Managers.
A write transaction that is marked as Device Bufferable is required to reach its final destination in a timely manner.
However, the write response for the transaction can be signaled by an intermediate buffer. Therefore, the issuing
Manager cannot know when the write is visible to all other Managers.
If a Manager issues a Device Bufferable write transaction, or stream of write transactions, followed by a Device
Non-bufferable write transaction, and all transactions use the same AXI ID, the AXI ordering requirements force
all of the Device Bufferable write transactions to reach the final destination before a response is given to the Device
Non-bufferable transaction. Therefore, the response to the Device Non-bufferable transaction indicates that all the
transactions are visible to all Managers

NOTE

A Device Non-bufferable transaction can only guarantee the completion of Device Bufferable transactions that are issued with the same ID, and are to the same Subordinate device.

5: 事务ID

本章描述了支持无序事务完成的机制，以及支持多个未完成地址发布的机制：

AXI transaction identifiers
ID singals

5.1 AXI 事务标识符(identifiers)

AXI协议包含AXI ID transaction identifiers，主设备可以使用这个区分需要按序返回的事务

拥有相同ID的事务，应该保持顺序；具有不同ID的事务，不用保持顺序

这意味着单个物理端口可以支持乱序事务，并据此模拟出多个逻辑端口，其中每个端口都是按序端口

通过使用ID，主设备可以在前面事务未完成的时候就发送新的事务，这可以提升系统效率，因为这允许事务的并行处理

NOTE 主从设备不一定要使用AXI ID，只处理一个事务

这并没有要求主设备和从设备一定使用AXI事务ID

当主设备和从设备可以同时只处理一个事务，这意味着所有的事务都是按序的，同时从设备返回的BID和RID必须和主设备发出的AXI ID一致

5.2 ID signals

每一个事务通道都拥有自己的事务ID，如下表所示：

事务通道	事务ID
写地址通道	AWID
写数据通道，仅AXI3实现	WID
写响应通道	BID
读地址通道	ARID
读数据通道	RID

NOTE

AXI4协议支持基于AXI ID的扩展顺序模型（A6 AXI ordering model）

1）读数据顺序

从设备：需确保它返回的RID与它接收的ARID相匹配
互联器：必须确保主设备发出的一组具有相同ARID且目的是不同从设备的读数据，在接收时能按照发射的地址顺序接收
深度问题：
- read data reordering depth与slave中可以pending的address的个数相同，(也叫interleave depth) 。按顺序处理transaction的slave，等于read data reordering depth为1
- 主设备无法使用任何机制来确定从设备的read data reordering depth

2）写数据顺序

主设备：必须按照发送该事务的地址顺序，发送写数据
互联器：一个把来自不同主设备的不同写事务收集组合的连接器，必须确保按照地址顺序发送
Interleaving：AXI3允许来自不同ID交错写入数据，但在AXI4及更高版本不推荐使用，有关写入数据interleaving请参考该文档的F版本

3）互联器使用的事务ID

当主设备连接到连接器时，连接器会对主设备端口添加ARID, AWID 与 WID额外且唯一的扩展，这将导致两个后果：
- 主设备不知道其他主设备使用的ID，因为互联器将主设备发送过来的编号加到原始标识符，使得每个主设备使用ID唯一
- 从设备接口上的ID标识符比主设备上的ID标识符位要宽
对于读数据，互联器使用RID的附加位来确定读取数据的目标主设备，同时删除这些额外的附加位
对于写响应，互联器使用BID的附加位来确定接收响应的目标主设备，同时删除这些额外的附加位

补充内容：

其他内容

1）事务顺序

主设备可以使用AWID和ARID事务ID信号来表明它的顺序要求，具体情况如下：

来自不同主设备的事务是不需按序的

来自相同主设备但ID不同的事务是不需按序的

具有相同ARID的一系列读事务的数据传输必须按照主设备发出地址的顺序返回

具有相同AWID的一系列写事务的数据传输必须按照主设备发出地址的顺序返回

在AWID与ARID使用相同值的读写事务之间是不需按序的

注意：AXI3因为支持写数据交错，因此写数据通道中才含有WID信号，而在AXI4中，写数据的顺序必须和写地址的顺序一致，因此WID信号被移除

2）事务ID信号的宽度

事务ID信号的宽度可以任意定义，然而，规范推荐下列事务ID信号宽度：

主设备实现至多4bit的事务ID

互联器增加额外的至多4bit的事务ID用于支持多主端口

从设备实现8bit的事物ID信号支持

对于只支持单个按序接口的主设备，将事务ID信号置为一个常量，例如0，是可以接受的

对于不使用顺序信息而将所有事务按序处理的从设备而言，事务ID信号可以在不改变从设备功能的情况下被加入

3）遗留问题

大多数AXI3主设备不支持写交错，因此为了满足AXI4的要求不需要做任何改动，而支持写交错的AXI主设备必须要支持写交错深度的配置方法，通过将写交错深度设置为1来兼容AXI4

注意：任何需要WID信号的AXI3的组件都可以从AWID信号生成WID信号

6 AXI顺序模型(Ordering Model)

本章内容：

AXI ordering model overview
Memory locations and Peripheral regions
Transactions and ordering
Observation and completion definitions
Manager ordering guarantees
Ordering requirements
Response before the endpoint
Ordered write observation

6.1 顺序模型的概括

AXI 顺序模型基于AXI ID事务标识符（ARID or AWID），下面两条是顺序模型的基本模型

同一通道上具有相同ID和目标的顺序请求保持有序
具有相同ID的事务响应的返回与发出请求的顺序相同

顺序模型在以下关系中不提供以下之间的任何排序保证：

不同主设备之间
读写事务之间
不同ID的事务之间
去往不同外设域的事务之间
去往不同存储区的事务之间

无顺序保证时的顺序模型(a Manager requires ordering between transactions that have no ordering guarantee)：

如何一个主设备要求事务之间顺序，但没有保证机制，主设备则必须等待收到第一个事物的响应后，在发射第二个事务

6.2 存储区与外设域(Memory locations and Peripheral regions)

AMBA中的地址映射由存储区与外设域构成

一个存储区具有以下性质：

从一个存储区域读取一个字节，将返回写入该字节位置的最后一个值
对一个存储区域写入一个字节，会将该位置的值更新为通过后续读取该位置获得的新值
读取或写入内存区，对其他任何内存位置都没有副作用
为内存的每个区域都提供观察保证
内存区的大小等于该组建的single-copy atomicity大小

一个外设域具有以下性质：

从外设域中的地址读取，不一定返回写入该地址的最后一个值
对外设域写入一个字节，不一定会将该处的值更新为通过后续读取时获得的新值
访问外设域内的地址可能会对该区域内的其他地址产生副作用
为外设的每个区域都提供观察保证
外设域的大小由实现定义，但它必须包含在单个从组件中

6.3 事务与顺序(transaction and ordering)

transaction事务是对一个或多个地址位置的读取或写入

location位置由AxADDR和任何相关限定符（如AxPROT中的非安全位）确定

顺序排序规则：

仅在访问同一存储区与外设区域之间，提供顺序保证
到外设域的事务必须完全包含在该区域内
跨多个内存区的事务具有多个排序保证

事务可以是Device类型或者Normal类型：

Device transaction
- 读写时AxCACHE[1]已取消断言
- Device类型的事务可以访问内存区或外设域
Normal transaction
- 读写时AxCACHE[1]已断言
- Normal类型的事务用于访问内存区，并不会用来访问外设域
- 一个对外设域的Normal的正常访问，必须以符合协议的方式来完成，但结果是根据具体实现定义的（自定义的）

写入transaction：

写入事务可以是Non-bufferable 或 Bufferable。可以向可缓冲写入发送早期响应
- Non-bufferable transaction AxCACHE[0]已取消断言
- Bufferabletransaction AxCACHE[0]已断言

6.4 观察与完成的定义(Observation and completion definitions)

DRW：a Device read or write access
DW：a Device write
DR：a Device read
W：a write
R：a read

1）观察

对于外设域的访问，当DRW1在DRW2前到达从组件时，DRW1应被DRW2观察到

对于内存区的访问，下面所有条件均适用：

如果W2如果在W1后才生效，则W1应被W2观察到
如果R1返回数据来自于W3，且W2在W3后生效，R1应被W2观察到
如果R2返回数据来自W1，或在W1后的W3时，W1应被R2观察到

其中：

R1或W1可以是Device或Normal类型

2）完成

写完成响应：

当前周期时，相关BRESP握手信号给出，并且BVALID与BREADY信号被断言

读完成响应：

当前周期时，最后一个相关RDATA握手信号给出，并且RLAST, RVALID与RREADY信号被断言

6.5 主设备顺序保证

有三种类型的主设备顺序保证：

在一个完整响应接受前的，可观察性保证
来自一个完整响应的，可观察性保证
响应顺序保证

6.5.1 一个完整响应接受前的，可观察性保证

来自同一主设备并且ID相同的事务的保证：

DW1应保证比DW2早到达目的地，在DW2与DW1都发向同一外设域且发射晚于DW1时
DR1应保证比DR2早到达目的地，在DR2与DR1都发向同一外设域且发射晚于DR1时
W1应保证被W2观察到，在W2与W1都发向同一存储区且发射晚于W1时
W1应保证被R2观察到，在R2与R1都发向同一存储区且发射晚于R1时

这些保证意味着，在Device 与 Normal发送向同一存储区的过程中，是顺序的

6.5.2 来自一个完整响应的，可观察性保证

一个完整响应的保证以下：

对一个读请求的完整响应保证：主设备发出的所有后续读写请求都是可观察的
对一个写请求的完整响应保证：主设备发出的所有后续读写请求都是可观察的。这种可观察性是一个multi-copy atomic 的必要条件

包含符合Arm体系结构的处理器，必须是multi-copy atomic，也就是说Multi_Copy_Atomicity属性必须为TRUE

对于Bufferable写请求的响应可以来自于中间节点。它并不能保证在终点处完成，只能保证对未来的事务可观察的

6.5.3 响应顺序保证

事务响应具有以下所有的顺序保证：

R1应保证在R2之前收到响应
- R1 R2 ID相同
- R2紧随R1
- 从同一个主设备发射
W1应保证在W2之前收到响应
- W1 W2 ID相同
- W2紧随W1
- 从同一个主设备发射

6.6 顺序要求

为满足主设备的顺序保证，这里对从设备和连接器做了具体要求

6.6.1 从设备顺序保证

For Peripheral locations, the execution order of transactions to Peripheral locations is IMPLEMENTATION DEFINED. This execution order is typically expected to match the arrival order, but that is not a requirement.

For Memory locations:

A write W1 must be ordered before a write W2 with the same ID, to the same Memory location, where W2 is received after W1 is received.
A write W1 must be ordered before a write W2 to the same Memory location, where W2 is received after the completion response for W1 is given.
A write W1 must be ordered before a read R2 to the same Memory location, where R2 is received after the completion response for W1 is given.
A read R1 must be ordered before a write W2 to the same Memory location, where W2 is received after the completion response for R1 is given.

Response ordering requirements:

The response to read R1 must be returned before the response to a read R2, where R2 is received after R1 with the same ID.
The response to write W1 must be returned before the response to a write W2, where W2 is received after W1 with the same ID

6.6.2 连接器顺序保证

An interconnect component has the following attributes:

A request is received on one port and is either issued on a different port or responded to.
A response is received on one port and is either issued on a different port or consumed.

When the interconnect issues requests or responses, it must adhere to the following requirements:

A read R1 request must be issued before a read R2 request, where R2 is received after R1, with the same ID and to the same or overlapping locations.
A write W1 request must be issued before a write W2 request, where W2 is received after W1, with the same ID, to the same or overlapping locations.
A Device read DR1 request must be issued before a Device read DR2 request, where DR2 is received after DR1, with the same ID and to the same Peripheral region.
A Device write DW1 request must be issued before a Device write DW2 request, where DW2 is received after DW1, with the same ID and to the same Peripheral region.
A read R1 response must be issued before a read R2 response, where R2 is received after R1, with the same ID.
A write W1 response must be issued before a write W2 response, where W2 is received after W1, with the same ID.

When the interconnect is acting as a Subordinate component, it must also adhere to the Subordinate requirements. Any manipulation of the AXI ID values that are associated with a transaction must ensure that the ordering requirements of the original ID values are maintained.

6.7 终点之前发出响应

为了提高系统性能，任何中间组件可以对某些事务发出响应。这一行动被称为提前响应。发布早期响应的中间组件必须确保满足可见性和顺序保证性

6.7.1 早期读响应

For Normal read transactions, an intermediate component can respond with read data from a local memory if it is
up-to-date with respect to all earlier writes to the same or overlapping address. In this case, the request is not
required to propagate beyond the intermediate component.
An intermediate component must observe ID ordering rules, which means a read response can only be sent if all
earlier reads with the same ID have already had a response

6.7.2 早期写响应

For Bufferable write transactions, an intermediate component can send an early write response for transactions that
have no downstream observers. If the intermediate component sends an early write response, the intermediate
component can store a local copy of the data, but must propagate the transaction downstream, before discarding that
data.
An intermediate component must observe ID ordering rules, that means a write response can only be sent if all
earlier writes with the same ID have already had a response.
After sending an early write response, the component must be responsible for ordering and observability of that
transaction until the write has been propagated downstream and a write response is received. During the period
between sending the early write response and receiving a response from downstream, the component must ensure
that:

If an early write response was given for a Normal transaction, all subsequent transactions to the same or
overlapping Memory locations are ordered after the write that has had an early response.
If an early write response was given for a Device transaction, then all subsequent transactions to the same
Peripheral region are ordered after the write that has had an early response.

When giving an early write response for a Device Bufferable transaction, the intermediate component is expected
to propagate the write transaction without dependency on other transactions. The intermediate component cannot
wait for another read or write to arrive before propagating a previous Device write.

A6.8 有序写入观察(Ordered_Write_Observation)

为了提升接口对不同顺序模型接口协议的兼容性，规范提供了Ordered_Write_Observation属性，该属性可针对单个接口设置为True或False：

True：说明该端口拥有该属性
False：说明该接口不支持该属性
如果未声明Ordered_Write_Observation，则认为它为False

Ordered_Write_Observation接口，为不依赖目标或地址的写事务提供了保证：

W1应保证被W2观察到
- W1 W2 ID相同
- W2紧随W1
- 从同一个主设备发射

主设备在使用生产者-消费者顺序模型，连接到Ordered_Write_Observation的从设备时，无需等待来自早期写入的完成响应

7 原子访问(Atomic Accesses)

本章介绍AXI4 single-copy atomicity size、AXI 协议如何实现独占和锁定的机制：

Single-copy atomicity size
Exclusive accesses
Locked accesses
Atomic access signaling

7.1 单拷贝原子大小(Single-copy atomicity size)

AXI4协议引入了单拷贝原子大小的概念，这个术语定义了一个事务原子更新的最小字节数。AXI4协议要求大于一个单拷贝原子大小的事务必须更新至少为单拷贝原子大小的内存块

NOTE

原子性并不定义数据更新的确切时刻。必须确保的是，没有一个主设备可以观察到原子数据的部分更新形式

例如，在使用许多系统数据结构例如由32bit原子元素构成的链表时，针对这些元素的原子更新操作必须同时更新整个32bit的值，任何一个主设备在某个时刻只观测到其中的16bit发生更新，而在另一个时刻观测到另外16bit发生更新的的这一行为是不可接受的

更复杂的系统要求支持更大的原子元素，特别是64bit原子元素，以便主设备可以使用基于更大原子元素的数据结构通信

系统所支持的单拷贝原子大小非常重要，因为给定通信中设计的所有组件都必须支持苏偶像的原子元素大小。如果两个主设备正在通过互联器和同一个从设备通信，则所有涉及到的组件都必须确保所需大小的事务被原子对待

AXI4协议不要求特定的单拷贝原子大小，系统可以支持不同的单拷贝原子大小

对于组内通信，不同的组件组可以拥有不同的单拷贝原子大小，在AXI4中，单拷贝原子组这一术语指的是一组可以以特定的原子性进行通信的组件

下图展示了如下的一个系统：

处理器、DSP、DRAM控制器、DMA控制器、外设、SRAM以及关联的互联器都在一个32bit的单拷贝原子组中
处理器、DSP、DRAM控制器以及关联的互联器同时也在一个64bit的单拷贝原子组中

事务的原子性只有在它的起始地址正确对齐时才能得到保证，例如，对于一个64bit的单拷贝原子组来说，如果突发事务的地址没有对齐到8字节边界，那么该事务就没有任何64bit单拷贝原子保证。

事务的字节选通信号不会影响单拷贝原子大小

7.1.1 多拷贝写原子性(Multi-copy write atomicity)

要指定一个系统提供多拷贝原子性，必须定义Multi_Copy_Atomicity属性。

True，则该系统拥有这个能力
False，则该系统不拥有这个能力
未定义时默认为False

如果以下条件满足，则可以说明一个系统具有多拷贝原子性：

针对同一个位置的写操作可以被所有的代理以相同的顺序观察到
对于一个除发出者外的代理可以观测到的写操作而言，其它的代理也都能观测到

多拷贝原子性可以通过如下手段来保证：

对于一个给定的地址使用单点序列化（POS, Point of Serialization），这样针对相同位置的全部访问操作都可以按序处理器，必须确保在该位置的新值针对任何代理都可见之前将被Cache的一致性拷贝全部无效化
避免在代理的上游使用前向Buffer，这可以避免一个Buffer写操作在对全部代理可见前对某些代理可见

NOTE

如果一个系统使用了ARM v8架构处理器，则该系统必须拥有Multi_Copy_Atomicity属性。该属性用来支持获取加载和释放存储指令，释放存储指令要求存储操作是多拷贝原子性的

7.2 独占访问(Exclusive accesses)

独占访问机制提供了信号量类型(semaphore-type)的操作，利用该机制时不需要在整个访问周期内让总线被一个主设备所独占，这意味着信号量类型操作不会影响总线访问延迟以及最大可实现带宽

AxLOCK信号选择独占访问：

RRESP表示独占读操作的成功与否
BRESP表示独占写操作的成功与否

从设备要求额外的逻辑实现独占访问

当主设备访问一个不支持独占访问的从设备时，AXI协议提供了一种机制用来通知该主设备其所访问的从设备不支持独占访问操作

7.2.1 独占访问过程

独占访问的基本机制如下：

主设备在给定地址上执行独占读事务
过一段时间后，主设备尝试在相同的地址上执行独占写事务，这会导致独占读事务的完成，同时，独占写事务的AWID与独占读事务的ARID相同
如果从执行独占读事务开始没有其它主设备写相同的位置，独占写事务将会更新存储器，并返回成功信号，否则会返回失败信号

主设备或许不会完成独占事务的写部分，独占访问监视硬件对于每一个事务ID只会监视一个地址。如果一个主设备没有完成独占事务的写部分，接下来这个主设备又以相同的事务ID对另一个地址发起了独占读事务，则独占访问监视的地址就会被改变

7.2.2 主设备视角看待独占访问

一个主设备通过执行一个独占读事务的方式开始一个独占操作，如果事务成功，从设备就会返回EXOKAY响应，表示从设备已经记录了要监视的地址

如果主设备尝试向不支持独占访问的从设备发出独占读事务请求，从设备会返回OKAY响应而不是EXOKAY响应

NOTE

主设备可以将OKAY响应作为独占访问不支持的错误响应看待，规范推荐主设备接下来不要执行独占操作的写部分

在独占读操作之后的一段时间后，主设备尝试对相同位置发起独占写事务：

如果从独占读事务开始时到现在对应地址的内容始终没有发生改变，独占写操作就会成功，从设备返回EXOKAY响应，并更新对应的存储器位置
否则，独占写操作就会失败，从设备返回OKAY响应而不是EXOKAY响应，独占写操作不会更新对应的存储器位置

主设备或许不会完成独占操作的写部分，如果发生了这种情况，从设备将会继续监视独占访问的地址直到针对该从设备的另一个独占读事务启动一个新的独占访问序列

主设备在独占访问序列的读部分完成后才会开始独占访问序列的写部分

7.2.3 从设备视角看待独占访问

不支持独占访问的从设备可以忽略AxLOCK信号，这样的从设备对于一般和独占访问都必须提供OKAY响应信号

支持独占访问的从设备必须拥有监视硬件，规范推荐对于每一个支持独占的事务ID而言都准备一个监视单元。ARM规范参考手册，ARMv7-A和ARMv7-R版本定义了一种独占访问监视器：

一个单端口的从设备可以拥有一个外接的独占访问监视器
一个多端口的从设备则或许需要实现内部监视器

独占访问监视器需要记录任何独占读操作的地址和ARID，然后需要监视指定的位置，直到：针对该位置的写操作发生，或使用相同ARID的另一个独占读操作复位监视器并将地址设置为另一个值

当从设备接收到一个独占写事务时，监视器就会根据给定的AWID检查指定的地址是否被监视，如果是，这表示从独占读操作开始以来没有发生写操作，然后就会处理写操作并完成整个独占访问过程，返回EXOKAY响应，并更新存储器

如果在进行独占写时，地址不再被相同AWID的监视硬件监视，则表明发生了下列情况之一：

在独占读访问事务发起之后，对应的位置的内容被更新
监视器的地址被另一个独占读事务重置修改

在以上两种情况中，独占写事务都不会更新对应的存储器位置，从设备必须返回OKAY而不是EXOKAY响应

7.2.4 独占访问的限制

独占访问存在以下限制：

独占写操作的突发大小和突发长度，必须与其对应的独占读操作一致
独占访问的地址必须对齐到事务的总字节数，也就是突发大小与突发长度的乘积
独占读与独占写事务的地址必须一致
独占读事务的ARID必须与独占写事务的AWID一致
独占读和独占写事务的控制信号必须一致
独占访问突发传输的字节数必须是2的幂，即1、2、4、8、16、32、64或128字节
独占访问突发传输的最大字节数为128字节
在AXI4中，独占访问的突发长度不能超过16
AxCACHE信号的值必须保证监视独占访问的从设备可以看到事务。例如，独占访问事务的AxCACHE的值一定不表示事务是可Cache的
domain必须是Non-shareable或System-shareable的
事务类型必须是 ReadNoSnoop 或 WriteNoSnoop

不遵守这些限制将会导致不可预测的结果。

在独占操作过程中监视的最小字节数由事务的突发长度和突发大小所定义，而从设备可以选择监视更大的字节数（最大不超过128字节），但当相邻的字节被更新时，这会导致本应成功的独占访问操作变为失败状态

为了将独占读取和独占写入是为同一独占访问序列的一部分，以下信号对于两种传输必须相同：

AxID
AxADDR
AxREGION
AxLEN
AxSIZE
AxBURST
AxLOCK
AxCACHE
AxPROT
AxDOMAIN
AxSNOOP
AxMMUSECSID
AxMMUSID
AxMMUSSIDV
AxMMUSSID
AxMMUATST

7.2.5 对独占访问的响应

一般访问：

RRESP与BRESP响应信号在表示一般访问成功时使用OKAY信号

独占访问：

RRESP与BRESP响应信号在表示独占访问成功时使用EXOKAY信号，这意味着不支持独占访问的从设备会使用OKAY信号表示独占访问操作的失败

NOTE

针对不支持独占访问从设备的独占写操作总会更新存储器

针对支持独占访问从设备的独占写操作只有在独占写操作成功时才会更新存储器

一个独占写操作会收到一个BRESP响应，且信号可以是OKAY , EXOKAY , SLVERR or DECERR

一个独占读操作会收到一个或多个响应。这些响应可能是EXOKAY , SLVERR and DECERR信号的混合，或者OKAY , SLVERR and DECERR信号的混合。EXOKAY与OKAY在一个事务内的混合是不被允许的

7.3 锁定访问

AXI4不支持锁定事务，而AXI3实现则必须支持锁定事务

NOTE

AXI4由于以下原因移除了锁定事务的支持：

大多数组件不需要锁定事务

锁定事务的实现会对互联器的复杂度以及QoS保证能力造成显著的影响

互联器：

当主设备使用AxLOCK信号表示当前事务是一个锁定事务时，互联器就必须确保只有当前主设备可以访问目标从设备区域，直到该主设备发出解锁事务为止，互联器的仲裁器必须强制执行此限制
任何携带AxLOCK信号的事务都是锁定事务，这会强制互联器锁定接下来的事务，因此，一个锁定序列只有当主设备发出无AxLOCK信号事务时才会终止，这个终止事务包含在锁定序列中并实际上移除了锁

主设备：

在主设备开始读事务或写事务的锁定序列前，该主设备必须确保没有其它等待完成的事务
在即将完成锁定序列时，必须首先确保所有的锁定事务都已经完成，然后才能发出终止解锁事务，并必须确保在进行接下来的任何事务之前该解锁事务已经执行完成
主设备必须确保一个锁定序列中的全部事务都拥有相同的AxID值

NOTE

锁定访问事务需要互联器在锁定序列进行中时避免任何其它的事务发生，这会对互联器的效率产生影响，因此，该规范推荐锁定访问事务只用于支持早期设备

该规范推荐下列的限制（但不是强制性的）：

在单个4KB地址域内保持任何锁定事务序列
将任何锁定任务序列限制为两个事务

7.4 原子访问信号

在AXI3中，AxLOCK信号用于指定一般、独占和锁定访问，下表为AXI3规范对于AxLOCK信号的编码：

AxLOCK[1:0]	访问类型
00	一般访问
01	独占访问
10	锁定访问
11	保留

AXI4移除了锁定事务，仅使用1bit锁定信号，下表为AXI4规范对于AxLOCK信号的编码：

AxLOCK	访问类型
0	一般访问
1	独占访问

7.4.1 遗留问题

在AXI4环境中，任何AXI3锁定事务可以按照下列方式被转换为一般事务：

AWLOCK[1:0] = 10被转换为一般写事务，AWLOCK = 0
ARLOCK[1:0] = 10被转换为一般读事务，ARLOCK = 0

该规范推荐任何组件执行这样的转换，一般是在互联器中包含一个可选的机制用于检测和标记这样的事务发生

如果某些组件执行了这样的转换后不能正确工作，则这样的组件不能在AXI4环境中使用

NOTE

对于许多早期使用锁定事务的例子，例如SWP指令的执行，或许需要通过修改软件的方式来避免使用强制使用锁定事务的指令

8 AMBA4 附加信号

本章介绍AMBA 4中引入的附加信令，以扩展AXI接口的应用，包括：

QoS signaling
Multiple region signaling
User-defined signaling

8.1 QoS信号

8.1.1 QoS接口信号

AXI4信号集支持两个4bit的QoS标识符：

AWQOS：一个4bit的QoS标识符，在每次写事务中由写地址通道发送
ARQOS：一个4bit的QoS标识符，在每次读事务中由读地址通道发送

协议并没有指定QoS标识符的精确使用方法，规范推荐AxQOS的值用于优先级指示器，更大的值表示更高优先级的事务

当使用默认值0000时表示接口不参与任何QoS方案

8.1.2 主设备注意事项

一个主设备可以产生自己的AxQOS值，如果它可以产生多个传输流，则可以为这些流分配不同的QoS值

为了支持QoS，需要对正在使用的QoS方案有系统级的理解，同时需要全部的组件之间互相配合，因此，规范推荐主设备组件支持精确控制QoS值的机制用于任何给定的场景

如果主设备组件不支持任何可编程的QoS方案，则它可以使用QoS值代表事务的相对优先级，然后可以将这些值映射到备用的系统级QoS值

不能产生AxQOS值的主设备必须使用默认值

NOTE

规范期望一些互联组件实现一些可编程寄存器，这些寄存器可以用于分配QoS值到连接的主设备，覆盖掉主设备原先的QoS值

8.1.3 系统注意事项

AXI4中定义的QoS信号可以用于任何兼容的系统级QoS方法

QoS默认的系统级实现是，任何组件可以选择处理多个事务时，都会选择QoS值较高的事务优先处理。这个选择仅当没有其他要求事务需要按特定顺序处理的约束时才会发生

NOTE

这意味着AXI顺序规则优先于QoS

可以实现兼容默认方案的更复杂的QoS方案

8.2 REGION 多区域信号（可选）

8.2.1 附加接口信号

AXI4接口信号集支持两个4bit区域标识符（可选）：

AWREGION：一个区域标识符，在每次写事务中由写地址通道发送
ARREGION：一个区域标识符，在每次读事务中由读地址通道发送

4bit位宽：4bit区域标识符可以用于唯一地标识多达16个不同的区域，区域标识符可以提供更高阶的地址位译码，但在任何4KB地址空间内必须保持不变

作用：区域标识符的使用意味着从设备的单个物理接口可以提供多个逻辑接口，每一个都位于系统地址映射中的不同位置，区域标识符的使用也意味着从设备必不支持不同逻辑接口间的地址译码

互联器：这个协议期望互联器在为拥有多个逻辑接口的单个从设备执行地址译码功能时产生AxREGION信号，如果一个从设备在系统地址映射中只有一个物理接口，则互联器必须使用默认的AxREGION值

从设备：

从设备必须确保两个位于不同区域但拥有相同的AXI ID的事务以正确地顺序响应
如果从设备实现的区域少于16个时，从设备必须确保在任何主设备尝试访问不支持的区域时给出正确的协议信号，而这需要具体实现自行定义，例如，从设备或许需要通过下列方式来确保上述事宜：
- 对于任何访问不支持区域的事务提供一个错误响应
- 为所有不支持的区域分配支持区域的别名，以确保响应符合协议

AxREGION信号仅提供了对从设备可使用的现存地址空间的地址译码功能，以消除对地址译码功能的需求，这个信号并没有创建新的独立地址空间

AxREGION只能出现在地址译码功能的下游接口上

8.3 用户定义信号

在AMBA4中引入了用户定义的信号。对于AMBA5，使这些信号的用和配置会进一步解释。

AXI接口可以包括一组用户定义的信号，称为用户信号。如果存在现有AMBA规范未涵盖的要求，则可以使用这些信号来增加事务的信息

信息可以添加到：

一个请求事务
一个响应事务
事务中读或写数据的每一拍

一般情况下，规范推荐用户不使用用户信号，因为AXI协议并没有定义这些信号的功能，贸然使用可能会导致两个组件之间出现互操作性的问题，因为两个组件可能以不兼容的方法使用了相同的用户信号

8.3.1 用户定义的信号设置

用户定义信号与其位宽由以下属性值所指定：

NAME	Max	Applies
USER_REQ_WIDTH	128	AWUSER, ARUSER
USER_DATA_WIDTH	DATA_WIDTH/2	BWUSER, BRUSER
USER_RESP_WIDTH	16	BUSER, RUSER

如果某一属性值为0，则表哦名该信号不存在在该接口上

最大值仅供参考，以便为可配置接口设置合理的最大值

以下接口类型可以包括用户信号：

ACE5
ACE5-Lite
ACE5-LiteDVM
ACE5-LiteACP
AXI5
AXI5-Lite

8.3.2 信号命名

每个AXI4通道定义的用户信号名称如下：

AWUSER：写地址通道用户信号
ARUSER：读地址通道用户信号
WUSER：写数据通道用户信号
RUSER：读数据通道用户信号
BUSER：写响应通道用户信号

Signal	Width	Description
ARUSER	USER_REQ_WIDTH	用户定义的读请求属性它与其他AR信道信号具有相同的有效性要求
AWUSER	USER_REQ_WIDTH	用户定义的写请求属性它与其他AW信道信号具有相同的有效性要求
WUSER	USER_DA TA_WIDTH	用户定义的写数据属性这与其他W通道信号具有相同的有效性要求
RUSER	USER_DA TA_WIDTH + USER_RESP_WIDTH	用户定义的读数据和响应属性这与其他R通道信号具有相同的有效性要求
BUSER	USER_RESP_WIDTH	用户定义的写响应属性这与其他B通道信号具有相同的有效性要求

8.3.3 使用问题

协议并不要求所有通道都支持用户信号

（规范推荐互联器包含用户信号，并没有要求主设备和从设备包含用户信号）

（规范推荐互联组件包含用户信号的支持，以便互联组件可以将用户信号在主设备和从设备之间传送，用户定义信号的宽度是具体实现定义的，对于每个通道都可以是不同的）

为了协助数据宽度和协议转换，本规范建议：

USER_DA TA_WIDTH为数据总线宽度的整数倍（字节）
用户响应位对于读或写响应的每一拍都是相同的值
RUSER的低位用于传输每个事务的响应信息
RUSER的高位用于传输每拍读取的数据信息

9 默认信号和互操作性

AXI协议并不要求一个组件使用AXI接口的完整可用信号集。为了帮助连接不使用每个信号的组件，本章定义了接口的主要类别以及适用于每个类别的限制。它包含以下部分：

Interoperability principles
Major interface categories
Default signal values on page A9-110

A9.1 互操作性原则

下列互操作性原则针对AXI3和AXI4组件

作为一个一般性原则，组件必须支持全部的输入组合，但不必生成全部的输出组合

例如：从设备必须支持不同可能突发长度，但主设备可以只生成它所用的突发类型，这个策略保证全部的组件都能配合其它的组件工作

AXI接口可以省略信号的条件如下：

可选输出：
- 如果一个组件所需的值不与默认值匹配，组件就必须拥有其对应的输出信号
- 如果一个组件总是需要默认值，则不需要组件存在实际的信号
可选输入：
- 如果一个信号不需要被主设备或从设备观测，功能也能正确执行，则该输入信号是可以忽略的

NOTE

互联组件在合适的时候也可以忽略信号

例如，当一个信号仅输出默认值，则该信号就不需要被互联器转发，该信号可以直接在其目的端生成

类似地，如果一个信号不被任何目的端所使用，那么就不需要互联器转发该信号

A9.2 主要接口类别

A9.2.1 读写接口

读写接口包含下列AXI通道：

AR：读地址通道
R：读数据通道
AW：写地址通道
W：写数据通道
B：写响应通道

A9.2.2 只读接口

只读接口仅支持读事务，因此只包含下述通道：

AR：读地址通道
R：读数据通道

NOTE

只读接口不支持独占访问

A9.2.3 只写接口

只写接口仅支持写事务，因此只包含下述通道：

AW：写地址通道
W：写数据通道
B：写响应通道

NOTE

只写接口不支持独占访问

A9.2.4 存储器从设备和外设从设备

AXI从设备分为：

存储器从设备
外设从设备

存储器从设备必须正确地处理全部事务类型

外设从设备：

规范期望，外设从设备应拥有一个定义的访问方法
- 该方法建立了可以用于访问设备的事务类型以及对设备访问方式的限制
- 通常定义的访问方法在组件的datasheet中描述
- 任何未定义的访问方法或许都会造成外设从设备失败，但规范期望以协议兼容的失败-安全方法(protocol-compliant fail-safe manner )完成访问以避免系统死锁，但不要求外设从设备继续进行正确的操作
因为只有当使用外设定义的访问方法时才要求外设正常工作，因此外设从设备可以拥有接口信号的极小子集

NOTE

规范期望所有外设都应支持事务子集，允许使用可在C代码中指定的访问来控制外围设备

例如：可以支持单个8位、单个16位或单个32位对齐的事务

并不存在要求支持的最小子集，因为每个组件支持的事务子集都可以不同

例如：一个外设可能只支持16bit访问事务，但另一个外设只支持32bit访问事务

9.3 默认信号值

规范建议，一般而言，为了最大限度地重用IP，一个AXI组件接口包含所有的信号，这样就降低了设计流程中系统集成阶段出现错误的风险，它还可以帮助一些不能有效支持缺少信号的默认值的设计流程

以下各节提供了有关默认信号要求的更多信息：

Manager addresses
Subordinate addresses
Memory Subordinates
Write transactions
Read transactions
Response signaling
Non-secure and Secure accesses

下列的几个表展示了AXI强制和可选的信号，以及给出了可选信号未实现时的默认值

1）Master AW/W Channel 主接口写通道信号和默认值

信号	描述	方向	是否强制	默认值
ACLK	公共时钟	输入	强制	-
ARESETn	公共复位	输入	强制	-
AWID	写地址ID	输出	可选	全0
AWADDR	写地址	输出	强制	-
AWREGION	写区域	输出	可选	全0
AWLEN	突发长度	输出	可选	全0，长度1
AWSIZE	突发大小	输出	可选	数据总线宽度
AWBURST	突发类型	输出	可选	01，递增模式
AWLOCK	锁定类型	输出	可选	全0，一般访问
AWCACHE	Cache类型	输出	可选	0000
AWPROT	保护类型	输出	强制	-
AWQOS	QoS值	输出	可选	0000
AWVALID	写地址有效	输出	强制	-
AWREADY	写地址准备好	输入	强制	-
WDATA	写数据	输出	强制	-
WSTRB	写字节使能	输出	可选	全0
WLAST	写最后	输出	强制	-
WVALID	写有效	输出	强制	-
WREADY	写准备好	输入	强制	-
BID	响应ID	输入	可选	-
BRESP	写响应	输入	可选	-
BVALID	写响应有效	输入	强制	-
BREADY	响应准备好	输出	强制	-

2）Memory Slave AW/W/B Channel 存储器从接口写通道信号和默认值

信号	描述	方向	是否强制	默认值
ACLK	公共时钟	输入	强制	-
ARESETn	公共复位	输入	强制	-
AWID	写地址ID	输入	强制	-
AWADDR	写地址	输入	强制	-
AWREGION	写区域	输入	可选	-
AWLEN	突发长度	输入	强制	-
AWSIZE	突发大小	输入	强制	-
AWBURST	突发类型	输入	强制	-
AWLOCK	锁定类型	输入	可选	-
AWCACHE	Cache类型	输入	可选	-
AWPROT	保护类型	输入	可选	-
AWQOS	QoS值	输入	可选	-
AWVALID	写地址有效	输入	强制	-
AWREADY	写地址准备好	输出	强制	-
WDATA	写数据	输入	强制	-
WSTRB	写字节使能	输入	强制	-
WLAST	写最后	输入	可选	-
WVALID	写有效输入	输入	强制	-
WREADY	写准备好	输出	强制	-
BID	响应ID	输出	强制	-
BRESP	写响应	输出	可选	00，OKAY
BVALID	写响应有效	输出	强制	-
BREADY	响应准备好	输入	强制	-

3）Master AR/R Channel 主接口读通道信号和默认值

信号	描述	方向	是否强制	默认值
ARID	读地址ID	输出	可选	全0
ARADDR	读地址	输出	强制	-
ARREGION	读区域	输出	可选	0x0
ARLEN	突发长度	输出	可选	全0，长度1
ARSIZE	突发大小	输出	可选	数据总线宽度
ARBURST	突发类型	输出	可选	01，递增模式
ARLOCK	锁定类型	输出	可选	全0，一般访问
ARCACHE	Cache类型	输出	可选	0000
ARPROT	保护类型	输出	强制	-
ARQOS	QoS值	输出	可选	0000
ARVALID	读地址有效	输出	强制	-
ARREADY	读地址准备好	输入	强制	-
RID	读数据ID	输入	可选	-
RDATA	读数据	输入	强制	-
RRESP	读响应	输入	可选	-
RLAST	读最后	输入	可选	-
RVALID	读有效	输入	强制	-
RREADY	读准备好	输出	强制	-

4）Memory Slave AR/R Channel 存储器从接口读通道信号和默认值

信号	描述	方向	是否强制	默认值
ARID	读地址ID	输入	强制	-
ARADDR	读地址	输入	强制	-
ARREGION	读区域	输入	可选	-
ARLEN	突发长度	输入	强制	-
ARSIZE	突发大小	输入	强制	-
ARBURST	突发类型	输入	强制	-
ARLOCK	锁定类型	输入	可选	-
ARCACHE	Cache类型	输入	可选	-
ARPROT	保护类型	输入	可选	-
ARQOS	QoS值	输入	可选	-
ARVALID	读地址有效	输入	强制	-
ARREADY	读地址准备好	输出	强制	-
RID	读数据ID	输出	强制	-
RDATA	读数据	输出	强制	-
RRESP	读响应	输出	可选	00，OKAY
RLAST	读最后	输出	强制	-
RVALID	读有效	输出	强制	-
RREADY	读准备好	输入	强制	-

9.3.1 主设备地址AxADDR

AxADDR：规范并没有规定该信号的最小长度，如果系统地址总线比主设备地址信号更宽，则额外的高地址位全部设为0，如果更窄，则多余的高地址位不能连接到系统地址总线

NOTE

一般情况下主设备支持32bit地址，主设备可选支持到至多64bit地址

9.3.2 从设备地址AxADDR

AxADDR：规范并没有规定该信号的最小长度，同时规范也不要求从设备对系统数据总线宽度内的数据使用低地址位进行寻址，并假设这些低地址位为全0，如果从设备的地址线比互联器更宽，则多余的高低地址位默认全0

通常一个存储器从设备至少能够完全译码整个4KB地址空间。

9.3.3 存储器从设备 AxLOCK AxCACHE

AxLOCK：规范不要求存储器从设备使用AxLOCK输入信号，然而，支持独占访问事务的存储器从设备需要这些信号

AxCACHE：规范不要求存储器从设备使用AxCACHE信号，如果一个存储器从设备不支持Cache行为或所有的事务以相同的方式Cache，则该设备不需要这个信号

9.3.4 写事务 WSTRB[3:0] WLAST

WSTRB[3:0]：如果主设备总是执行整个数据总线宽度的写事务，则规范不要求主设备使用写字节使能信号，写字节使能的默认值是全1

WLAST：规范不要求从设备使用WLAST信号，因为已定义写突发长度，从设备可以根据突发长度AWLEN[7:0]信号计算出最后一次写数据传输

9.3.5 读事务

RLAST：规范不要求主设备使用RLAST信号，因为已定义读突发长度，主设备可以根据突发长度ARLEN[7:0]信号计算出最后一次读数据传输

9.3.6 响应信号

RRESP，BRESP：如果主设备不需要执行独占访问事务也不需要事务错误通知，则主设备可以不使用RRESP与BRESP输入信号；如果从设备不需要支持独占访问事务也不需要生成错误响应，则从设备可以不使用RRESP与BRESP输出信号。

9.3.7 PROT 不安全和安全访问

AxPROT：规范不要求从设备区分非安全和安全访问，也不要求任何额外的保护支持，因此不要求从设备支持AxPROT输入信号

NOTE

要特别注意AxPROT信号，AxPROT[1]信号表示事务是否为安全事务，不正确的设置可能会导致不正确的系统行为

低功耗接口

关于低功耗接口

低功耗接口是AXI协议的可选扩展，以如下两类外设为目标：

任何没有下电序列且可以指示其时钟何时被关闭的外设。
任何要求下电序列，且只有在进入低功耗状态后才能停止时钟的外设，这样的外设要求系统时钟控制器指示其何时开始下电序列，并且外设在进入低功耗状态后必须发出通知信号。

低功耗时钟控制

低功耗时钟控制接口包含如下信号：

一个来自外设的信号用于指示其时钟何时可以被开启关闭。
两个为系统时钟控制器准备的握手信号用于请求进入或退出低功耗状态。

外设时钟要求

CACTIVE信号表示外设是否需要时钟信号，当外设需要时钟使能的时候就会拉高CACTIVE信号，此时系统时钟控制器就必须立即使能时钟。当外设不需要时钟的时候就会拉低CACTIVE信号，系统时钟控制器可以关闭该时钟，但也可以不关闭。

如果一个外设在任何时候都允许其时钟被使能或禁用，则可以永久性地拉低CATIVE信号，若一个外设要求其时钟永久使能，则必须永久性地拉高CACTIVE信号。

CACTIVE仅用于没有下电或上电序列支持的某些外设的时钟控制。

下电或上电握手

对于一个拥有下电或上电序列的外设而言，只有在系统时钟控制器发出请求之后外设才会进入低功耗状态，AXI协议提供了请求/响应握手信号用于支持这个功能：

CSYSREQ：系统时钟控制器使用CSYSREQ信号请求外设进入低功耗状态（拉低CSYSREQ信号）或退出低功耗状态（拉高CSYSREQ信号）。
CSYSACK：外设使用CSYSACK信号通知系统时钟控制器已完成请求，对于进入低功耗状态请求，外设会拉低CSYSACK信号，对于退出低功耗状态请求，外设会拉高CSYSACK信号。

下列是这CSYSREQ与CSYSACK信号的时序图：

在序列开始时，CSYSREQ与CSYSACK信号都为高电平，在T1时刻，系统时钟控制器拉低CSYSREQ表示请求外设进入低功耗状态，外设在T2时刻拉低CSYSACK信号响应请求，在T3时刻，系统时钟控制器拉高CSYSREQ信号请求外设退出低功耗状态，在T4时刻，外设拉高CSYSACK信号响应请求。

外设可以同意或拒绝系统时钟控制器进入低功耗状态的请求，在外设响应请求的时候通过将CACTIVE信号拉高或拉低来表示接受或拒绝请求。

接受低功耗请求

下图是外设接受系统低功耗请求时的时序图：

在T1时刻，系统时钟控制器拉低CSYSREQ信号以请求外设进入低功耗状态，在外设识别到这个请求后，执行了自己的下电序列，并在T2时刻拉低了CACTIVE信号用来表示时钟信号可以被移除。在T3时刻，外设拉低CSYSACK信号通知系统时钟控制器该外设已进入低功耗模式，

外设只有在拉低CACTIVE至少一个时钟之后才能拉低CSYSACK信号。

拒绝低功耗请求

下图是外设拒绝系统低功耗请求时的时序图：

在T1时刻，系统时钟控制器拉低CSYSREQ信号以请求外设进入低功耗状态，在T2时刻外设响应该请求，但此时仅拉低了CSYSACK信号而并没有拉低CACTIVE信号，因此系统时钟控制器必须维持时钟，并且在执行了低功耗状态退出序列后才能发起另一个低功耗请求。在T3时刻，系统时钟控制器通过拉高CSYSREQ开始了低功耗状态退出序列，在T4时刻，外设拉高CSYSACK表示完成了低功耗状态退出序列。

退出低功耗状态

无论是系统时钟控制器还是外设都可以请求退出低功耗状态，外设要求CACTIVE与CSYSREQ信号在整个低功耗状态期间保持为低电平，这两个信号之一变为高电平都会触发低功耗状态退出序列的启动。

系统时钟控制器触发退出序列：

在T1时刻，系统时钟控制器拉高CSYSREQ信号以请求退出低功耗状态，然后使能时钟，外设识别到CSYSREQ信号为高电平后开始执行其自身的上电序列，并在T2时刻拉高CACTIVE信号表示它需要时钟信号，然后外设在T3时刻拉高CSYSACK完成退出序列。

外设触发退出序列：

在T1时刻外设拉高CACTIVE信号以通知其需要时钟信号，然后系统时钟控制器必须恢复时钟。

在T2时刻系统时钟控制器拉高CSYSREQ信号以便继续握手序列，外设接下来会拉高CSYSACK信号以完成退出序列。

注意：外设可以让CSYSACK保持数个周期的低电平以完成自身的退出序列。

组合低功耗域中的外设

系统时钟控制器可以组合一些不同的外设到一个相同的低功耗时钟域中，它可以将时钟域看作一个单独的外设，但要求下列规则必须遵守：

时钟域的CACTIVE信号是时钟域中所有外设CACTIVE信号的逻辑或，这意味着系统时钟控制器只有当所有外设都表示其时钟可以被关闭时才可以关闭时钟。
系统控制器必须使用单个CSYSREQ信号路由到时钟域中的全部外设。
- 时钟域CSYSACK信号通过下述方法生成：只有当时钟域中的最后一个外设拉低CSYSACK信号时才会拉低总的CSYSACK信号，只有当时钟域中的最后一个外设拉高CSYSACK信号时才会拉高总的CSYSACK信号。

IC 总线 AXI

本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！

Verilog常用上一篇

IC网站(持续更新) 下一篇