【更新中】《硬件架构的艺术》笔记(三):处理多个时钟

embedded/2024/11/18 12:01:51/

介绍

单时钟设计更易于实现,也更少出现亚稳态、建立和保持时间违例方面的问题。但在实践中,很少有设计只在一个时钟下运行。

多时钟域

多个始终可以有以下一种或多种时钟关系:

1、时钟频率不同。

2、时钟频率相同,但相位不同。

多时钟域设计的难题

1、建立时间和保持时间的违背。

2、亚稳态。

事实上1就会导致2

违背建立时间和保持时间

多时钟域情况下,很容易出现一个时钟域的输出在另一个时钟域的时钟上升沿到来时发生改变的现象。

图中xclk_output1不满足建立时间和保持时间,所以会造成亚稳态。而xclk_output2则没有该问题。

多时钟设计的处理技术

通用准则:

1、时钟命名  

2、分模块设计

时钟命名法

为了方便脚本使用通配符对所有时钟进行操作,对时钟应有一个确定的命名,如sys_clk、tx_clk和rx_clk,同属一个时钟域的信号也应在命名时使用同样的前缀,这样可以方便分辨出信号所属时钟域,并决定时直接使用该信号,还是同步后使用。

分块化设计

  • 每个模块只因当在单个时钟下工作
  • 在信号跨时钟域传输时,使用同步器模块。
  • 同步器规模尽可能小。

优点:使静态时序分析变得很简单。单个模块可以看作是完全同步的。另外,同步模块不需要做静态时序分析,但是要保证满足保持时间要求。

如图所有跨时钟域传输的信号都要经过一个额外的同步器模块。

跨时钟域

两类:控制信号的传输、数据信号的传输。

控制信号的传输(同步化)

最常用的方式:多级同步器。(只能降低亚稳态可能性,增加更多级触发器,可以进一步降低亚稳态出现的可能性)

缺点(不可避免地开销):增加了电路的整体延时。

 可以看到,亚稳态如果在一个周期内稳定下来,第二级寄存器就能输出一个稳定的值。

有时第一级同步器信号从亚稳态进入稳态需要不止一个周期,第二级触发器输出依然亚稳态,这是为了安全起见,应加入三级同步器。

大多数设计中两级同步电路就足以避免亚稳态出现了,只有在时钟频率非常高的设计中才要求使用三级同步器电路。

数据信号的传输

两种方法:

1、握手信号

2、异步FIFO

同频零相位差时钟

其实就是单时钟设计。

 同频恒定相位差时钟

从这幅图看感觉对建立时间要求更高了,对保持时间要求变低了。对组合逻辑的延时约束会变得更紧。这种情况不需要同步器,只需要使设计STA通过即可。

非同频、可变相位差时钟

整数倍频率的时钟

clk2捕获数据的时间可能是T、2T、3T,取决于数据在clk1哪个边沿发出。任意路径的最差延迟都应在时钟边沿相位差T时满足建立时间要求。最差保持时间应在时钟边沿相位差为零时进行。

可以使源数据每三个源时钟改变一次,防止丢失数据。

非整数倍频率的时钟

情况一:源时钟有效沿和目的时钟有效沿之间有足够大的相位差,不会有亚稳态产生。

 clk1和clk2分别是对同一个时钟的3分频和2分频,如图,两个时钟最小相位差为2.5ns,满足建立时间和保持时间,但应避免在跨时钟位置使用任何组合逻辑。

慢到快不会有数据丢失;快到慢可能出现数据丢失,为了解决这个问题,必须将元数据保持至少一个目标时钟周期。

情况2:两个有效沿很近,但当再出出现挨着的情况前,接下来的几个周期两个时钟沿会保留足够的裕量。

 图中期望的波形使B1,实际的波形使B2。这里数据不会丢失(因为是从慢到快),但是可能不连贯。

从快倒满可能出现数据丢失,为了阻止这种情况,源数据应保持至少一个目标时钟周期不变。

情况三:相位差异小,能连续存在几个周期。

图中前两个周期可能违背建立时间,后两个周期可能违背保持时间。

这种情况下,即使数据从慢到快时钟域也可能丢失。

为了不丢数据,数据应保持至少两个目的时钟周期,这同时适用于快到慢和慢到快。但是数据不连续的问题依然存在。

这时,使用握手和FIFO传输数据就更有效,因为它们解决了数据不连续的问题。

握手信号方法

  • X将数放在数据总线上兵发出xreq信号,表示有效数据已经发到接收器Y的数据总线上。
  • xreq信号同步到接收器时钟域ylk上。
  • Y在识别xreq同步的信号yreq2后,锁存数据总线上信号。
  • Y发出确认信号yack,表示其已经接收了数据。
  • yack同步到发送时钟xclk上。
  • X识别到同步的xack2信号后,将下一个数据放到数据总线上。

如图,安全地将一个数据从发送器传输到接收器需要5个时钟周期。

握手信号的要求

数据应在发送时钟域内稳定至少两个时钟上升沿。

xreq宽度应该超过两个上升沿时钟,否则从高速时钟域到低速时钟域传递可能无法捕捉到该信号。

握手信号缺点

传输单个数据延迟比FIFO传输同样的数据大得多。

使用同步FIFO传输数据

DPRAM(双端口RAM)用作FIFO以使读、写可以独立进行。

  •  写指针指向下一个要写的地址,读指针指向下一个要读的地址。写使能使写指针递增,读使能使读指针递增。
  • 根据读写指针可以产生空信号和满信号,也可以对FIFO内数据进行计数。
  • DPRAM可以同步读取或者异步读取。同步读时,应在FIFO输出有效前给都信号。异步读时,输出不会寄存。数据只要一写入就可用。

 FIFO空满的产生

 图中为FIFO满的情况,当读指针等于写指针加一并进行写操作,FIFO满。

同样,当读操作使两个指针在下个周期相等时,FIFO变空。

另一种方法

另一种方法使使用计数器来指示FIFO中空或满位置的个数。写入数据时计数器加一,读取数据时计数器减一。

这种方法原理上简单,但是要增加额外的硬件(比较器)。FIFO深度增加,比较器宽度也会增加,这最终会降低FIFO操作的最高频率。

异步FIFO

 如上图,X通过xclk将数据写入FIFO,Y通过yclk将数据读出。注意这里写满标志信号在写时钟域,空信号在读时钟域。

对比握手信号,异步FIFO用于对性能要求较高的设计中,尤其是时钟延迟比系统资源更重要的环境中。

异步FIFO主要需要注意信号亚稳态的问题。

 避免用二进制计数器实现指针

如果使用二进制计数,一次可能变换多位,这时就需要将多位数据同步到另一个时钟域,很容易造成错误。

 使用格雷码取代二进制计数

格雷码优势是在一个数变成另一个数时,只有一位出现变化。所以其在转换中最多只会一位错误,读取时要么读到旧值,要么读到新值,但是不会读到其他值。

同步指针的影响

 需要注意的是在t6、t7的时候,由于同步电路需要两个时钟周期(两级同步缓解亚稳态),所以fifo_full会多拉高两个周期,这样阻止了两个周期的数据写入,但是对数据的准确性是无害的。

同样,空也会多两个周期阻止FIFO读访问。

 空判断是将写指针同步到读时钟域,在读空后写入FIFO,需要两个周期读时钟域才能得到写指针增加的信息,所以空信号也会多延两个周期。同样这里组织了对FIFO的读操作,也是无害的。

用格雷码实现FIFO指针

 1、将格雷码转换成二进制码。

2、根据条件递增二进制值。

3、二进制转格雷码。

4、保存到寄存器。

格雷码到二进制转换器

 转换公式:

所以可以将格雷码右移i位再按位异或得到二进制码

二进制-格雷码转换器

可以直接将二进制码右移一位后与自身异或操作,计算出格雷码。

格雷码计数器的实现

将四个步骤结合起来,就可以实现一个格雷码计数器。

 

FIFO满和FIFO空的产生

为了判断空满,还需要额外一位对两种情况进行区分。

最高位不同,其他位相同,FIFO满。

所有位相同,FIFO为空。

由于存在XOR链路,最大操作频率取决于格雷码计数器速度:当电路中存在 XOR 链路 时,XOR 门的延迟会影响整个电路的反应时间。如果格雷码计数器的输出需要经过多个 XOR 门进行处理,那么这些 XOR 门的串联延迟将成为影响最大操作频率的一个关键因素。

如图,一共用了四个转换器,如果直接使用格雷码实现空满操作就可以省掉这些转换器,但是这会增加复杂度并需要额外的逻辑。

产生空满的另一种方法

该方法创建两个格雷码计数器,一个n位,另一个n-1位。通过n位格雷码的最高两位异或,来产生一个n-1位格雷码的MSB。其余n-2位与n位格雷码的n-2位保持一致。

 使用这两个格雷码计数器,就可以进行FIFO空满判断。

 

双时钟FIFO设计

FIFO空条件的产生

这里直接比较读写指针格雷码,相比先将格雷码转化成二进制码,直接对比格雷码可以节省4个转换器。

同步后的写指针wr_ptr_sync和rd_gtemp(下一个将要寄存进入rd_ptr的格雷码,不然产生空满信号需要一个周期,空满信号被采样到用于控制FIFO读写又需要一个周期,会造成FIFO满了还向FIFO中写入的现象。)

FIFO满条件的产生

 如图,rd_ptr=7,wr_ptr=8时,会出现FIFO满的错误声明。使用二元n位格雷码计数器可以轻松避免该情况。

以下三个条件同时为真时,满标志拉高。

1)同步后的读指针rd_ptr_sync的MSB应该与下一个写指针的格雷码wr_gtemp的MSB应该不同。

2)写时钟域两位MSB异或应与读指针一样。

3)剩下的LSB都应该一样。

(其实总结一下就是最高位相反,剩下的低位应该完全相等)


http://www.ppmy.cn/embedded/138528.html

相关文章

【GNU】gcc -O编译选项 -Og -O0 -O1 -O2 -O3 -Os

1、gcc -O的作用 GCC 提供的 -O 系列选项用于优化代码。这些选项可以控制编译器对代码进行优化的程度和类型,从而提高代码的性能、减小代码体积或优化其他特性。 2、gcc -Og -O0 -O1 -O2 -O3 -Os 2.1 gcc -Og 启用调试友好的优化,平衡调试器功能与性…

JAVA-链表

1.链表的概念及结构 链表是一种物理存储结构上非连续存储结构(逻辑上连续),数据元素的逻辑顺序是通过链表中的引用链接次序实现的 。 注意: 根据上图可看出,链表是在逻辑结构连续的,但是在物理结构上不一定现实中的结点一般都是通…

嵌入式开发人员如何选择合适的开源前端框架进行Web开发

在嵌入式系统的Web开发中,前端框架的选择对于项目的成败有着决定性的影响。一个合适的框架不仅能提高开发效率,还能保证系统的稳定性和可扩展性。本文将介绍几款适用于嵌入式Web开发的开源前端框架,并探讨它们的优缺点。 1. Element Plus V…

C++:boost库安装

官网:https://www.boost.org/ Boost 库在 C 社区中广受欢迎,主要因为它提供了丰富、强大且稳定的功能,可以显著提高开发效率和代码质量。下面是使用 Boost 库的主要优势和特点: 1. 丰富的功能集合 Boost 提供了数十个高质量的 …

macOS解决U盘装完系统容量变小的问题

发现原来256GB容量的U盘在mac电脑上只显示34GB,想起来之前用该U盘装过系统,最终搜到了以下解决方案,在此记录: (1) 查看盘符列表,找到需要格式化的U盘,假设为disk4 diskutil list(2) 卸载分区disk4 disk…

计算机编程中的测试驱动开发(TDD)及其在提高代码质量中的应用

💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 计算机编程中的测试驱动开发(TDD)及其在提高代码质量中的应用 计算机编程中的测试驱动开发(T…

【C++】类和对象-深度剖析默认成员函数-上

> 🍃 本系列为初阶C的内容,如果感兴趣,欢迎订阅🚩 > 🎊个人主页:[小编的个人主页])小编的个人主页 > 🎀 🎉欢迎大家点赞👍收藏⭐文章 > ✌️ 🤞 &#x1…

【微软:多模态基础模型】(3)视觉生成

欢迎关注【youcans的AGI学习笔记】原创作品 【微软:多模态基础模型】(1)从专家到通用助手 【微软:多模态基础模型】(2)视觉理解 【微软:多模态基础模型】(3)视觉生成 【微…