TCAM背景
当前商业芯片对OpenFlow的支持最欠缺的表现在:流表大小、流表数量、流表动作三方面。如严格按照OpenFlow标准,则流表只能用TCAM来实现。那我们简单讨论下什么是TCAM?为什么需要用TCAM来实现流表?
概念
- TCAM是ternary(三重的) content addressable memory的缩写,中文是:三重内容可寻址内存。一般memory是根据地址来访问存储的内容,而TCAM恰好相反,它是根据内容去找到地址。一般的memory中每个bit都只能表示两个值:0或1,而TCAM每个bit可表示三个值:0,1和X,X表示don’t care。
- TCAM之所以一个bit能表示三个值,原因是它的一条entry其实在物理上由两条entry组成,一条存放data,另外一条存放相应的mask。由此可以实现0/1/X的表示。有了TCAM,就可支持各种LOOKUP KEY的任何组合查找,任意地MASK掉任何不关心的字段。只有TCAM可以做这样的事情,HASH不行。
- 如果有多条TCAM ENTRY都能匹配上,TCAM优先选择INDEX最小的那一条。TCAM的查找效率与深度无关,也就是说,无论表项多大,查找速度是一样的,这跟TCAM的硬件实现方式有关。
- TCAM可内置在芯片里面,也可外挂在芯片之外,芯片通过接口去访问。但是内置TCAM比较占芯片面积,一条TCAM ENTRY至少抵得上5条DRAM/SRAM ENTRY,如果芯片内部放了太大的TCAM会导致芯片成本和功耗直线上升。所以一般芯片都不会内置太大TCAM。
- 外挂TCAM的成本和功耗一样很大,甚至比ASIC芯片本身还要贵,而且如果一个报文要访问外部TCAM多次的话,受限于TCAM接口速率,会导致无法线速。所以交换机一般也都不会使用外挂TCAM。
- 普通交换机中的ACL功能必须使用TCAM,所以内置TCAM省不掉,而对于路由,如果也必须使用TCAM的话,路由表项做不大。正因为TCAM的高成本和高功耗,所以现在最新的商业芯片已经开始使用算法来支持路由了,盛科的GreatBelt芯片是最早使用算法来做路由的商业芯片。
- 如果OpenFlow交换机必须使用TCAM的话,成本和功耗会居高不下,自然会影响OF交换机的推广。盛科在ONS 2013上获得SDN IDOL的V350,就是针对这一点做了创新。 GreatBelt芯片采用了N-FLOW技术,TCAM+HASH相结合,HASH采用哪种KEY是可配的,HASH FLOW高达64K。
- TCAM entry size一般有多种,比如某著名厂家的有single, double, quad三种宽度,single只能放一点L2或者L3的常用字段,double可以放大部分L2或者L3或者常用的L2+L3字段,而quad则可以放基本上所有的字段。要完全满足Openflow的灵活需求,至少要quad,他们这个做法仅适用于ACL。
- 假设TCAM entry宽度全部配置成single可以支持N条的话,那么配制成double就可以支持N/2, 配制成quad就可以支持N/4.这就是为什么有的设备厂商宣称他们支持N条flow,但是实测只有N/2,或者N/4,因为他们都按照最理想情况宣称,但是实际测试的时候,人家都用最坏情况测试。
- 盛科芯片内置的使用IBM技术的TCAM,功耗可以做到很低。在entry宽度上也跟其它厂家稍微有所不同,它设计了四种宽度,分别是80/160/320/640bits。常用L2 or IPv4字段用80就可以,完整的L2 or IPv4用160,完整的L2+L3 or IPv6用320,完整的L2+IPv6用640,在字段组合上也跟别家不同,更注重灵活性。