亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

  • 發布文章
  • 消息中心
點贊
收藏
評論
分享
原創

TCAM在芯片中的設計與優化

2025-06-23 10:43:28
31
0

TCAM(三態內(nei)容尋址存(cun)儲器(qi),ternary content-addressable memory)作為一個基本(ben)功能廣泛(fan)應用(yong)于(yu)網(wang)卡、路由器、交換(huan)機、防(fang)火(huo)墻等網(wang)絡設備中,通常用(yong)于(yu)路由查找、包過濾等場景。具有并行比較、查找速度快、支(zhi)持(chi)模糊匹配(pei)的優勢。

TCAM的(de)基本(ben)實(shi)現方法如(ru)圖所(suo)示:


 

 

TCAM實現的基本過(guo)程包含搜索廣播、匹配比較、優(you)先(xian)級編碼器三個部分。其中使用key RAMmask RAM分(fen)別存儲報文分(fen)類所需(xu)的關鍵字(key)和查找掩碼(mask)。當報文進入網絡設備時,使用(yong)報文識別(bie)出來的報文特征如五元組(zu)進行組(zu)合,得(de)到報文的tuple,將報文的(de)tuple進行(xing)掩碼(ma),得(de)到匹配(pei)的特(te)(te)征值(zhi)。使用掩碼(ma)后(hou)的特(te)(te)征值(zhi)與(yu)配(pei)置的key進行(xing)匹配,得到若干(gan)匹配結果(guo)。將匹配結果(guo)進行(xing)優先級排序。根(gen)據排序結果(guo)獲取報文(wen)動(dong)作和(he)去向。上述(shu)過程如(ru)下圖所示(shi)。


四個過程通常使(shi)用(yong)4pipeline進行實現。

考慮邏(luo)輯優化,我(wo)們(men)可以將4pipeline壓縮為3級(ji)。將maskkey壓(ya)縮(suo)為同一級(ji)pipeline實(shi)現,使用一種替代邏輯進行實(shi)現: = (~Key & Mask) | (Key & Tuple)。減少一級pipeline可以(yi)減少資源消(xiao)耗(hao)。

壓(ya)縮后TCAM分為(wei)三(san)個過程


TCAM表在邏輯實現中(zhong)的優(you)化

資源優化:對(dui)于(yu)一些(xie)小規格設備(如(ru)小于(yu)等于(yu)64TCAM),可以直(zhi)接使用片上寄存器實(shi)現mask表和(he)key表;對于中(zhong)等(deng)規格設(she)備(如數(shu)萬條TCAM),可以使用(yong)片上BRAM實現mask表(biao)和key表;對(dui)于(yu)大規格(ge)設備(如(ru)百(bai)萬條(tiao)TCAM),在(zai)進(jin)行芯(xin)片設計時通常會(hui)使用(yong)廠商特種芯(xin)片庫進(jin)行非易失性存儲,在(zai)進(jin)行FPGA設計時會使(shi)用廠(chang)商IP進(jin)行設計。

功(gong)耗優化:對(dui)于大規模(mo)設(she)備,一(yi)個報文(wen)只會命中很小(xiao)比例的表項,但是會進(jin)行所有(you)的表項匹配(pei),可以通過分組分時匹配(pei),犧牲(sheng)報文(wen)轉(zhuan)發速率實現功(gong)耗降低。

時序(xu)(xu)優(you)化:對于大(da)規模設備,命(ming)中結(jie)果(guo)(guo)進(jin)(jin)行優(you)先級排(pai)序(xu)(xu)的過(guo)程,需要對上百萬位寬的匹配結(jie)果(guo)(guo)進(jin)(jin)行優(you)先級排(pai)序(xu)(xu),對時序(xu)(xu)是(shi)極大(da)的挑戰。可以通過(guo)分組匹配搭配分層匹配,層層獲取排(pai)序(xu)(xu)結(jie)果(guo)(guo),經過(guo)多(duo)個時鐘周期得到(dao)優(you)先級排(pai)序(xu)(xu)結(jie)果(guo)(guo)。

0條評論
作者已關閉評論
亂序不丟包
2文章(zhang)數
0粉(fen)絲數
亂序不丟包
2 文章 | 0 粉絲
亂序不丟包
2文(wen)章數
0粉絲數
亂序不丟包
2 文章 | 0 粉絲
原創

TCAM在芯片中的設計與優化

2025-06-23 10:43:28
31
0

TCAM(三態內容尋址存儲器,ternary content-addressable memory)作為一個基本(ben)功能廣泛應(ying)用于(yu)網卡、路由器、交(jiao)換機、防火墻等(deng)網絡設備中,通常用于(yu)路由查(cha)找、包過濾等(deng)場景。具有并行(xing)比(bi)較、查(cha)找速度(du)快、支持模糊匹配的(de)優勢。

TCAM的基本(ben)實現(xian)方法如圖所示:


 

 

TCAM實現的基(ji)本過(guo)程包含搜索廣(guang)播、匹(pi)配比較、優先級編碼(ma)器三(san)個部分。其中使(shi)用key RAMmask RAM分別存儲(chu)報文分類所需(xu)的關鍵(jian)字(key)和查(cha)找(zhao)掩碼(mask)。當報(bao)文(wen)進(jin)入(ru)網(wang)絡設備時,使用報(bao)文(wen)識別出來的報(bao)文(wen)特(te)征如五元(yuan)組進(jin)行(xing)組合,得到報(bao)文(wen)的tuple,將報(bao)文的(de)tuple進(jin)行(xing)掩碼(ma),得到匹配(pei)的(de)特(te)征(zheng)值。使(shi)用掩碼(ma)后的(de)特(te)征(zheng)值與配(pei)置的(de)key進行(xing)匹配(pei),得到若干匹配(pei)結(jie)果(guo)。將匹配(pei)結(jie)果(guo)進行(xing)優先級排(pai)序。根據排(pai)序結(jie)果(guo)獲取報文動作和去(qu)向。上述過程如下圖所(suo)示(shi)。


四個(ge)過程(cheng)通常使用4pipeline進(jin)行(xing)實(shi)現。

考慮邏輯優(you)化,我們可以(yi)將4級(ji)pipeline壓縮為3級。將maskkey壓縮(suo)為同(tong)一級pipeline實現,使(shi)用一種(zhong)替代邏輯進行實現: = (~Key & Mask) | (Key & Tuple)。減少一級pipeline可(ke)以減少資源(yuan)消耗。

壓縮(suo)后TCAM分(fen)為三個(ge)過程(cheng)


TCAM表(biao)在(zai)邏(luo)輯實現中的優化

資源優化:對于(yu)一些小規(gui)格設備(bei)(如小于(yu)等于(yu)64TCAM),可以直接使用片上寄存器實(shi)現mask表和key表;對(dui)于(yu)中等規格設備(如數萬條TCAM),可以使用片上BRAM實現mask表和key表;對于大(da)規格設備(如(ru)百萬條TCAM),在(zai)進(jin)行(xing)芯(xin)片設計(ji)時通(tong)常會(hui)使用廠商特(te)種芯(xin)片庫進(jin)行(xing)非(fei)易失性存儲(chu),在(zai)進(jin)行(xing)FPGA設計(ji)時會使(shi)用廠商IP進行(xing)設計。

功耗(hao)優化(hua):對(dui)于大規(gui)模設(she)備,一個報文(wen)(wen)只會(hui)命中很小比例的(de)表(biao)項(xiang)(xiang),但是會(hui)進行所有的(de)表(biao)項(xiang)(xiang)匹配,可(ke)以(yi)通過分組分時匹配,犧牲報文(wen)(wen)轉發速率實現功耗(hao)降(jiang)低。

時(shi)序(xu)優化:對于大(da)規模設備,命中(zhong)結果(guo)進(jin)行(xing)優先級(ji)排序(xu)的(de)過程,需要對上百萬(wan)位寬的(de)匹配結果(guo)進(jin)行(xing)優先級(ji)排序(xu),對時(shi)序(xu)是極大(da)的(de)挑戰。可以通過分組匹配搭配分層(ceng)匹配,層(ceng)層(ceng)獲取排序(xu)結果(guo),經過多個時(shi)鐘周期(qi)得到優先級(ji)排序(xu)結果(guo)。

文章來自個人專欄
文章 | 訂閱(yue)
0條評論
作者已關閉評論
作者已關閉評論
0
0