亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

點贊

評論

原創

TCAM在芯片中的設計與優化

2025-06-23 10:43:28

TCAM（三態內(nei)容尋址存(cun)儲器(qi)，ternary content-addressable memory）作為一個基本(ben)功能廣泛(fan)應用(yong)于(yu)網(wang)卡、路由器、交換(huan)機、防(fang)火(huo)墻等網(wang)絡設備中，通常用(yong)于(yu)路由查找、包過濾等場景。具有并行比較、查找速度快、支(zhi)持(chi)模糊匹配(pei)的優勢。

<i id='TBf7R'></i>

TCAM的(de)基本(ben)實(shi)現方法如(ru)圖所(suo)示：

TCAM實現的基本過(guo)程包含搜索廣播、匹配比較、優(you)先(xian)級編碼器三個部分。其中使用key RAM、mask RAM分(fen)別存儲報文分(fen)類所需(xu)的關鍵字（key）和查找掩碼（mask）。當報文進入網絡設備時，使用(yong)報文識別(bie)出來的報文特征如五元組(zu)進行組(zu)合，得(de)到報文的tuple，將報文的(de)tuple進行(xing)掩碼(ma)，得(de)到匹配(pei)的特(te)(te)征值(zhi)。使用掩碼(ma)后(hou)的特(te)(te)征值(zhi)與(yu)配(pei)置的key進行(xing)匹配，得到若干(gan)匹配結果(guo)。將匹配結果(guo)進行(xing)優先級排序。根(gen)據排序結果(guo)獲取報文(wen)動(dong)作和(he)去向。上述(shu)過程如(ru)下圖所示(shi)。

四個過程通常使(shi)用(yong)4級pipeline進行實現。

考慮邏(luo)輯優化，我(wo)們(men)可以將4級pipeline壓縮為3級(ji)。將mask和key壓(ya)縮(suo)為同一級(ji)pipeline實(shi)現，使用一種替代邏輯進行實(shi)現： = (~Key & Mask) | (Key & Tuple)。減少一級pipeline可以(yi)減少資源消(xiao)耗(hao)。

壓(ya)縮后TCAM分為(wei)三(san)個過程

TCAM表在邏輯實現中(zhong)的優(you)化

資源優化：對(dui)于(yu)一些(xie)小規格設備（如(ru)小于(yu)等于(yu)64條TCAM），可以直(zhi)接使用片上寄存器實(shi)現mask表和(he)key表；對于中(zhong)等(deng)規格設(she)備（如數(shu)萬條TCAM），可以使用(yong)片上BRAM實現mask表(biao)和key表；對(dui)于(yu)大規格(ge)設備（如(ru)百(bai)萬條(tiao)TCAM），在(zai)進(jin)行芯(xin)片設計時通常會(hui)使用(yong)廠商特種芯(xin)片庫進(jin)行非易失性存儲，在(zai)進(jin)行FPGA設計時會使(shi)用廠(chang)商IP進(jin)行設計。

功(gong)耗優化：對(dui)于大規模(mo)設(she)備，一(yi)個報文(wen)只會命中很小(xiao)比例的表項，但是會進(jin)行所有(you)的表項匹配(pei)，可以通過分組分時匹配(pei)，犧牲(sheng)報文(wen)轉(zhuan)發速率實現功(gong)耗降低。

時序(xu)(xu)優(you)化：對于大(da)規模設備，命(ming)中結(jie)果(guo)(guo)進(jin)(jin)行優(you)先級排(pai)序(xu)(xu)的過(guo)程，需要對上百萬位寬的匹配結(jie)果(guo)(guo)進(jin)(jin)行優(you)先級排(pai)序(xu)(xu)，對時序(xu)(xu)是(shi)極大(da)的挑戰。可以通過(guo)分組匹配搭配分層匹配，層層獲取排(pai)序(xu)(xu)結(jie)果(guo)(guo)，經過(guo)多(duo)個時鐘周期得到(dao)優(you)先級排(pai)序(xu)(xu)結(jie)果(guo)(guo)。

0條評論

作者已關閉評論

亂序不丟包

2文章(zhang)數

0點贊(zan)數

0粉(fen)絲數

亂序不丟包

2 文章 | 0 粉絲

Ta的熱門文章查(cha)看更(geng)多

大規模邏輯設計中的寄存器分級設計 TCAM在芯片中的設計與優化

亂序不丟包

2文(wen)章數

0點贊數

0粉絲數

亂序不丟包

2 文章 | 0 粉絲

原創

TCAM在芯片中的設計與優化

彈性高性能計算Web應用防火墻紫金DPU網卡芯片

2025-06-23 10:43:28

TCAM（三態內容尋址存儲器，ternary content-addressable memory）作為一個基本(ben)功能廣泛應(ying)用于(yu)網卡、路由器、交(jiao)換機、防火墻等(deng)網絡設備中，通常用于(yu)路由查(cha)找、包過濾等(deng)場景。具有并行(xing)比(bi)較、查(cha)找速度(du)快、支持模糊匹配的(de)優勢。

TCAM的基本(ben)實現(xian)方法如圖所示：

TCAM實現的基(ji)本過(guo)程包含搜索廣(guang)播、匹(pi)配比較、優先級編碼(ma)器三(san)個部分。其中使(shi)用key RAM、mask RAM分別存儲(chu)報文分類所需(xu)的關鍵(jian)字（key）和查(cha)找(zhao)掩碼（mask）。當報(bao)文(wen)進(jin)入(ru)網(wang)絡設備時，使用報(bao)文(wen)識別出來的報(bao)文(wen)特(te)征如五元(yuan)組進(jin)行(xing)組合，得到報(bao)文(wen)的tuple，將報(bao)文的(de)tuple進(jin)行(xing)掩碼(ma)，得到匹配(pei)的(de)特(te)征(zheng)值。使(shi)用掩碼(ma)后的(de)特(te)征(zheng)值與配(pei)置的(de)key進行(xing)匹配(pei)，得到若干匹配(pei)結(jie)果(guo)。將匹配(pei)結(jie)果(guo)進行(xing)優先級排(pai)序。根據排(pai)序結(jie)果(guo)獲取報文動作和去(qu)向。上述過程如下圖所(suo)示(shi)。

四個(ge)過程(cheng)通常使用4級pipeline進(jin)行(xing)實(shi)現。

考慮邏輯優(you)化，我們可以(yi)將4級(ji)pipeline壓縮為3級。將mask和key壓縮(suo)為同(tong)一級pipeline實現，使(shi)用一種(zhong)替代邏輯進行實現： = (~Key & Mask) | (Key & Tuple)。減少一級pipeline可(ke)以減少資源(yuan)消耗。

壓縮(suo)后TCAM分(fen)為三個(ge)過程(cheng)

TCAM表(biao)在(zai)邏(luo)輯實現中的優化

資源優化：對于(yu)一些小規(gui)格設備(bei)（如小于(yu)等于(yu)64條TCAM），可以直接使用片上寄存器實(shi)現mask表和key表；對(dui)于(yu)中等規格設備（如數萬條TCAM），可以使用片上BRAM實現mask表和key表；對于大(da)規格設備（如(ru)百萬條TCAM），在(zai)進(jin)行(xing)芯(xin)片設計(ji)時通(tong)常會(hui)使用廠商特(te)種芯(xin)片庫進(jin)行(xing)非(fei)易失性存儲(chu)，在(zai)進(jin)行(xing)FPGA設計(ji)時會使(shi)用廠商IP進行(xing)設計。

功耗(hao)優化(hua)：對(dui)于大規(gui)模設(she)備，一個報文(wen)(wen)只會(hui)命中很小比例的(de)表(biao)項(xiang)(xiang)，但是會(hui)進行所有的(de)表(biao)項(xiang)(xiang)匹配，可(ke)以(yi)通過分組分時匹配，犧牲報文(wen)(wen)轉發速率實現功耗(hao)降(jiang)低。

時(shi)序(xu)優化：對于大(da)規模設備，命中(zhong)結果(guo)進(jin)行(xing)優先級(ji)排序(xu)的(de)過程，需要對上百萬(wan)位寬的(de)匹配結果(guo)進(jin)行(xing)優先級(ji)排序(xu)，對時(shi)序(xu)是極大(da)的(de)挑戰。可以通過分組匹配搭配分層(ceng)匹配，層(ceng)層(ceng)獲取排序(xu)結果(guo)，經過多個時(shi)鐘周期(qi)得到優先級(ji)排序(xu)結果(guo)。

文章來自個人專欄

文章 | 訂閱(yue)

0條評論

作者已關閉評論

亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

智算服務

應用商城

定價

合作伙伴

開發者

支持與服務

了解天翼云