亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

  • 發布文章
  • 消息中心
點贊
收藏
評論
分享
原創

GA-RPN:Region Proposal by Guided Anchoring 引導錨點的建議

2023-02-22 01:53:04
14
0

論文地址://arxiv.org/pdf/1901.03278.pdf

代碼地址:GitHub - open-mmlab/mmdetection: OpenMMLab Detection Toolbox and Benchmark

1.RPN

RPN即Region Proposal Network,是(shi)用RON來選擇感(gan)興趣區(qu)域(yu)的(de),即proposal extraction。例如,如果一個(ge)區(qu)域(yu)的(de)p>0.5,則認為(wei)這(zhe)個(ge)區(qu)域(yu)中(zhong)可能是(shi)80個(ge)類(lei)別中(zhong)的(de)某一類(lei),具體(ti)是(shi)哪一類(lei)現在(zai)還不清楚。到(dao)此(ci)為(wei)止,網絡只需要把(ba)這(zhe)些可能含有物體(ti)的(de)區(qu)域(yu)選取(qu)(qu)出來就可以(yi)了(le),這(zhe)些被選取(qu)(qu)出來的(de)區(qu)域(yu)又叫做ROI(Region of Interests),即感(gan)興趣的(de)區(qu)域(yu)。當然RPN同時也會在(zai)feature map上框(kuang)定(ding)這(zhe)些ROI感(gan)興趣區(qu)域(yu)的(de)大致位置(zhi),即輸出Bounding Box。

RPN詳(xiang)細(xi)介紹

2.Guided Anchoring

通(tong)常用(yong)(yong)(x,y,w,h)來描述一個(ge)anchor,即中(zhong)心點坐標和寬高。文章將anchor的分布(bu)用(yong)(yong)條件概率(lv)來表示,公式為:

兩個(ge)條(tiao)件概(gai)率的(de)分布,代表給(gei)定圖像特(te)征之(zhi)后anchor的(de)中心(xin)點概(gai)率分布,和(he)給定圖像特(te)征和(he)中(zhong)心(xin)點之(zhi)后(hou)的形狀概率(lv)分布。這樣看(kan)來,原(yuan)來我們所獲(huo)取anchor的(de)方法(fa)就可(ke)以看(kan)成上述條件概率分布(bu)的(de)一個特例,即p(x,y|I)是均勻分布(bu)而p(w,h|x,y,I)是沖激(ji)函數。

根(gen)據上面的公(gong)式,anchor的生(sheng)成過程可以分解為兩個步驟,anchor位(wei)置預測(ce)和(he)形狀預測(ce)。

這個(ge)框(kuang)架就是在原始的(de)(de)RPN的(de)(de)特征(zheng)圖基礎上,采(cai)(cai)用兩個(ge)分值分別預測anchor的(de)(de)位(wei)置和(he)(he)形狀,然后再結合到(dao)(dao)一起得(de)到(dao)(dao)anchor。之(zhi)后采(cai)(cai)用一個(ge)Feature Adaption模塊進(jin)行anchor特征(zheng)的(de)(de)調(diao)整,得(de)到(dao)(dao)新的(de)(de)特征(zheng)圖供之(zhi)后的(de)(de)預測使用(anchor的(de)(de)分類和(he)(he)回(hui)歸(gui))。整個(ge)方法(fa)可以端到(dao)(dao)端訓練(lian),而且相比(bi)之(zhi)前只(zhi)是增(zeng)加了3個(ge)1×1 conv 和(he)(he)一個(ge)3×3 deformable conv,帶來的(de)(de)模型參數量變化很(hen)小。

(1)位置預測

位置預測(ce)分支(zhi)的目標是(shi)預測(ce)哪(na)些(xie)區(qu)域應(ying)該作為(wei)中(zhong)心點(dian)來生成(cheng)anchor,也(ye)是(shi)一個二分類問(wen)題,但是(shi)不同于RPN的分類,我們并不是(shi)預測(ce)每個點(dian)是(shi)前景(jing)還是(shi)背景(jing),而是(shi)預測(ce)是(shi)不是(shi)物體(ti)中(zhong)心。

我們將(jiang)整個feature map的區(qu)域(yu)分(fen)為物體(ti)(ti)中心(xin)區(qu)域(yu)、外圍區(qu)域(yu)和忽略(lve)區(qu)域(yu),大致思路(lu)就是將(jiang)groundtruth 框的中心(xin)一小塊(kuai)對應在(zai)feature map上的區(qu)域(yu)標為物體(ti)(ti)中心(xin)區(qu)域(yu),在(zai)訓練的時候作為正樣(yang)本,其余區域按照離中(zhong)心的(de)距(ju)離標為忽略或者負樣(yang)本。最后通過選擇對應概率值高于預定閾(yu)值的(de)位置來確定可(ke)能存在對象活動的(de)區域。? 對輸入(ru)的(de)特征圖使用 1×1 的(de)卷積,得到與 ? 相(xiang)同(tong)分辨率(lv)的輸出(chu),? 得到(dao)輸出的(de)(de)每個位置(zhi)(zhi)的(de)(de)值(zhi)(zhi)表(biao)示(shi)原圖(tu)I上對(dui)應(ying)位置(zhi)(zhi)出現物(wu)體的(de)(de)可能(neng)性,也就是概(gai)率圖(tu),最后通過(guo)選擇對(dui)應(ying)概(gai)率值(zhi)(zhi)高于預(yu)定閾值(zhi)(zhi)的(de)(de)位置(zhi)(zhi)來(lai)確定可能(neng)存在對(dui)象活(huo)動的(de)(de)區域。

通過(guo)位置(zhi)(zhi)預(yu)測,我(wo)們(men)可以(yi)篩(shai)選出一小部分區域(yu)作為(wei)anchor的候(hou)選中心點位置(zhi)(zhi),使得anchor數量(liang)大大降低。這樣(yang)在最后(hou)我(wo)們(men)就可以(yi)只(zhi)針(zhen)對有anchor的地方進行(xing)計(ji)算。

(2)形狀預測

形狀預(yu)測分支是(shi)(shi)目標是(shi)(shi)給(gei)定anchor中心點,預(yu)測最佳的長和(he)寬,這是(shi)(shi)一個回歸(gui)問題。

采用(yong)1×1的卷積網絡 ? 輸入 ?,輸出與(yu) ? 尺(chi)寸相同的(de)2通道的(de)特(te)征(zheng)圖,每(mei)個(ge)通道分別代表 dw 和(he) dh,表示每(mei)個(ge)位(wei)置可(ke)能的(de)最好的(de) anchor 尺(chi)寸。雖然我們的(de)預(yu)測目標是 w 和(he) h,但是直接預(yu)測這兩個(ge)數字不穩定(ding),因(yin)為(wei)范圍很大,所(suo)以將空間(jian)近似(si) [0,1000] 映射到了 [-1,1] 中,公式為(wei):

其中 s 是(shi)步幅,σ 是(shi)經(jing)驗(yan)因子,實(shi)驗(yan)中取 σ=8。實(shi)驗(yan)中產生(sheng) dw,dh 的雙通(tong)道(dao)映射,通(tong)過這個方程實(shi)現了逐(zhu)像素轉換。文章(zhang)中直接用 IOU 作為監督來學習 w 和 h。

對(dui)于 anchor 和 ground truth 匹(pi)配問題,傳統 RPN 都(dou)(dou)是(shi)(shi)直接計算 anchor 和所有 ground truth 的(de)(de) IOU,然后將(jiang)anchor 匹(pi)配給 IOU 最(zui)大(da)的(de)(de)那(nei)個 ground truth,但是(shi)(shi)現(xian)在由于我們的(de)(de)改(gai)進(jin),anchor 的(de)(de) w 和 h 都(dou)(dou)是(shi)(shi)不確定的(de)(de),是(shi)(shi)一個需要預測的(de)(de)變(bian)量。文中將(jiang)這(zhe)個 anchor 和某個 ground truth 的(de)(de) IOU 表示為(wei):

我(wo)們不可能把所有可能的 w 和 h 遍(bian)歷一(yi)遍(bian)求 IOU 的最大值,文中采用了(le)9組可能的 w 和 h 作為樣本,近似(si)效果已經足夠(gou)。

到這(zhe)里我們就可以生成 anchor 了(le)。這(zhe)時所生成的(de) anchor 就是稀疏而且每個位置不(bu)一樣(yang)的(de)。實驗可得此時的(de)平均 recall 已經超過(guo)普通的(de) RPN 了(le),僅僅是增加了(le)兩(liang)個 conv。

 

(3)特征(zheng)精調模塊

由于每個位(wei)置(zhi)(zhi)的(de)(de)(de)形(xing)(xing)狀(zhuang)不同(tong),大的(de)(de)(de)anchor對(dui)應較大感受(shou)野(ye),小的(de)(de)(de)anchor對(dui)應小的(de)(de)(de)感受(shou)野(ye)。所(suo)以不能像(xiang)之前基于anchor的(de)(de)(de)方(fang)法那樣(yang)直接對(dui)feature map進行卷(juan)積來(lai)預測,而是要(yao)對(dui)feature map進行feature adaptation。作者利用可變形(xing)(xing)卷(juan)積(deformable convolution)的(de)(de)(de)思想(xiang),根據形(xing)(xing)狀(zhuang)對(dui)各個位(wei)置(zhi)(zhi)單獨進行轉(zhuan)換。

 

方法就是(shi)(shi)把anchor的(de)形(xing)狀(zhuang)信息直接(jie)融入(ru)到(dao)(dao)特(te)(te)征(zheng)(zheng)圖當中(zhong),得到(dao)(dao)新的(de)特(te)(te)征(zheng)(zheng)圖去適應每個位置(zhi)anchor的(de)形(xing)狀(zhuang)。這里就利用(yong)了上述的(de)3×3的(de)可變形(xing)卷積進(jin)行對原(yuan)始特(te)(te)征(zheng)(zheng)圖的(de)修正,可變形(xing)卷積的(de)變化(hua)量(liang)是(shi)(shi)通(tong)過anchor的(de)w和h經過一個1×1 conv得到(dao)(dao)的(de)。

其中,fi 是(shi)第 i 個位置的(de)(de)(de)特征(zheng),(wi, hi) 是(shi)對應的(de)(de)(de) anchor 形(xing)狀。NT 通過 3×3 的(de)(de)(de)變形(xing)卷積(ji)實現(xian)。首先(xian)通過形(xing)狀預(yu)測分(fen)支預(yu)測偏(pian)移(yi)字(zi)段(duan) offset field,然后對帶(dai)偏(pian)移(yi)的(de)(de)(de)原始 feature map 做變形(xing)卷積(ji)獲得 adapted features。之(zhi)后進一(yi)步做分(fen)類和 bounding box 回歸。

通過這樣的(de)操作,達(da)到(dao)了讓 feature 的(de)有效范圍和 anchor 形狀更加接近的(de)目的(de),同一(yi)個 conv 的(de)不同位(wei)置也(ye)可以代表不同形狀大(da)小的(de) anchor 了。

 

 

0條評論
0 / 1000
代碼的路
100文章數
1粉(fen)絲數(shu)
代碼的路
100 文(wen)章 | 1 粉(fen)絲
代碼的路
100文章數
1粉絲數
代碼的路
100 文(wen)章 | 1 粉絲
原創

GA-RPN:Region Proposal by Guided Anchoring 引導錨點的建議

2023-02-22 01:53:04
14
0

論文地址://arxiv.org/pdf/1901.03278.pdf

代(dai)碼地址:GitHub - open-mmlab/mmdetection: OpenMMLab Detection Toolbox and Benchmark

1.RPN

RPN即(ji)(ji)Region Proposal Network,是用RON來選擇感興(xing)趣(qu)區域的(de)(de),即(ji)(ji)proposal extraction。例如,如果一個區域的(de)(de)p>0.5,則(ze)認為這個區域中可能是80個類別中的(de)(de)某(mou)一類,具體(ti)是哪一類現在還不清楚。到此(ci)為止,網絡只(zhi)需要(yao)把這些可能含有物體(ti)的(de)(de)區域選取出(chu)來就可以(yi)了,這些被選取出(chu)來的(de)(de)區域又叫(jiao)做ROI(Region of Interests),即(ji)(ji)感興(xing)趣(qu)的(de)(de)區域。當然RPN同時(shi)也會在feature map上框定(ding)這些ROI感興(xing)趣(qu)區域的(de)(de)大致位置,即(ji)(ji)輸出(chu)Bounding Box。

RPN詳細介紹

2.Guided Anchoring

通(tong)常用(x,y,w,h)來描述一個(ge)anchor,即中心點坐(zuo)標和寬高(gao)。文章將(jiang)anchor的分(fen)布用條件概(gai)率來表示,公式(shi)為(wei):

兩個條件(jian)概(gai)率的分布,代(dai)表給定(ding)圖像特征之后anchor的中心點概率(lv)分布,和給定圖像(xiang)特(te)征和中心點之后的形狀(zhuang)概率分布。這樣看(kan)來,原來我們所獲(huo)取anchor的方(fang)法(fa)就可以(yi)看(kan)成(cheng)上(shang)述(shu)條件概率分布的一個特例(li),即p(x,y|I)是均勻分布而p(w,h|x,y,I)是沖激函數。

根(gen)據上面的(de)公式,anchor的(de)生(sheng)成過程可以分解為兩個步驟,anchor位(wei)置預測(ce)和形狀預測(ce)。

這個(ge)框架就(jiu)是在原始(shi)的(de)RPN的(de)特(te)(te)征圖基(ji)礎上,采(cai)用兩個(ge)分(fen)值分(fen)別預(yu)測anchor的(de)位置和形狀(zhuang),然后再結(jie)合到(dao)(dao)一起得到(dao)(dao)anchor。之后采(cai)用一個(ge)Feature Adaption模塊進行(xing)anchor特(te)(te)征的(de)調整(zheng)(zheng),得到(dao)(dao)新(xin)的(de)特(te)(te)征圖供之后的(de)預(yu)測使用(anchor的(de)分(fen)類和回歸)。整(zheng)(zheng)個(ge)方法可以端(duan)到(dao)(dao)端(duan)訓(xun)練,而且相比之前只是增加了3個(ge)1×1 conv 和一個(ge)3×3 deformable conv,帶來的(de)模型參數量變(bian)化(hua)很小。

(1)位置預測

位置預(yu)測分(fen)(fen)支的目標是(shi)(shi)(shi)預(yu)測哪些區域應(ying)該作為(wei)中(zhong)心點來(lai)生成anchor,也是(shi)(shi)(shi)一個二分(fen)(fen)類(lei)問題,但是(shi)(shi)(shi)不(bu)同于RPN的分(fen)(fen)類(lei),我們并不(bu)是(shi)(shi)(shi)預(yu)測每個點是(shi)(shi)(shi)前(qian)景還是(shi)(shi)(shi)背景,而是(shi)(shi)(shi)預(yu)測是(shi)(shi)(shi)不(bu)是(shi)(shi)(shi)物體中(zhong)心。

我(wo)們將整個feature map的(de)(de)區(qu)(qu)(qu)域(yu)分(fen)為(wei)物體中(zhong)(zhong)心區(qu)(qu)(qu)域(yu)、外圍區(qu)(qu)(qu)域(yu)和忽略(lve)區(qu)(qu)(qu)域(yu),大致(zhi)思路就是將groundtruth 框的(de)(de)中(zhong)(zhong)心一小塊對應在(zai)feature map上的(de)(de)區(qu)(qu)(qu)域(yu)標為(wei)物體中(zhong)(zhong)心區(qu)(qu)(qu)域(yu),在(zai)訓練(lian)的(de)(de)時候作為(wei)正(zheng)樣本,其余區域(yu)按照(zhao)離中(zhong)心的距離標為忽略或者負樣本。最后通過選(xuan)擇對應(ying)概(gai)率值高于預(yu)定(ding)閾值的位置來確(que)定(ding)可(ke)能存在(zai)對象活動的區域。? 對(dui)輸入的(de)特(te)征圖使用 1×1 的(de)卷積,得到與 ? 相同分辨率的輸出,? 得到輸出(chu)(chu)的(de)每個位(wei)置的(de)值(zhi)表示(shi)原圖(tu)I上對應位(wei)置出(chu)(chu)現物(wu)體(ti)的(de)可(ke)能性,也就是概率圖(tu),最后通過(guo)選擇對應概率值(zhi)高(gao)于(yu)預定閾值(zhi)的(de)位(wei)置來確定可(ke)能存在對象活(huo)動的(de)區域。

通(tong)過位置(zhi)預測,我(wo)們可(ke)以篩選出一小部分區域作(zuo)為anchor的(de)候選中心點位置(zhi),使得anchor數量(liang)大(da)大(da)降低(di)。這樣在最后我(wo)們就(jiu)可(ke)以只針對有anchor的(de)地方進行計算。

(2)形狀預測(ce)

形狀(zhuang)預測分支是(shi)(shi)目標是(shi)(shi)給(gei)定anchor中心點,預測最佳的(de)長和寬,這(zhe)是(shi)(shi)一個回歸問題(ti)。

采(cai)用(yong)1×1的(de)卷積網絡 ? 輸(shu)入 ?,輸出與 ? 尺寸(cun)相同的2通道的特征(zheng)圖,每個(ge)通道分別代表 dw 和(he)(he) dh,表示每個(ge)位置可能的最(zui)好(hao)的 anchor 尺寸(cun)。雖然(ran)我們的預測(ce)目標是 w 和(he)(he) h,但是直接預測(ce)這兩(liang)個(ge)數(shu)字不(bu)穩定,因為(wei)范圍很大(da),所以將空間近似 [0,1000] 映射到了(le) [-1,1] 中,公(gong)式為(wei):

其(qi)中(zhong) s 是步幅,σ 是經驗因子,實(shi)驗中(zhong)取(qu) σ=8。實(shi)驗中(zhong)產生 dw,dh 的雙通道映射,通過這個方程實(shi)現了逐像(xiang)素轉換。文章中(zhong)直接(jie)用 IOU 作(zuo)為監(jian)督來學習 w 和 h。

對(dui)于 anchor 和 ground truth 匹配問題,傳統(tong) RPN 都是直接計算 anchor 和所有 ground truth 的 IOU,然后將anchor 匹配給 IOU 最大(da)的那個 ground truth,但是現(xian)在由于我們的改進,anchor 的 w 和 h 都是不確定(ding)的,是一個需要(yao)預測的變量。文中將這(zhe)個 anchor 和某個 ground truth 的 IOU 表(biao)示(shi)為(wei):

我們不可(ke)能把所(suo)有可(ke)能的 w 和(he) h 遍歷(li)一(yi)遍求 IOU 的最大(da)值,文中采用了9組可(ke)能的 w 和(he) h 作為樣本,近似效果已經(jing)足夠。

到(dao)這里我(wo)們就可(ke)以生(sheng)(sheng)成 anchor 了(le)。這時所生(sheng)(sheng)成的(de) anchor 就是稀疏而且每個位置不(bu)一樣的(de)。實驗可(ke)得此時的(de)平均 recall 已經超過普(pu)通的(de) RPN 了(le),僅僅是增(zeng)加了(le)兩(liang)個 conv。

 

(3)特征精調模塊

由于每個位置(zhi)的(de)(de)(de)(de)形狀(zhuang)不(bu)同,大(da)的(de)(de)(de)(de)anchor對(dui)(dui)應(ying)(ying)較大(da)感受野,小的(de)(de)(de)(de)anchor對(dui)(dui)應(ying)(ying)小的(de)(de)(de)(de)感受野。所以不(bu)能像之前基于anchor的(de)(de)(de)(de)方(fang)法(fa)那樣直接對(dui)(dui)feature map進行卷(juan)積來(lai)預(yu)測,而是要對(dui)(dui)feature map進行feature adaptation。作者利用可變形卷(juan)積(deformable convolution)的(de)(de)(de)(de)思想,根據(ju)形狀(zhuang)對(dui)(dui)各個位置(zhi)單獨進行轉換。

 

方(fang)法就是把anchor的形(xing)狀(zhuang)信息(xi)直(zhi)接融入到特征圖(tu)當中,得到新(xin)的特征圖(tu)去適應每個(ge)位置anchor的形(xing)狀(zhuang)。這(zhe)里(li)就利用了上述的3×3的可(ke)(ke)變形(xing)卷積進行對原始特征圖(tu)的修正,可(ke)(ke)變形(xing)卷積的變化量是通過(guo)anchor的w和h經過(guo)一個(ge)1×1 conv得到的。

其中(zhong),fi 是(shi)第 i 個位置的(de)特征,(wi, hi) 是(shi)對(dui)應的(de) anchor 形狀。NT 通過 3×3 的(de)變形卷積(ji)實現。首先通過形狀預測分支預測偏移字段(duan) offset field,然后(hou)對(dui)帶偏移的(de)原(yuan)始 feature map 做變形卷積(ji)獲得(de) adapted features。之后(hou)進一步做分類和 bounding box 回歸。

通過這樣的(de)(de)操(cao)作,達到(dao)了(le)讓(rang) feature 的(de)(de)有效(xiao)范圍和(he) anchor 形狀更加接近的(de)(de)目的(de)(de),同一個(ge) conv 的(de)(de)不同位置也可(ke)以(yi)代表不同形狀大(da)小的(de)(de) anchor 了(le)。

 

 

文章來自個人專欄
文章 | 訂閱
0條評論
0 / 1000
請輸入你的評論
2
2