卷積在神經(jīng)網(wǎng)絡(luò)中的作用范文
時間:2024-03-29 11:12:39
導(dǎo)語:如何才能寫好一篇卷積在神經(jīng)網(wǎng)絡(luò)中的作用,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵詞:深度學(xué)習(xí);目標(biāo)視覺檢測;應(yīng)用分析
隨著計算機(jī)的普及,目標(biāo)視覺檢測也在計算機(jī)的發(fā)展中逐漸被應(yīng)用。人們的生活越來越離不開計算機(jī)和電子設(shè)備,數(shù)據(jù)信息充斥著當(dāng)代人的生活。隨著人們生活質(zhì)量的提高對電子設(shè)備要求越來越高,越來越精準(zhǔn)。目標(biāo)檢測技術(shù)在人們的生活中,也發(fā)揮著很大的作用和價值。智能監(jiān)控、機(jī)器人、自動定位、人臉聚焦、航拍、衛(wèi)星等方面都應(yīng)用了目標(biāo)視覺檢測的技術(shù)。在高層視覺處理和任務(wù)分析中,目標(biāo)視覺檢測技術(shù)也是基礎(chǔ)。無論是分析行為、事件還是場景語義的理解都需要運(yùn)用到目標(biāo)視覺檢測技術(shù)。因此目標(biāo)視覺檢測在各個方面都發(fā)揮著重大的作用,本文就深度學(xué)習(xí)在目標(biāo)視覺檢測中的應(yīng)用和展望進(jìn)行探討。
一、深度學(xué)習(xí)在目標(biāo)視覺檢測中的進(jìn)展
深度學(xué)習(xí)最早出自于人工神經(jīng)網(wǎng)絡(luò)。深度學(xué)習(xí)把多層感知器作為學(xué)習(xí)結(jié)構(gòu),組合底層特征進(jìn)行高層的學(xué)習(xí)。作為機(jī)器研究的一個新領(lǐng)域,模仿人腦組建學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)。深度學(xué)習(xí)可以逐步自主的學(xué)習(xí)。而目標(biāo)視覺檢測在近幾年出現(xiàn)了很多的問題,例如,類內(nèi)和類間存在差異。即使通過訓(xùn)練也很難包含所有類內(nèi)的特征描述模型。而且類內(nèi)和類間的差異大小不一樣這就給目標(biāo)視覺檢測的發(fā)展帶來很大的阻礙。在圖像采集的過程中,由于種種因素會導(dǎo)致目標(biāo)物體被遮擋,因此,視覺算法的魯棒性也需要進(jìn)行整改。語義理解也存在著差異,對仿生和類腦角算法有一定的難度。而計算機(jī)的復(fù)雜和自適應(yīng)性也比較高,需要設(shè)計高效的目標(biāo)視覺檢測技術(shù),為了確保目標(biāo)視覺檢測的精準(zhǔn)程度,還需要設(shè)計出自動更新視覺模型來提高模型在不同環(huán)境下的適應(yīng)能力。隨著深度學(xué)習(xí)的發(fā)展,深度學(xué)習(xí)對于目標(biāo)視覺檢測有很大的用處,可以極大地解決目前目標(biāo)視覺檢測技術(shù)出現(xiàn)的問題。因此很多專家開始把深度學(xué)習(xí)融入到目標(biāo)視覺檢測的發(fā)展當(dāng)中,并進(jìn)行研究。
二、目標(biāo)視覺檢測的流程和順序
估計特定類型目標(biāo)是目標(biāo)視覺檢測的關(guān)鍵,目標(biāo)視覺檢測的流程大致分為三步,區(qū)域建議、特征表示和區(qū)域分類。根據(jù)圖一,第一步區(qū)域建議。目標(biāo)檢測需要獲得目標(biāo)的準(zhǔn)確位置和大小尺度,在輸入圖像的時候找到指定的類型目標(biāo)是其中一種區(qū)域建議。還可以通過滑動窗進(jìn)行區(qū)域建議,投票、圖像分割的區(qū)域建議也可以使用?;瑒哟靶枰谳斎雸D像的時候在子窗口執(zhí)行目標(biāo)來檢測目標(biāo)所處的位置。投票機(jī)制則通過部件的模型找到輸入圖像和模型在局部區(qū)域內(nèi)的最佳位置,并最大限度地讓所有局部區(qū)域匹配,利用拓?fù)涞姆绞絹淼玫阶罴哑ヅ?。但是投票機(jī)制的區(qū)域建議計算代價會比較高。圖像分割的區(qū)域建議則建立在圖像分割的基礎(chǔ)上面,是一個消耗時間和精力的過程,而且很復(fù)雜很難把整個目標(biāo)分割出來。而深度學(xué)習(xí)在圖像分類和目標(biāo)檢測中都有一定得進(jìn)展,通過深度學(xué)習(xí)的表征和建模能力可以生成抽象的表示[1]。
圖一,目標(biāo)視覺檢測流程
三、深度學(xué)習(xí)在目標(biāo)視覺檢測當(dāng)中的作用
深度學(xué)習(xí)融入目標(biāo)視覺檢測推動了目標(biāo)視覺檢測的發(fā)展和研究。目標(biāo)視覺檢測和圖像分類有一定的區(qū)分,目標(biāo)視覺檢測主要關(guān)注圖像的局部信息,圖像分類在意圖像的全局表達(dá)。但是它們也有一定的互通性。首先從區(qū)域建議的方法來探討深度學(xué)習(xí)在目標(biāo)視覺檢測中的作用。深度學(xué)習(xí)在目標(biāo)視覺檢測中的基本參考方法是Girshick等人提出來的R-CNN方法。R-CNN和CNN相聯(lián)系,檢測的精準(zhǔn)度達(dá)到了53.3%,對比傳統(tǒng)的方法有很大的飛躍。如圖二所示,輸入相關(guān)圖像的同時進(jìn)行選擇性的搜索提取候選區(qū),通過CNN網(wǎng)絡(luò)來提取固定長度的向量,圖像經(jīng)過兩個全連接層和五個積卷層得出一個4096的向量,最后把提取到的向量數(shù)據(jù)在向量機(jī)中進(jìn)行分配。但是這樣的方式還是存在很多的不足和弊端,因此Girshick對R-CNN和SPP-net進(jìn)行了進(jìn)一步的改進(jìn),圖像進(jìn)行一次卷積在特征圖上進(jìn)行映射送入Rol池化層,最后通過全連接層輸出。同一幅畫像的Rol共同相同計算機(jī)的內(nèi)存效率更加高。通過softmax 的分類不僅省去特征的存儲還提高了利用率。近年來,kin等人又提出了PVANET網(wǎng)絡(luò),數(shù)據(jù)的檢測精準(zhǔn)度達(dá)到了82.5%,在確保精準(zhǔn)度的情況下還能使通道數(shù)減少,可以增加對細(xì)節(jié)的提取。
圖二,R-NN的計算流程
早期還提出過無區(qū)域建議的方式,例如,DPM模型可以在目標(biāo)的內(nèi)部進(jìn)行結(jié)構(gòu)化的建模,不僅提高了檢測的性能,也能很好地適應(yīng)非剛體的形變。但是DPM模型的構(gòu)建條件復(fù)雜,模型訓(xùn)練也比較繁瑣,所以sermanet又進(jìn)行研究提出了Overfeat的模型,避免圖像塊的操作出錯,也能提高算法的效率。但是關(guān)于尺寸的識別還是存在著一定的問題,因此無區(qū)域建議還在不斷的探索過程中。redmom提出了關(guān)于改進(jìn)yolo模型的方法,成為yolov2,可以確保精準(zhǔn)度和定位,提升了檢測率。專家們還研制出一種新的訓(xùn)練算法,用數(shù)據(jù)來找到物體的準(zhǔn)確定位,yolo模型通過這樣的方式課題檢測超過九千種物體[2]。
四、結(jié)束語
未來深度學(xué)習(xí)在目標(biāo)視覺檢測中都會得到繼續(xù)的應(yīng)用和進(jìn)展,深度學(xué)習(xí)在目標(biāo)視覺測試中依舊是主流的方向。深度學(xué)習(xí)通過它的優(yōu)勢可以獲得高層次抽象的表達(dá)。但是深度學(xué)習(xí)的理論還不是特別的完善,模型的可解釋性還不夠強(qiáng)。因此深度學(xué)習(xí)模式還需要得到進(jìn)一步的改進(jìn)和完善,對模型的結(jié)構(gòu),訓(xùn)練等多加指導(dǎo)。大規(guī)模多樣性數(shù)據(jù)集也比較匱乏,現(xiàn)在很多的目標(biāo)視覺檢測都在imagenet上進(jìn)行訓(xùn)練,但是目標(biāo)檢測技術(shù)還需要進(jìn)一步的完善和提高,達(dá)到最好的效果。深度學(xué)習(xí)在目標(biāo)視覺檢測技術(shù)中的應(yīng)用還不夠完善,任重而道遠(yuǎn),還需要進(jìn)一步的完善理論提高精準(zhǔn)度。在未來,深度學(xué)習(xí)和目標(biāo)視覺檢測一定能夠得到極大的進(jìn)展。
參考文獻(xiàn)
- 上一篇:社區(qū)教育現(xiàn)狀
- 下一篇:車間安全生產(chǎn)方案