模式識(shí)別范文
時(shí)間:2023-04-11 17:29:37
導(dǎo)語:如何才能寫好一篇模式識(shí)別,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵詞:模糊模式 識(shí)別 計(jì)算機(jī)識(shí)別 應(yīng)用 研究
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2017)04(a)-0008-02
在計(jì)算機(jī)識(shí)別中,對(duì)模糊模式識(shí)別進(jìn)行了有效的應(yīng)用。在模糊集合當(dāng)中,通常是對(duì)一個(gè)概念的內(nèi)涵進(jìn)行有效的描述。在這個(gè)過程中,將數(shù)學(xué)方法進(jìn)行應(yīng)用能夠?qū)θ说乃季S過程進(jìn)行有效的模擬,將這項(xiàng)識(shí)別技術(shù)應(yīng)用在計(jì)算機(jī)識(shí)別中,能夠有效地提高整個(gè)系統(tǒng)的可靠性。
1 關(guān)于模糊模式識(shí)別的概念
模糊模式識(shí)別技術(shù)是隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展和成熟而逐漸發(fā)展起來的?,F(xiàn)階段,模糊模式識(shí)別技術(shù)已經(jīng)成為一門比較系統(tǒng)的內(nèi)容。關(guān)于模式識(shí)別,是近年來不斷發(fā)展的一項(xiàng)人工智能技術(shù),這項(xiàng)技術(shù)既能夠?qū)唧w事物的識(shí)別,又能夠?qū)Τ橄蟮氖挛镞M(jìn)行有效的識(shí)別。而模糊模式識(shí)別技術(shù)則是識(shí)別技術(shù)與人的思維之間的一種結(jié)合,在模糊模式識(shí)別技術(shù)中,能對(duì)文字、音樂以及圖片等有效地識(shí)別,使得模式識(shí)別技術(shù)進(jìn)入了新的發(fā)展階段。
2 模糊模式識(shí)別的建立
在建立模糊模式識(shí)別方法的過程中,可以將數(shù)學(xué)方法進(jìn)行合理的應(yīng)用。將X作為一個(gè)樣本的集合:X={x1,x2,x3……x(im-1),xim},在這個(gè)集合中,樣本xi的特性指標(biāo)有m個(gè),那么對(duì)xi的特性指標(biāo)進(jìn)行研究,得出來的矩陣如下:
在這個(gè)過程中,通過對(duì)數(shù)學(xué)方法進(jìn)行引入,就有效地對(duì)模糊模式識(shí)別方法進(jìn)行了建立,同時(shí),在建立的過程中,還需要建立相應(yīng)的訓(xùn)練樣本集。
3 模糊模式識(shí)別的重要作用
在計(jì)算機(jī)識(shí)別技術(shù)發(fā)展的過程中,模糊模式識(shí)別已經(jīng)得到了長(zhǎng)足的發(fā)展。在模糊模式識(shí)別技術(shù)中,能夠?qū)鹘y(tǒng)的模式識(shí)別技術(shù)進(jìn)行有效的補(bǔ)充,并對(duì)這個(gè)過程中產(chǎn)生的新事物進(jìn)行有效的統(tǒng)計(jì),也能夠?qū)ο到y(tǒng)中出現(xiàn)的不確定的事物進(jìn)行有效的識(shí)別與判斷。這樣識(shí)別技術(shù)實(shí)際上是以基礎(chǔ)數(shù)學(xué)作為基礎(chǔ)將數(shù)學(xué)理念引入其中,能夠?qū)φ麄€(gè)程序進(jìn)行有效的簡(jiǎn)化,也使得模式識(shí)別系統(tǒng)更加廣泛地在生產(chǎn)生活中進(jìn)行應(yīng)用。所以說,模糊模式識(shí)別系統(tǒng)的出現(xiàn),加強(qiáng)了計(jì)算機(jī)識(shí)別中對(duì)模式識(shí)別的有效應(yīng)用,也將傳統(tǒng)的模式識(shí)別系統(tǒng)當(dāng)中對(duì)事物的識(shí)別轉(zhuǎn)變成為對(duì)一些聲音和圖片的識(shí)別,加強(qiáng)了模式識(shí)別技術(shù)的實(shí)際應(yīng)用。
4 計(jì)算機(jī)識(shí)別中應(yīng)用模糊模式識(shí)別的研究
現(xiàn)階段,計(jì)算機(jī)技術(shù)已經(jīng)得到了飛速的發(fā)展,計(jì)算機(jī)系統(tǒng)科學(xué)的相關(guān)理論也得到了發(fā)展。所以,在這個(gè)過程中,想要利用識(shí)別系統(tǒng)更好地認(rèn)識(shí)抽象事物,就應(yīng)該利用計(jì)算機(jī)識(shí)別技術(shù)對(duì)一些復(fù)雜的事物進(jìn)行有效的分析與處理,這就需要對(duì)模糊模式識(shí)別系統(tǒng)進(jìn)行有效的應(yīng)用,進(jìn)而達(dá)到相應(yīng)的效果。
4.1 計(jì)算機(jī)數(shù)據(jù)識(shí)別應(yīng)用模糊模式識(shí)別系統(tǒng)
在模糊模式識(shí)別體系中,實(shí)際上是對(duì)現(xiàn)實(shí)生活中的一些模糊現(xiàn)象進(jìn)行有效的處理,這樣就能夠?qū)?shí)際生活中的問題進(jìn)行合理的解決。在計(jì)算機(jī)識(shí)別的過程中,對(duì)模糊模式識(shí)別體系進(jìn)行有效的應(yīng)用,能夠?qū)υ械睦萌说乃季S模式對(duì)事物信息進(jìn)行判斷的模式進(jìn)行有效的改善,這樣就能夠避免判斷工作的片面性,使得計(jì)算機(jī)識(shí)別的結(jié)果變得更加精確。在這個(gè)過程中,利用模糊模式識(shí)別技術(shù),能夠?qū)θ说乃季S過程進(jìn)行一個(gè)有效的模擬,這樣就有效地提高了計(jì)算機(jī)的智力水平,也能夠?qū)φ麄€(gè)計(jì)算機(jī)識(shí)別系統(tǒng)的可靠性得到了提高。在一些事物的檢查判斷的過程中,使用人工檢查的方式盡管能收到顯著的效果,但是人工檢查的效率卻比較低,這樣就會(huì)對(duì)人造成嚴(yán)重的疲勞現(xiàn)象。利用模糊模式識(shí)別體系,能夠?qū)z查事物進(jìn)行有效的識(shí)別,提高了計(jì)算機(jī)識(shí)別系統(tǒng)的可靠性。
4.2 計(jì)算機(jī)圖形識(shí)別應(yīng)用模糊模式識(shí)別系統(tǒng)
關(guān)于模糊集理論是Zadeh在1965年提出的。這個(gè)理論的提出,讓人們對(duì)事物的統(tǒng)一值,有了一個(gè)顯著的認(rèn)識(shí),這也是一種新的刻畫事物的方法。這種方法對(duì)以往事物呈現(xiàn)方式進(jìn)行了有效的改變,并提出了內(nèi)涵數(shù)學(xué)模式和外延數(shù)學(xué)模式。在這個(gè)過程中,A類問題和B類問題的認(rèn)知中,傳統(tǒng)的邏輯認(rèn)為樣本不是屬于A,就是屬于B。不過,在模糊模式識(shí)別過程中,可能出現(xiàn)樣本不僅屬于A類問題也屬于B類問題。這種識(shí)別方法與一般的模式識(shí)別方法進(jìn)行比較之后,能夠發(fā)現(xiàn),模糊模式識(shí)別方式在信息利用的過程中顯得更加充分,且這種算法也更加簡(jiǎn)單,具有較強(qiáng)的推理性。
在計(jì)算機(jī)識(shí)別技術(shù)中,應(yīng)用模糊模式識(shí)別的關(guān)鍵一環(huán),就是建立相應(yīng)的隸屬度函數(shù)?,F(xiàn)階段,模糊模式識(shí)別中的隸屬度函數(shù)建立的方法有模糊分布方法和模糊統(tǒng)計(jì)方法兩種重要的類型。在建立隸屬度函數(shù)的過程中,需要遵循函數(shù)的客觀規(guī)律,保證函數(shù)的構(gòu)建更加科學(xué),并能夠利用模糊模式識(shí)別系統(tǒng)中所建立的隸屬度函數(shù),對(duì)計(jì)算機(jī)圖形識(shí)別中的各項(xiàng)問題進(jìn)行有效的解決,并能夠收到顯著的效果。
4.3 計(jì)算機(jī)病毒識(shí)別應(yīng)用模糊模式識(shí)別系統(tǒng)
4.3.1 提取計(jì)算機(jī)病毒特點(diǎn)
將模糊模式識(shí)別技術(shù)應(yīng)用在計(jì)算機(jī)的病毒識(shí)別過程中,首先需要對(duì)病毒的特征進(jìn)行有效的檢測(cè)。這個(gè)過程中,需要現(xiàn)將計(jì)算機(jī)的病毒樣本進(jìn)行提取,并將提取的病毒樣本加入到計(jì)算機(jī)病毒庫中,并在病毒庫中進(jìn)行搜索,進(jìn)而找到與該病毒相似的病毒類型,針對(duì)病毒的類型及特點(diǎn),開展檢測(cè)工作。在這個(gè)過程中,采用模糊模式識(shí)別技術(shù),能夠完成對(duì)計(jì)算機(jī)內(nèi)的可用文件的分析,并能夠?qū)τ?jì)算機(jī)的行為差異進(jìn)行合理的分析,這樣就能夠收到良好的檢測(cè)病毒的重要目的。在病毒梯度的過程中,可以對(duì)win.ini的文件夾進(jìn)行有效的修改,進(jìn)而對(duì)病毒特征進(jìn)行有效的提取。
4.3.2 計(jì)算機(jī)病毒檢測(cè)
在計(jì)算機(jī)病毒的識(shí)別過程中,對(duì)病毒特征進(jìn)行識(shí)別之后,還應(yīng)該對(duì)病毒進(jìn)行有效的檢測(cè)。在檢測(cè)的過程中還可以對(duì)模糊模式識(shí)別技術(shù)進(jìn)行有效的應(yīng)用。在這個(gè)過程中,能夠利用相應(yīng)的病毒檢測(cè)工具來對(duì)程序類型進(jìn)行有效的歸納,并對(duì)樣本進(jìn)行有效的劃分,這樣就能夠?qū)哂邢鄳?yīng)的特征的程序類型進(jìn)行有效的識(shí)別,進(jìn)而達(dá)到對(duì)計(jì)算機(jī)的病毒檢測(cè)的重要目的。只有準(zhǔn)確的檢測(cè)出計(jì)算機(jī)病毒的類型,才能夠采取措施進(jìn)行殺毒。這個(gè)過程,很好的體現(xiàn)了模糊模式識(shí)別在計(jì)算機(jī)識(shí)別當(dāng)中的重要作用,推動(dòng)了計(jì)算機(jī)識(shí)別技術(shù)的有效l展與成熟。
5 結(jié)語
總之,隨著計(jì)算機(jī)信息技術(shù)的不斷發(fā)展,模糊模式識(shí)別技術(shù)會(huì)更加廣泛應(yīng)用在社會(huì)生活當(dāng)中。在計(jì)算機(jī)識(shí)別體系中,對(duì)模糊模式識(shí)別技術(shù)進(jìn)行應(yīng)用,能夠完成對(duì)計(jì)算機(jī)的數(shù)據(jù)識(shí)別、圖片識(shí)別以及病毒識(shí)別,這樣就能夠保證計(jì)算機(jī)穩(wěn)定工作,促進(jìn)了信息智能化技術(shù)的進(jìn)一步發(fā)展,也使得計(jì)算機(jī)識(shí)別技術(shù)得到了更加廣泛的應(yīng)用。
參考文獻(xiàn)
[1] 段旭琴,丁照忠,段健,等.多級(jí)模糊模式識(shí)別模型在評(píng)價(jià)高爐噴吹混煤中的應(yīng)用[J].煤炭學(xué)報(bào),2011(10):1748-1752.
篇2
摘 要 該文在人工免疫系統(tǒng)和克隆選擇原理的基礎(chǔ)上,給出了clonalg算法,并對(duì)該算法的實(shí)現(xiàn)原理、參數(shù)選擇等進(jìn)行了詳細(xì)研究;給出了利用該算法進(jìn)行數(shù)字識(shí)別的實(shí)例。 關(guān)鍵詞 克隆選擇;人工免疫系統(tǒng);數(shù)字識(shí)別 1 引言 生物免疫系統(tǒng)是一個(gè)高度進(jìn)化的生物系統(tǒng),它旨在區(qū)分外部有害抗原和自身組織,從而清除抗原并保持有機(jī)體的穩(wěn)定。從計(jì)算的角度來看,生物免疫系統(tǒng)是一個(gè)高度并行、分布、自適應(yīng)和自組織的系統(tǒng),具有很強(qiáng)的學(xué)習(xí)、識(shí)別、記憶和特征提取的能力。人們希望從生物免疫系統(tǒng)的運(yùn)行機(jī)制中獲取靈感,開發(fā)出面向應(yīng)用的免疫系統(tǒng)模型——人工免疫系統(tǒng)(artificial immune system, ais),用于解決實(shí)際問題。目前,ais已發(fā)展成為計(jì)算智能研究的一個(gè)嶄新的分支。其應(yīng)用領(lǐng)域逐漸擴(kuò)展到了信息安全、模式識(shí)別、智能優(yōu)化、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、自動(dòng)控制、故障診斷等諸多領(lǐng)域,顯示出ais強(qiáng)大的信息處理和問題求解能力以及廣闊的研究前景。 克隆選擇是一種常用的ais算法。本文主要探討該算法在數(shù)字識(shí)別中的應(yīng)用。 克隆選擇原理最先由jerne提出,后由burnet給予完整闡述。其大致內(nèi)容為:當(dāng)淋巴細(xì)胞實(shí)現(xiàn)對(duì)抗原的識(shí)別(即抗體和抗原的親和度超過一定閥值)后,b細(xì)胞被激活并增殖復(fù)制產(chǎn)生b細(xì)胞克隆,隨后克隆細(xì)胞經(jīng)歷變異過程,產(chǎn)生對(duì)抗原具有特異性的抗體??寺∵x擇理論描述了獲得性免疫的基本特性,并且聲明只有成功識(shí)別抗原的免疫細(xì)胞才得以增殖。經(jīng)歷變異后的免疫細(xì)胞分化為效應(yīng)細(xì)胞(抗體)和記憶細(xì)胞兩種。 克隆選擇的主要特征是免疫細(xì)胞在抗原刺激下產(chǎn)生克隆增殖,隨后通過遺傳變異分化為多樣性效應(yīng)細(xì)胞(抗體細(xì)胞)和記憶細(xì)胞??寺∵x擇對(duì)應(yīng)著一個(gè)親合度成熟(affinity maturation)的過程,即對(duì)抗原親合度較低的個(gè)體在克隆選擇機(jī)制的作用下,經(jīng)歷增殖復(fù)制和變異操作后,其親合度逐步提高而“成熟”的過程。因此親合度成熟本質(zhì)上是一個(gè)達(dá)爾文式的選擇和變異的過程,克隆選擇原理是通過采用交叉、變異等遺傳算子和相應(yīng)的群體控制機(jī)制實(shí)現(xiàn)的。 根據(jù)克隆選擇原理,decastro提出了克隆選擇算法(clonalg算法)模型,并在模式識(shí)別、組合優(yōu)化和多峰值函數(shù)優(yōu)化中得到了驗(yàn)證。其算法的核心在于增殖復(fù)制算子和變異算子,前者與個(gè)體親合度成正比,保證群體親合度逐步增大,后者與個(gè)體的親合度成反比例關(guān)系,保留最佳個(gè)體并改進(jìn)較差個(gè)體。 2 clonalg算法 clonalg算法是根據(jù)克隆選擇原理設(shè)計(jì)的免疫算法。解決問題時(shí),一般把問題定義為抗原,而問題的解就是抗體集合。在特定的形態(tài)空間中,隨機(jī)產(chǎn)生的抗體試圖與抗原發(fā)生匹配,即嘗試解決問題。匹配度高的抗體有可能產(chǎn)生更好的解,被賦予更大的克隆概率參與下一次匹配。 抗體和抗原之間的距離d采用漢明距離,如式(1)所示。
抗體和抗原之間的親和力aff與它們的距離成反比,即aff=1/d。 免疫算法的實(shí)現(xiàn)步驟如下: 步驟1 初始化抗體集合,隨機(jī)產(chǎn)生n個(gè)抗體。 步驟2 計(jì)算抗體集合ab中所有抗體與抗原ag的親和力。 步驟3 選擇n個(gè)親和力最高的抗體,組成一個(gè)新的抗體集合。并將這n個(gè)抗體按照親和力升序排列。 步驟4 將選中的n個(gè)抗體按照對(duì)應(yīng)的親和力進(jìn)行克隆,產(chǎn)生新的集合c,親和力越高的抗體,克隆的數(shù)量就越多,總的數(shù)量計(jì)算公式如式(2)。 nc是總的克隆數(shù),式(2)右邊是一個(gè)和式,其中第i項(xiàng)代表抗體abi產(chǎn)生的克隆數(shù), 是預(yù)設(shè)的參數(shù)因子,n是抗體集合包含的元素個(gè)數(shù)。 步驟5 新的集合c按照基因重組概率進(jìn)行基因重組,產(chǎn)生成熟的克隆集合c*。 步驟6 計(jì)算成熟克隆集合的親和力。 步驟7 從成熟克隆集合中選擇n個(gè)親和力最高的抗體作為記憶抗體的候選,親和力超過現(xiàn)有記憶抗體的候選抗體稱為新的記憶抗體。 步驟8 替換掉親和力最低的d個(gè)抗體,并用新的隨機(jī)抗體補(bǔ)充。 步驟9 如果抗體集合沒有達(dá)到匹配精度要求且進(jìn)化代數(shù)小于最大進(jìn)化代數(shù),則轉(zhuǎn)到步驟2,否則算法結(jié)束。
3 應(yīng)用clonalg算法識(shí)別數(shù)字 模式識(shí)別技術(shù)是根據(jù)研究對(duì)象的特征和屬性,利用一定的分析算法,確定研究對(duì)象的歸屬和類別,并使結(jié)果盡可能符合真實(shí)。一般模式識(shí)別系統(tǒng)都包括問題描述、系統(tǒng)訓(xùn)練和模式識(shí)別幾個(gè)部分。 本系統(tǒng)要解決的問題是識(shí)別0到9這十個(gè)數(shù)字。每個(gè)字符都用一個(gè)長(zhǎng)度l=120的二進(jìn)制串表示(每一個(gè)像素用一個(gè)二進(jìn)制數(shù)表示)。原始字符(待識(shí)別的字符)(抗原)如圖1所示。
圖1 待識(shí)別的字符(抗原) 抗體指令集由10個(gè)抗體組成,即取n=10。每次選中5個(gè)親和力最高的抗體進(jìn)行克隆,即n=5。參數(shù) =5。變異率初始值pm=0.05,并根據(jù)進(jìn)化情況進(jìn)行變化。最大進(jìn)化代數(shù)gen=100,匹配精度取0,即要求完全匹配。 10個(gè)抗原(待識(shí)別數(shù)字)都達(dá)到了完全匹配,具體匹配情況如表1所示。 表1 數(shù)字0-9的完全匹配代數(shù) 抗原(待識(shí)別字符) 0 1 2 3 4 5 6 7 8 9 完全匹配代數(shù) 36 42 54 47 47 53 49 42 40 53 從表1可以看出,該算法的收斂速度是很快的。 由于篇幅所限,下面僅以數(shù)字“3”為例,觀察一下算法的實(shí)現(xiàn)過程。 圖2 識(shí)別數(shù)字“3”的過程 圖2中,第一排按照從左向右的次序:第1幅圖是原始字符,第2幅圖是隨機(jī)產(chǎn)生的抗體集,第3幅圖和第4幅圖分別是進(jìn)化到第10代和第20代的抗體集。第二排按照從左向右的次序:第1幅圖,第2幅圖分別是進(jìn)化到第30代,第40代的抗體集。最后一幅圖是進(jìn)化到第47代的抗體集。進(jìn)化過程中抗體與抗原的距離變化情況如表2所示。 表2 識(shí)別“3”時(shí)抗體與抗原的距離d的變化 進(jìn)化代數(shù) 5 10 15 20 25 30 35 40 45 47 抗體與抗原的距離d 30 19 12 8 5 3 1 1 1 0 從表2可以看出,實(shí)際上進(jìn)化到35代時(shí),抗體與抗原的距離d=1,在大多數(shù)應(yīng)用中,這已經(jīng)可以很好地滿足要求了。 4 總結(jié) 從上面的討論可以看出,clonalg算法是一種高效、快速收斂的算法,非常適合應(yīng)用于模式識(shí)別。 參考文獻(xiàn) [1] 閻平凡等著,人工神經(jīng)網(wǎng)絡(luò)與模擬進(jìn)化計(jì)算,清華大學(xué)出版社,2000 [2] 陳慰峰著,醫(yī)學(xué)免疫學(xué),人民出版社,2001 [3] 李濤著,計(jì)算機(jī)免疫學(xué),電子工業(yè)出版社,2004
篇3
引言
當(dāng)前對(duì)人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neutron Network)的研究熱潮源自Hopfield J.[1]和McclellandJ.等人于20世紀(jì)80年表的論文[2],[3]。Hopfield提出了激活函數(shù)為非線性的反饋網(wǎng)絡(luò),并將其成功地運(yùn)用于組合優(yōu)化問題;Mcclelland和Rumelhart用多層前饋網(wǎng)的反向傳播學(xué)習(xí)算法(Back Propagation)成功地解決了感知器不能解決的"異或"問題及其它的識(shí)別問題。他們的突破打消了此前人們由于簡(jiǎn)單線性神經(jīng)網(wǎng)絡(luò)感知功能的有限而產(chǎn)生的,使ANN成為了新的研究熱點(diǎn)。之后,新的網(wǎng)絡(luò)結(jié)構(gòu)和新的學(xué)習(xí)算法層出不窮,目前常見的都已達(dá)到幾十種。在這些神經(jīng)網(wǎng)絡(luò)中,徑向基函數(shù)RBF(Radial Basic Fuction)網(wǎng)絡(luò)由于具有強(qiáng)大的矢量分類功能和快速的計(jì)算能力,在非線性函數(shù)逼近等方面,特別是模式識(shí)別領(lǐng)域,獲得了廣泛的應(yīng)用,從而成為當(dāng)前神經(jīng)網(wǎng)絡(luò)研究中的一個(gè)熱點(diǎn)[4]。
模式識(shí)別是人工智能經(jīng)常遇到的問題之一。其主要的應(yīng)用領(lǐng)域包括手寫字符識(shí)別、自然語言理解、語音信號(hào)識(shí)別、生物測(cè)量以及圖像識(shí)別等領(lǐng)域。這些領(lǐng)域的共同特點(diǎn)都是通過對(duì)對(duì)象進(jìn)行特征矢量抽取,再按事先由學(xué)習(xí)樣本建立的有代表性的識(shí)別字典,把特征矢量分別與字典中的標(biāo)準(zhǔn)矢量匹配,根據(jù)不同的距離來完成對(duì)象的分類。以識(shí)別手寫數(shù)字為例,字典中有由學(xué)習(xí)樣本建立的10個(gè)標(biāo)準(zhǔn)矢量(代表0~0),把從識(shí)別對(duì)象中抽取的特征矢量分別與這10個(gè)標(biāo)準(zhǔn)矢量匹配,矢量間距離最短的就說明別對(duì)象與這個(gè)標(biāo)準(zhǔn)矢量的分類最接近,進(jìn)而識(shí)別出其表示的數(shù)字。
模式識(shí)別過程中,產(chǎn)生一個(gè)具有代表性的、穩(wěn)定且有效的特征矢量分類匹配策略,是補(bǔ)償變形、提高識(shí)別率的有效途徑,如何確定分類器是識(shí)別系統(tǒng)成功的關(guān)鍵??梢哉f,模式識(shí)別的本質(zhì)就是分類,就是把特片空間中一個(gè)特定的點(diǎn)(特征矢量)映射到一個(gè)適當(dāng)?shù)哪J筋悇e中。傳統(tǒng)的模式識(shí)別分類都是基于串行處理的匹配策略:首先由學(xué)習(xí)樣本建立識(shí)別基元(字、詞、音、像素)的標(biāo)準(zhǔn)矢量識(shí)別字典,取取的特征矢量順序與字典中的標(biāo)準(zhǔn)矢量計(jì)算區(qū)別得分;最后根據(jù)概率做出決策,輸出識(shí)別結(jié)果。當(dāng)模式類別很大時(shí),識(shí)別速度會(huì)下降得很快,而近年來,用RBF網(wǎng)絡(luò)解決這方面的問題得到了很好的效果。
理論模型要求發(fā)展神經(jīng)網(wǎng)絡(luò)型計(jì)算機(jī)來實(shí)現(xiàn),但迄今 為止,這方面的工作限于條件還主要集中在傳統(tǒng)計(jì)算機(jī)的軟件模擬實(shí)現(xiàn)上。大多數(shù)學(xué)者認(rèn)為,要使人工神經(jīng)網(wǎng)絡(luò)更快、更有效地解決更大規(guī)模的總是,關(guān)鍵在于其超大規(guī)模集成電路(V LSI)硬件的實(shí)現(xiàn),即把神經(jīng)元和連接制作在一塊芯片上(多為CMOS)構(gòu)成ANN。正是因?yàn)樯鲜龅脑?,其中神?jīng)網(wǎng)絡(luò)的VLSI設(shè)計(jì)方法近年來發(fā)展很快,硬件實(shí)現(xiàn)已成為ANN的一個(gè)重要分支[5],[6]。
以下介紹IBM的專利硬件RBF神經(jīng)網(wǎng)絡(luò)芯片技術(shù)ZISC(Zero Instruction Set Computer),并給出用ZISC設(shè)計(jì)和實(shí)現(xiàn)的一種模式識(shí)別系統(tǒng)。
1 用VLSI設(shè)計(jì)硬件神經(jīng)網(wǎng)絡(luò)的方法
神經(jīng)網(wǎng)絡(luò)的IC實(shí)現(xiàn)是比較困難的,設(shè)計(jì)者必須把神經(jīng)系統(tǒng)模型的特性反映到受半導(dǎo)體工藝和IC設(shè)計(jì)規(guī)則制約的電路中去。用VLSI設(shè)計(jì)硬件神經(jīng)網(wǎng)絡(luò)的方法主要分為數(shù)字技術(shù)、模擬技術(shù)和數(shù)模混合技術(shù)等,下面分別作簡(jiǎn)要介紹。
(1)用模擬技術(shù)實(shí)現(xiàn)硬件神經(jīng)網(wǎng)絡(luò)
模擬神經(jīng)芯片通過單元器件的物理性質(zhì)來進(jìn)行計(jì)算,因而可以獲得很高的速度。神經(jīng)元的核函數(shù)計(jì)算功能一般由乘法器或運(yùn)算放大器來完成,而連接權(quán)值大多以電壓形式存儲(chǔ)在電容上或是以電荷形式存儲(chǔ)在浮點(diǎn)門上。利用模擬神經(jīng)芯片不僅可以制造多層前向感知器那樣的傳統(tǒng)結(jié)構(gòu),還能從形態(tài)上進(jìn)行如硅視網(wǎng)膜這樣的生物仿真設(shè)計(jì),從而更有效地模擬生物學(xué)功能。
在解決實(shí)時(shí)感知類的問題中,模擬神經(jīng)芯片扮演著主要的角色。因?yàn)檫@些問題不要求精確的數(shù)學(xué)計(jì)算,而主要是對(duì)大量的信息流進(jìn)行集合和并行處理,這方面低精度的模擬技術(shù)從硅片面積、速度和功耗來看具有相當(dāng)大的優(yōu)勢(shì)。但是模擬芯片的抗干擾性差,設(shè)計(jì)中需要考慮對(duì)環(huán)境因素變化引起的誤差進(jìn)行補(bǔ)償,非常麻煩;它的另一個(gè)缺點(diǎn)是,制造一個(gè)突觸必須考慮權(quán)值存儲(chǔ)的復(fù)雜性,同時(shí)要求放大器在很寬的范圍內(nèi)呈現(xiàn)線性[5],[6]。
(2)用數(shù)字技術(shù)實(shí)現(xiàn)硬件神經(jīng)網(wǎng)絡(luò)
用高低電平來表示不同狀態(tài)的數(shù)字電路是信息工業(yè)中最常用的技術(shù)。數(shù)字神經(jīng)芯片有非常成熟的生產(chǎn)工藝,它的權(quán)值一般存儲(chǔ)在RAM或EPROM等數(shù)字存儲(chǔ)器中,由乘法器和加法器實(shí)現(xiàn)神經(jīng)元并行計(jì)算。對(duì)設(shè)計(jì)者來說,數(shù)字神經(jīng)芯片可以以很高的計(jì)算精度(達(dá)到32位或者更高)實(shí)現(xiàn)神經(jīng)元核函數(shù)。另外,用數(shù)字技術(shù)實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)時(shí),通??梢圆捎脴?biāo)準(zhǔn)單元庫或可編程門陣列直接進(jìn)行電路設(shè)計(jì),這樣可以大大減少設(shè)計(jì)時(shí)間[5],[6]。
數(shù)字神經(jīng)芯片不僅具有容錯(cuò)性好、易于硬件實(shí)現(xiàn)及高精度、高速度的優(yōu)點(diǎn)。更重要的是有很多數(shù)字電路CAD的軟件可以作為設(shè)計(jì)工具使用。但要實(shí)現(xiàn)乘/加運(yùn)算,需要大量的運(yùn)算單元和存儲(chǔ)單元。因而對(duì)芯睡面積和功耗要求很高。為了適應(yīng)大面積的數(shù)字電路的要求,現(xiàn)在很多數(shù)字神經(jīng)芯片都采用了硅片集成技術(shù)(Wafer-Scale Integration)。
(3)用數(shù)模混合技術(shù)實(shí)現(xiàn)硬件神經(jīng)網(wǎng)絡(luò)
出于上述種種考慮,許多研究人員提出并采用了各種數(shù)?;旌仙窠?jīng)芯片,具有數(shù)字及模擬工藝各息的優(yōu)點(diǎn)而避免各自的缺點(diǎn),運(yùn)算速率高,芯片面積小,抗噪聲能力強(qiáng)且易于設(shè)計(jì)。典型的數(shù)模混合信號(hào)處理部分則全是模擬的。這種結(jié)構(gòu)很容易與其它的數(shù)字系統(tǒng)接口以完成模塊化設(shè)計(jì)。近年來在各種數(shù)?;旌仙窠?jīng)芯片設(shè)計(jì)中,利用脈沖技術(shù)的數(shù)模混合神經(jīng)芯片和利用光互連技術(shù)的光電混合神經(jīng)網(wǎng)絡(luò)芯片得到了廣泛的關(guān)系,它們代表神經(jīng)網(wǎng)絡(luò)未來發(fā)展的方向。
盡管數(shù)?;旌仙窠?jīng)芯片有種種優(yōu)點(diǎn),但它也存在著一些不足。比如,對(duì)于大多數(shù)數(shù)模混合神經(jīng)芯片來說,訓(xùn)練學(xué)習(xí)算法的實(shí)現(xiàn)往往需要一個(gè)附加的協(xié)處理器,這無疑會(huì)增加整個(gè)神經(jīng)網(wǎng)絡(luò)系統(tǒng)的成本和復(fù)雜性[5],[6]。
2 RBF網(wǎng)絡(luò)原理和它的硬件實(shí)現(xiàn)
RBF網(wǎng)絡(luò)是一種有導(dǎo)師的三層前饋網(wǎng)絡(luò)。它最重要的特點(diǎn)是中間隱層神經(jīng)元的基函數(shù)只對(duì)輸入剩激起局部反應(yīng),即只有當(dāng)輸入落在輸入空間的 一個(gè)局部區(qū)域時(shí),基函數(shù)才產(chǎn)生一個(gè)重要的非零響應(yīng);而在其它情況下基函數(shù)輸出很小(可近似為零)。網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1(a)描述了隱層神經(jīng)元的作用,其中X=(x1,x2,…,Xn)是輸入層的輸入矢量;C=(w1,w2,…,Wn)是該隱層神經(jīng)元的中心矢量(每個(gè)隱層神經(jīng)元的中心徉量存儲(chǔ)在其與輸入各種神經(jīng)元之間的連接權(quán)中),σ代表寬度(半徑);而|| ||表示n維空間中矢量之間的距離(這里的距離不一定是數(shù)學(xué)意義上的歐幾里得距離,在不同的情況下可以有種種含義);f是隱層神經(jīng)元的基函數(shù),目前用得比較多的是高斯分布函數(shù)。
RBF網(wǎng)絡(luò)每個(gè)輸出層結(jié)點(diǎn)的輸出為其與各隱層神經(jīng)元輸出y的加權(quán)求和。按高斯分布函數(shù)的定義,隱層神經(jīng)元的輸出y與輸入矢量x的函數(shù)關(guān)系應(yīng)服從正態(tài)分布,即當(dāng)X與中心矢量C的距離很矢時(shí),y接近最大值;反之y值減小。如X與C的距離超過寬度σ(即遠(yuǎn)離中心)時(shí),輸出y可近似為零,相當(dāng)于對(duì)輸出層沒有貢獻(xiàn)。這就實(shí)現(xiàn)了局部感知。
不難看出,RBF網(wǎng)絡(luò)用作矢量分類器時(shí),輸入層神經(jīng)元個(gè)數(shù)由矢量空間的維數(shù)決定,隱層神經(jīng)元個(gè)數(shù)由模擬類別數(shù)決定,每個(gè)隱層神經(jīng)元的中心矢量(與輸入層各神經(jīng)元之間的連接權(quán))都代表一種模式類別。輸入矢量與哪個(gè)隱層神經(jīng)元的中心矢量距離近,哪個(gè)隱層神經(jīng)元的基函數(shù)輸出就大,相應(yīng)的模式類別對(duì)輸出層的貢獻(xiàn)就大;與哪個(gè)隱層神經(jīng)元的中心矢量距離遠(yuǎn),哪個(gè)隱層神經(jīng)元的基函數(shù)輸出就小,甚至不激活,輸出0,相應(yīng)的模式類別當(dāng)然就不會(huì)影響RBF網(wǎng)絡(luò)的輸出,矢量和模式類別的分類由此完成。
相對(duì)于網(wǎng)絡(luò)結(jié)構(gòu)的簡(jiǎn)單,RBF網(wǎng)絡(luò)權(quán)值的訓(xùn)練方法要復(fù)雜一些。通常分為下面的兩個(gè)步驟。
①隱層和輸入層之間的權(quán)值采用無教師聚類方法訓(xùn)練,最常用的是KNN法(K-Nearest-Neighbor)。它的基本思想是先設(shè)定訓(xùn)練樣本的一個(gè)子集;再用模式分類算法LBG由這個(gè)子集形成N種類的模式,即把子集中的樣本歸類;然后,按順序處理子集外的訓(xùn)練樣本:對(duì)任一樣本X,找出K個(gè)與X距離最近的矢量(隨便找,只要近就行),計(jì)算這K個(gè)矢量分別屬于N個(gè)模式種類的數(shù)目,哪個(gè)模式種類包含的最近矢量最多,X就屬于哪個(gè)模式種類。
將輸入的訓(xùn)練樣本聚類后,每個(gè)模式種類中所有樣本矢量的平均值就代表該隱層神經(jīng)元和輸入層之間的權(quán)值(中心矢量);而所有樣本矢量與中心矢量的平方差的平均值就代表寬度σ。這樣就做出了各個(gè)隱層神經(jīng)元的全部參數(shù)。因?yàn)檫@種方法只要求輸入訓(xùn)練樣本就可以進(jìn)行分類,無須知道訓(xùn)練樣本的理想輸出,因此被稱為無教師方法。
②輸出層和隱層之間的權(quán)值采用有教師聚類方法訓(xùn)練。簡(jiǎn)便實(shí)用的一種辦法是:在確定隱層和輸入層之間的權(quán)值之后,把訓(xùn)練樣本矢量和其理想輸出代入RBF網(wǎng)絡(luò),從而推出各個(gè)輸出層神經(jīng)元和隱層之間的權(quán)值。
可以看出,需要分類的模式類別數(shù)的增加總可以通過不斷增加三層RBF網(wǎng)絡(luò)隱層神經(jīng)元數(shù)來實(shí)現(xiàn),含義十分直觀。由于其學(xué)習(xí)過程為兩步,且每一步的學(xué)習(xí)算法都十分有效,所以它的學(xué)習(xí)速度很快。RBF網(wǎng)絡(luò)主要適用于解決已知的大規(guī)模分類問題,比如圖像目標(biāo)跟蹤、面部和雙眼的生物圖像識(shí)別等。
對(duì)RBF網(wǎng)絡(luò)的硬件實(shí)現(xiàn)技術(shù),目前存在著不同的觀點(diǎn)。但就有大規(guī)模分類和實(shí)時(shí)要求的模式識(shí)別問題而言,數(shù)字電路技術(shù)是最合適的選擇,原因有以下幾點(diǎn):
①RBF網(wǎng)絡(luò)用于手寫字符識(shí)別、生物圖像識(shí)別、自然語言理解這樣的領(lǐng)域時(shí),需要分類的模式類別數(shù)往往成千上萬,所以要求隱層神經(jīng)元數(shù)極大,單片神經(jīng)芯片很難完成。使用數(shù)字神經(jīng)芯片,網(wǎng)絡(luò)的擴(kuò)展十分容易,一般不需要外圍邏輯器件而只要電阻就可以完成;而用數(shù)字神經(jīng)芯片由于精度高,理論上可以無限并行擴(kuò)展,且性能不下降。
②一個(gè)實(shí)用的模式識(shí)別系統(tǒng),分類的模式往往會(huì)隨著樣本與環(huán)境的變化而變化,這就需要不斷調(diào)整權(quán)值。數(shù)字神經(jīng)芯片的權(quán)值存在數(shù)字存儲(chǔ)器中,存儲(chǔ)和恢復(fù)都很方便。這樣用于模式識(shí)別系統(tǒng)的RBF網(wǎng)絡(luò)的權(quán)值易變性得到了保證。
③模式識(shí)別系統(tǒng)對(duì)特征矢量提取對(duì)象的預(yù)處理是比較困難的工作。預(yù)處理效果不好時(shí),RBF網(wǎng)絡(luò)的輸入往往含有噪聲。數(shù)字神經(jīng)芯片在抗干擾性方面與其它V LSI技術(shù)相比,顯然具有無可比擬的優(yōu)勢(shì)。
④模式識(shí)別的要求包括模糊匹配和精確匹配兩種。當(dāng)用RBF網(wǎng)絡(luò)實(shí)現(xiàn)精確匹配時(shí),模擬技術(shù)完成不了這個(gè)要求,此時(shí),數(shù)字神經(jīng)芯片是避免錯(cuò)誤輸出的唯 一選擇。
3 ZISC技術(shù)及其在模式識(shí)別中的應(yīng)用
雖然人們已經(jīng)在神經(jīng)網(wǎng)絡(luò)的硬件實(shí)現(xiàn)上做了大量的工作,并實(shí)現(xiàn)了許多不同的網(wǎng)絡(luò)結(jié)構(gòu)和算法;但是RBF網(wǎng)絡(luò)的硬件實(shí)現(xiàn)工作卻了了無幾。這說明幅度當(dāng)前的IC技術(shù)實(shí)現(xiàn)RBF網(wǎng)絡(luò)的功能對(duì)設(shè)計(jì)水平的要求是比較高的,因此,本文介紹的這種商業(yè)芯片ZISC就成為了模式識(shí)別系統(tǒng)的一種有價(jià)值的神經(jīng)網(wǎng)絡(luò)硬件平臺(tái)。
無指令計(jì)算機(jī)ZISC是世界著名的IBM實(shí)驗(yàn)室的一項(xiàng)創(chuàng)新性科研成果[7],它采用數(shù)字電路技術(shù)實(shí)現(xiàn)了RBF神經(jīng)網(wǎng)絡(luò)及KNN學(xué)習(xí)算法的集成電路芯片。作為ZISC芯片的合作發(fā)明人與授權(quán)生產(chǎn)商,美國(guó)Silicon Rcognition公司專業(yè)從事ZISC技術(shù)推廣,其生產(chǎn)的ZISC036是一顆含有36個(gè)隱層神經(jīng)元,專門用于各種模式識(shí)別矢量分類的集成電路。以下列出了它的一些主要特點(diǎn)與功能:
*使用RBF網(wǎng)絡(luò)模型,無須編程而只須給它訓(xùn)練樣本,即能實(shí)現(xiàn)學(xué)習(xí)和自適應(yīng)識(shí)別;
*全并行運(yùn)算,模式分類速度與隱層神經(jīng)元存儲(chǔ)的矢量數(shù)量完全無關(guān);
*無須外圍邏輯電路即可實(shí)現(xiàn)多片ZISC036級(jí)連,模式分類數(shù)量及神經(jīng)網(wǎng)絡(luò)規(guī)模沒有限制;
*輸入和存儲(chǔ)的矢量分量數(shù)目從1~64個(gè)可調(diào)(每個(gè)分量8位);
*超快速度,64個(gè)分量的特征矢量的識(shí)別在4.8ms內(nèi)完成(主頻時(shí)鐘20MHz);
*用寄存器存儲(chǔ)神經(jīng)網(wǎng)絡(luò)全局信息與神經(jīng)元信息和權(quán)值;
*CMOS和TTL兼容的I/O,TQFP144封裝,5V標(biāo)準(zhǔn)電源供電。
不難看出,應(yīng)用這種神經(jīng)網(wǎng)絡(luò)芯片不需要操作系統(tǒng)和編程語言,主要的工作就是訓(xùn)練它和讓它學(xué)習(xí)。因此,用它開發(fā)面向消費(fèi)類的模式識(shí)別產(chǎn)品是一種簡(jiǎn)單且實(shí)用可行的方法,可以大大地縮短研發(fā)周期。
本文給出了用六片ZISC036級(jí)連,通過印制電路板實(shí)現(xiàn)的通用模式識(shí)別系統(tǒng)。圖2為這個(gè)系統(tǒng)的總體框圖。
系統(tǒng)通過PCI總線接受待識(shí)別的模式原始數(shù)據(jù)。數(shù)字存儲(chǔ)在2個(gè)8MB高速DRAM區(qū)中。神經(jīng)網(wǎng)絡(luò)控制器選用Xilinx Virtex FPGA,它的主要功能是完成對(duì)原始數(shù)據(jù)的特征矢量提取并輸入到ZISC036芯片陣列中??梢允褂脴?biāo)準(zhǔn)的FPGA開發(fā)工具生成不同的RBF文件,從而實(shí)現(xiàn)不同的特征矢量提取電路。ZISC036芯片陣列按照三描述的方法一個(gè)個(gè)順序接受矢理輸入,然后進(jìn)行并行的學(xué)習(xí)和分類,識(shí)別結(jié)果作為輸出返回。只要修改FPGA中的特征矢量提取電路和界面程序,就可以實(shí)現(xiàn)圖像、話音等各種不同的模式識(shí)別程序,只要修改FPGA中的特征矢量提取電路和界面程序,就可以實(shí)現(xiàn)圖像、話音等各種不同的模式識(shí)別功能。這個(gè)通用模式識(shí)別系統(tǒng)的性能以傳統(tǒng)CPU或DSP的指標(biāo)來衡量,相當(dāng)于13.2GPS(每秒執(zhí)行132億條指令)。
用上述系統(tǒng)可以完成如圖像目標(biāo)跟蹤、圖像識(shí)別、數(shù)據(jù)挖掘等許多實(shí)時(shí)性要求很高的模式識(shí)別和分類功能。以下用一個(gè)自適應(yīng)圖像目標(biāo)跟蹤的實(shí)驗(yàn)作為例子,視頻圖片演示結(jié)果如圖3所示。
圖3的視頻圖片從一段AVI文件中捕獲。首先從初始的視頻幀中選定汽車的圖像,提取其紋理特征作為訓(xùn)練樣本輸入到ZISC神經(jīng)網(wǎng)絡(luò)。然后,ZISC神經(jīng)網(wǎng)絡(luò)在后面接下來的視頻幀中搜索類似的圖像紋理模式并圈定跟蹤目標(biāo)的坐標(biāo)。如果發(fā)現(xiàn)所跟蹤目標(biāo)的模式發(fā)生變化,ZISC神約網(wǎng)絡(luò)能夠自動(dòng)學(xué)習(xí)新的特征并建立一個(gè)新的模式存入神經(jīng)網(wǎng)絡(luò)。通過不斷地比較已存入神經(jīng)網(wǎng)絡(luò)的模式和所跟蹤目標(biāo)之間的區(qū)別,系統(tǒng)就能夠識(shí)別目標(biāo),從而在擁擠的背景和變化的環(huán)境下始終鎖定目標(biāo)。實(shí)驗(yàn)用視頻圖片為320×240像素,跟蹤目標(biāo)掃描范圍為20×20像素。
篇4
關(guān)鍵詞: GIS局放信號(hào) 小波去噪 識(shí)別方法
GIS局放信號(hào)小波分析的原理建立在傅立葉分析的基礎(chǔ)之上,在頻域和時(shí)域這兩個(gè)方面進(jìn)行了有效的調(diào)整,是對(duì)后者分析方法的有效提高。小波分析具有多分辨率的特點(diǎn),在低頻段的區(qū)域內(nèi)可以使用較高的頻率分辨率和較低的時(shí)間分辨率,而在高頻段的區(qū)域內(nèi)則使用較低的頻率分辨率和較高的時(shí)間分辨,利用該識(shí)別模式實(shí)現(xiàn)GIS局放信號(hào)小波去噪的目的。
一、小波分析的基本原理
小波分析的基礎(chǔ)在于小波基原理的應(yīng)用,世界上第一個(gè)小波基是由Strongberg J.O在1982年提出的。小波在變換特征上具有“變焦距”的特征,也就是上面所說的能夠根據(jù)其自身的特點(diǎn)結(jié)合實(shí)際環(huán)境的要求改變時(shí)頻窗口的大小,從而改變局部放電信號(hào)測(cè)試能力的準(zhǔn)確度。當(dāng)頻率越來越高的時(shí)候,小波的頻寬越來越窄,這種特性反應(yīng)到局放測(cè)試中就變成了當(dāng)噪聲頻率越高時(shí),小波檢測(cè)在時(shí)間上的跨度上越窄,在空間的跨度上越長(zhǎng),從而可以抓住所檢測(cè)范圍的細(xì)小范圍,因此,小波在應(yīng)用上有“數(shù)學(xué)顯微鏡”之美譽(yù)。
二、信號(hào)的小波分解特性
1.小波分解特性的重要性
GIS局放測(cè)試得到的信號(hào)是離散的,在利用小波原理進(jìn)行分析的時(shí)候必須了解信號(hào)在小波原理下的分解特性,這樣才能更好地在實(shí)踐過程中利用小波分析達(dá)到GIS局放測(cè)試的去噪作用。經(jīng)過大量的研究表明,在GIS局放過程中背景噪聲在所有檢測(cè)到信號(hào)中占了很多一部分,而且形式多種多樣,比如說有連續(xù)的周期性干擾、脈沖型干擾,還有更多白噪聲干擾等。目前來講,GIS局放信號(hào)中的去噪過程主要是指去除白噪聲對(duì)于信號(hào)檢測(cè)的干擾影響。 背景噪聲的干擾加大了局放信號(hào)檢測(cè)的難度。在分析信號(hào)的小波分解特性時(shí),我們需要知道局部放電這一物理過程發(fā)生時(shí)間實(shí)際上非常短暫,而且在絕緣材料中的運(yùn)動(dòng)模式也非常雜亂無章,這正是局放信號(hào)檢測(cè)的難度所在。小波原理之所以在GIS局放檢測(cè)中有其獨(dú)特的魅力,正是因?yàn)槠渚址判盘?hào)分解的獨(dú)特性。
2.基于離散小波分析原理的去噪作用
離散小波分析原理是小波分析手段中的重要組成部分,是GIS局放信號(hào)檢測(cè)去噪過程的重要手段。按照時(shí)間頻率和空間頻率的設(shè)定值產(chǎn)生的不同作用,離散小波分析可以簡(jiǎn)單地分為三種類型。
(1)強(qiáng)制型消燥處理方式。從本質(zhì)原因上來講,局部放電產(chǎn)生的原因主要有電介質(zhì)分布不均勻、制造工藝中出現(xiàn)氣泡和雜志等。比如在絕緣材料的制作過程中由于不同電介質(zhì)的膨脹系數(shù)不一樣,成品出現(xiàn)不同的密度,使部分區(qū)域承受的電壓不一樣。當(dāng)電壓值超過其承受值的時(shí)候就導(dǎo)致了局部放電。介質(zhì)的干擾作用越大,則局放越明顯。強(qiáng)制型消燥的處理方式就是人為地去除一些高頻率信號(hào)的影響,把頻段控制在某一區(qū)域進(jìn)行檢測(cè),這種方法雖然使觀測(cè)結(jié)果比較集中,但是容易丟失有用的信號(hào)。
(2)默認(rèn)閾值型消燥處理方式。該方式利用檢測(cè)設(shè)備中自帶的數(shù)據(jù)庫,通過適當(dāng)刷選,從而對(duì)局放信號(hào)進(jìn)行消燥。該方式比強(qiáng)制型消燥方式更加科學(xué),但是仍然有可能排除掉很多有參考價(jià)值的測(cè)試信號(hào)。
(3)待定值消燥型處理方式。這種方法結(jié)合了強(qiáng)制型和默認(rèn)閾值型的消燥方式,通過在設(shè)備上設(shè)置多個(gè)參考點(diǎn),用戶可以根據(jù)自身產(chǎn)品的特性,使用環(huán)境的要求等具體情況預(yù)先設(shè)定參考值的上下線范圍,在這一參考值范圍內(nèi)設(shè)備根據(jù)自帶的數(shù)據(jù)庫自動(dòng)進(jìn)行信號(hào)的消燥作用。這種消燥方式更加科學(xué)化,但是對(duì)局放測(cè)試設(shè)備的操作提出了更高的要求。
三、小波去噪模式識(shí)別方式
局部放電過程在時(shí)間上是非常短暫的,同樣,其在空間上運(yùn)動(dòng)軌跡也是飄忽不定的,我們需要設(shè)定一個(gè)坐標(biāo)性判斷其運(yùn)動(dòng)模式,才能進(jìn)一步根據(jù)小波分析原理分析GIS局放測(cè)試信號(hào)的去噪識(shí)別方式。
我們以神經(jīng)網(wǎng)絡(luò)的局放模式作為特定的例子,簡(jiǎn)要地說明小波去噪模式的識(shí)別方式,該坐標(biāo)系也是目前運(yùn)用得最廣泛的一種。我們以神經(jīng)網(wǎng)絡(luò)系統(tǒng)舉例說明小波去噪模式的識(shí)別主要是因?yàn)樯窠?jīng)網(wǎng)絡(luò)系統(tǒng)是一個(gè)高度復(fù)雜的系統(tǒng),從單一的神經(jīng)元結(jié)構(gòu)分析其功能和結(jié)構(gòu)是十分簡(jiǎn)單,這好比在整個(gè)小波識(shí)別模式中的基本單元――小波基一樣。小波基在整個(gè)識(shí)別模式中是結(jié)構(gòu)和功能最簡(jiǎn)單的部分,也是我們分析小波去噪識(shí)別模式的基礎(chǔ)。
由此我們可以設(shè)想小波去噪識(shí)別系統(tǒng)是類似于神經(jīng)網(wǎng)絡(luò)的復(fù)雜系統(tǒng),雖然其基本單位小波基的運(yùn)行是十分簡(jiǎn)單的,但整個(gè)網(wǎng)絡(luò)系統(tǒng)充滿著大量自學(xué)習(xí)和變化的因素,假設(shè)有一個(gè)未知信號(hào)進(jìn)入到該系統(tǒng)中,小波去噪模式系統(tǒng)就會(huì)根據(jù)原有的映射關(guān)系,這些映射關(guān)系是在長(zhǎng)期的自學(xué)習(xí)和變化中形成的,將該信號(hào)分配到一定的輸出狀態(tài)中,從而完成全部輸入信號(hào)的分配過程。那么在待定值消燥型原則的作用下,一定范疇內(nèi)的信號(hào)在能被收集成為有效的采樣點(diǎn),這一待定值的設(shè)定反映在該系統(tǒng)中就是有部分未知信號(hào)進(jìn)入系統(tǒng)中時(shí),即我們所說的背景噪聲,將成為無效值而被排除在采樣點(diǎn)之外。
四、結(jié)語
本文簡(jiǎn)要地介紹了在小波原則下測(cè)試GIS局部放電信號(hào)的去噪原理和模式識(shí)別方式舉例,顯然在局放信號(hào)的檢測(cè)中頻寬的設(shè)定對(duì)局放信號(hào)檢測(cè)的精確性起著至關(guān)重要的作用,小波去噪的特性能夠有效地滿足GIS局放信號(hào)檢測(cè)的要求,應(yīng)該得到我們足夠的重視。
參考文獻(xiàn):
[1]胡明友,謝恒莖等.基于小波原則抑制局部放電監(jiān)測(cè)中平穩(wěn)性干擾的濾波研究.中國(guó)電機(jī)工程學(xué)報(bào),2000.1,VOL20,(1).
[2]王曉芙等,電力設(shè)備局部放電測(cè)量中抗干擾研究的現(xiàn)狀和展望電網(wǎng)技術(shù).電工技術(shù)學(xué)報(bào),2000.6,VOL24,(6).
篇5
關(guān)鍵詞:策略 解題能力 提高
中學(xué)數(shù)學(xué)教學(xué)的目的,歸根結(jié)底在于培養(yǎng)學(xué)生的解題能力,提高數(shù)學(xué)解題能力是數(shù)學(xué)教學(xué)中一項(xiàng)十分重要的任務(wù)。提高學(xué)生解題能力始終貫穿于教學(xué)始終,我們必須把它放在十分重要的位置。那么,如何才能提高學(xué)生的解題能力,面對(duì)一個(gè)數(shù)學(xué)問題,采取什么解決方法是我們首先進(jìn)行的思維。數(shù)學(xué)中許多問題可用固定的算法求解,但有更多的題目其算法是預(yù)先不知道的,需要運(yùn)用某些策略來指導(dǎo)解決。策略在數(shù)學(xué)問題的解決中發(fā)揮著極為重要的作用,學(xué)生倘若沒有掌握一些解題策略或者所用解題策略不恰當(dāng),則常常導(dǎo)致無從下手或誤入歧途,這樣不僅不能解決問題,浪費(fèi)學(xué)生的時(shí)間,還會(huì)打擊學(xué)生的學(xué)習(xí)積極性。
模式識(shí)別策略就是當(dāng)你接觸到數(shù)學(xué)問題之后,首先要辨別題目的類型,以便與已有的知識(shí)、經(jīng)驗(yàn)發(fā)生聯(lián)系。也就是當(dāng)我們面臨的是一道以前沒有接觸過的陌生題目時(shí),要設(shè)法把它化為曾經(jīng)解過的或比較熟悉的題目,以便充分利用已有的知識(shí)、經(jīng)驗(yàn)或解題模式,順利地解出原題。如果我們?cè)诮虒W(xué)過程有意識(shí)培養(yǎng)學(xué)生的模式識(shí)別策略意識(shí),那會(huì)對(duì)學(xué)生的思維、數(shù)學(xué)解題水平有很大的幫助。使學(xué)生在平常學(xué)習(xí)中提高效率,在考試時(shí)穩(wěn)操勝券,對(duì)學(xué)生數(shù)學(xué)素質(zhì)的提高起到事半功倍的作用。提高學(xué)生的模式識(shí)別策略意識(shí)常用的途徑有:
(一)回憶
解數(shù)學(xué)題,就其本身而言,要有明確的目的性——實(shí)現(xiàn)題目的要求,始終想著目標(biāo),圍繞目標(biāo),進(jìn)行變換,要抓住條件,緊扣目標(biāo),廣泛聯(lián)想,要想解決問題,必須深刻熟練地掌握知識(shí),對(duì)知識(shí)形成條件反射,看到問題條件和目標(biāo),就能聯(lián)想到與此有關(guān)的知識(shí),這是分析問題的基礎(chǔ)。
在解決問題之前,我們應(yīng)充分聯(lián)想和回憶與原有問題相同或相似的知識(shí)點(diǎn)和題型,充分利用相似問題中的方式、方法和結(jié)論,從而解決現(xiàn)有的問題,如
例1 已知sinα-2cosα=0,求3sin2α+3sinαcosα-2cos2α。
分析:聯(lián)想sin2α+ cos2α=1經(jīng)常在求三角函數(shù)值的時(shí)候應(yīng)用,把1用sin2α+ cos2α代換進(jìn)行化簡(jiǎn)變形。
例2 已知f(x)=2+log3x(1≤x≤9),求函數(shù)y=[f(x)]2+f(x2)的最大值和最小值并求出相應(yīng)的x的值.
分析: 聯(lián)想二次函數(shù)配方求最值,換元求范圍,配方求出y的最大值和最小值。
要想在這一方面有所提高,平時(shí)做完練習(xí)后,要注重反思這一環(huán)節(jié),注意知識(shí)點(diǎn)的系統(tǒng)化和方法的優(yōu)化。要把解題的過程抽象形成思維模塊,注意方法的遷移和問題的拓展延伸。教師要不斷的指導(dǎo),不斷的示范,幫助學(xué)生形成某類數(shù)學(xué)問題的心理操作模式,并將其表象印入頭腦中,并使學(xué)生內(nèi)化為自己的意識(shí),今后解題時(shí)自動(dòng)運(yùn)用。
(二)多角度分析 對(duì)于同一道數(shù)學(xué)題,常??梢圆煌膫?cè)面、不同的角度去認(rèn)識(shí),注意思維的廣闊性,多角度多側(cè)面地思考問題,若從一個(gè)方面看問題思路受阻,就應(yīng)調(diào)整觀察分析問題的角度,從另一個(gè)側(cè)面思考問題,從不同的方向探索思路,“熟能生巧”,因此,根據(jù)自己的知識(shí)和經(jīng)驗(yàn),適時(shí)調(diào)整分析問題的視角,有助于更好地把握題意,找到自己熟悉的解題方向。
例1 如果cos2θ+2msinθ-2m-2
分析:直接求解會(huì)感到無從下手,我們比較熟悉求三角函數(shù)式的取值范圍,解決這個(gè)問題我們轉(zhuǎn)換思路,就是不直接求常數(shù)m的取值范圍,轉(zhuǎn)而去求三角函數(shù)式的取值范圍,問題便可應(yīng)刃而解。
例2 三個(gè)方程x2+4ax-4a+3=0,x2+(a-1)x+a2=0,x2+2ax-2a=0中,至少有一個(gè)方程有實(shí)數(shù)根,求實(shí)參數(shù)a的取值范圍。
分析:對(duì)于一個(gè)方程有實(shí)數(shù)根的條件,學(xué)生很熟悉,但三個(gè)方程至少有一個(gè)方程有實(shí)數(shù)根的條件,學(xué)生可能一時(shí)無法入手?;蛘咧苯忧竺總€(gè)方程有實(shí)數(shù)根的條件,然后去對(duì)這些條件進(jìn)行處理,有些學(xué)生交并分不清,結(jié)果出錯(cuò),有些學(xué)生雖然知道求并集,但由于條件較多,很容易在求并集的時(shí)候出錯(cuò)。我們轉(zhuǎn)換思路,不求三個(gè)方程至少一個(gè)方程有實(shí)數(shù)根的條件,轉(zhuǎn)而去求三個(gè)方程都沒有實(shí)數(shù)根的條件,然后求補(bǔ)集。問題即可解決。
在這一方面要想使學(xué)生有所提高,應(yīng)該加強(qiáng)培養(yǎng)學(xué)生全方位、多角度地思考問題,找出解決問題的辦法,并加以推廣,并鼓勵(lì)學(xué)生探求某種方法或定理所使用的各種問題,擴(kuò)大它的應(yīng)用范圍。要求教師在課堂上創(chuàng)設(shè)一個(gè)寬松的思維環(huán)境,使學(xué)生在其中有主動(dòng)學(xué)習(xí)的欲望,使學(xué)生成為自由的思維者。
(三)恰當(dāng)構(gòu)造輔助元素
數(shù)學(xué)中,同一素材的題目,常常可以有不同的表現(xiàn)形式;條件與結(jié)論(或問題)之間,也存在著多種聯(lián)系方式。因此,恰當(dāng)構(gòu)造輔助元素,有助于改變題目的形式,溝通條件與結(jié)論(或條件與問題)的內(nèi)在聯(lián)系,把陌生題轉(zhuǎn)化為熟悉問題。
例 PA、PB、PC是空間從P引出的三條射線, 若∠APB=∠BPC=∠CPA=45°,求二面角B-PA-C的平面角的余弦值。
分析:在三條射線上截取PA=PB=PC,構(gòu)造一個(gè)正三棱錐,問題即可解決。
在這一方面學(xué)生要想有所提高,要求教師在教學(xué)過程中,設(shè)計(jì)相應(yīng)問題,對(duì)學(xué)生進(jìn)行詳細(xì)的、具體的解題訓(xùn)練。
(四)借助“形異質(zhì)同”
有些數(shù)學(xué)問題,表面上看結(jié)構(gòu)、條件毫不相干,卻具有內(nèi)在的共同點(diǎn),因此,從問題的個(gè)性中尋找共性,把不同的問題歸結(jié)為相同的問題。
例1 上一個(gè)n階臺(tái)階,每次可上一級(jí)或兩級(jí),設(shè)上法的種數(shù)為f(n),試求f(n)關(guān)于n的函數(shù)解析式。
分析:有最后一次上一級(jí)和最后一次上兩級(jí)兩類上法,所以,f(n)= f(n-1)+f(n-2)
(2)一對(duì)小兔子一個(gè)月后是一對(duì)成熟的大兔子,再過一個(gè)月一對(duì)大兔子繁殖一對(duì)小兔子,現(xiàn)有一對(duì)成熟的兔子,問第n個(gè)月末,兔子最多有多少對(duì)?
分析:?jiǎn)栴}(2)看上去問題(1)毫不相干,但它們卻具有內(nèi)在的共同點(diǎn),即兩個(gè)問題有共同思維方法,即都要考慮前兩次的情形,都?xì)w并到“斐波那契數(shù)列”上。
另外對(duì)已有定理公式的辨認(rèn),對(duì)已有解題規(guī)律,方法的辨析,與類似問題及較簡(jiǎn)單的類比等均屬模式識(shí)別策略范疇。
解題有法而無定法。解題要靈活多變,講究策略,既要遵循常規(guī),更要突破常規(guī)。只有這樣,才能準(zhǔn)確地迅速地找到解題的突破口,有效地提高解題能力。這正是:策略對(duì)了頭,學(xué)習(xí)有勁頭。
學(xué)習(xí)有勁頭,更上一層樓。
對(duì)于解題策略的教學(xué),我們教師還應(yīng)該意識(shí)到:盡管解題策略本身是離開具體內(nèi)容的,但要學(xué)生掌握這些解題策略,并運(yùn)用到平常解決數(shù)學(xué)問題中,僅僅給學(xué)生提供一般化的策略信息是不夠的。應(yīng)對(duì)學(xué)生掌握的解題策略的運(yùn)用情景與方法進(jìn)行系統(tǒng)訓(xùn)練,而且訓(xùn)練要非常明確、詳細(xì)和具體,應(yīng)結(jié)合具體內(nèi)容,側(cè)重教會(huì)學(xué)生有關(guān)如何使用解題策略,在什么情況下使用這些策略,為什么要使用這些策略等方面的知識(shí)。
參考文獻(xiàn):
1.《數(shù)學(xué)方法與解題研究》,李明振;上海科技教育出版社。
篇6
Abstract: With the popularization of mobile applications, as the basis for recognition malicious behavior, behavior pattern analysis of mobile application terminal has become a hotspot of current research. This paper, starting from system environmental data, and by monitoring many aspects of system data to establish Hidden Markov Model, uses this model to take hidden Markov valuation calculation for the system environmental data generated by the subsequent behavior, so as to realize the recognition of subsequent behavior patterns. Meanwhile in the subsequent recognition process, the model has to be continuously optimized. Through experiments, it shows that the approach has some validity, in order to provide more possibilities for behavior pattern recognition of mobile application terminal.
關(guān)鍵詞:移動(dòng)應(yīng)用端;隱馬爾可夫模型;行為模式
Key words: mobile application terminal;Hidden Markov Models;behavior pattern
中圖分類號(hào):TP311.5 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2016)19-0173-03
0 引言
在移動(dòng)設(shè)備迅速普及的今天,開展移動(dòng)安全性研究勢(shì)在必行。目前針對(duì)移動(dòng)應(yīng)用端惡意行為檢測(cè)的方式主要是對(duì)移動(dòng)應(yīng)用端的應(yīng)用程序進(jìn)行反編譯,分析其源碼是否存在于惡意行為代碼特征庫,以此作為評(píng)判標(biāo)準(zhǔn)。但隨著惡意行為代碼特征庫的不斷增加會(huì)導(dǎo)致系統(tǒng)開銷增大,檢測(cè)速度變慢。另外,隨著黑客們使用的代碼混淆技術(shù)的發(fā)展,也使之能夠逃避這種靜態(tài)分析手段[1]。
因?yàn)槌绦虻倪\(yùn)行會(huì)造成系統(tǒng)環(huán)境數(shù)據(jù)變化,所以系統(tǒng)環(huán)境數(shù)據(jù)可以反映系統(tǒng)運(yùn)行情況。本文提出一種基于隱馬爾可夫模型的行為模式識(shí)別方式,通過對(duì)移動(dòng)應(yīng)用端系統(tǒng)運(yùn)行環(huán)境的CPU使用率、內(nèi)存使用率、進(jìn)程數(shù)、服務(wù)數(shù)、流量數(shù)監(jiān)測(cè)獲得時(shí)間序列數(shù)據(jù),對(duì)特定行為進(jìn)行隱馬爾科夫建模,以待測(cè)行為的時(shí)間序列與特定的模型之間相似度為評(píng)判標(biāo)準(zhǔn),并在每次評(píng)判之后優(yōu)化模型[2]。該方法目的在于有效識(shí)別行為模式,對(duì)移動(dòng)端惡意行為分析的后續(xù)研究提供前提,豐富了行為檢測(cè)的手段,具有一定的實(shí)用價(jià)值。
1 馬爾可夫模型介紹
2 隱馬爾可夫模型介紹
2.1 隱馬爾可夫模型
在馬爾可夫模型中,每一個(gè)狀態(tài)代表一個(gè)可觀察的事件。而在隱馬爾科夫模型中觀察到的事件是狀態(tài)的隨機(jī)函數(shù),因此隱馬爾科夫模型是一雙重隨機(jī)過程,其中狀態(tài)轉(zhuǎn)移過程是不可觀察的,而可觀察的事件的隨機(jī)過程是隱蔽的狀態(tài)轉(zhuǎn)換過程的隨機(jī)函數(shù)(一般隨機(jī)過程)[3]。對(duì)于一個(gè)隨機(jī)事件,有一觀察值序列:O=O1,O2,…Ot,該事件隱含著一個(gè)狀態(tài)序列:Q=q1,q2,…qt。
2.2 隱馬爾科夫模型使用前提
假設(shè)1:馬爾可夫性假設(shè)(狀態(tài)構(gòu)成一階馬爾可夫鏈)P(qi|qi-1…q1)=P(qi|qi-1)
假設(shè)2:不動(dòng)性假設(shè)(狀態(tài)與具體時(shí)間無關(guān))P(qi+1|qi)=P(qj+1|qj),對(duì)任意i,j成立。
假設(shè)3:輸出獨(dú)立性假設(shè)(輸出僅與當(dāng)前狀態(tài)有關(guān))P(O1,…OT|q1,…,qT)=∏P(Ot|qt)
隱馬爾科夫模型在解決實(shí)際問題的過程中,需要事先知道從前一個(gè)狀態(tài)St-1,進(jìn)入當(dāng)前狀態(tài)St的概率P(St|St-1),也稱為轉(zhuǎn)移概率,和每個(gè)狀態(tài)St產(chǎn)生相應(yīng)輸出符號(hào)Ot的概率P(Ot|St),也稱為發(fā)射概率。描述它的數(shù)學(xué)表達(dá)式為:λ={N,M,A,B,∏},下面對(duì)各個(gè)參數(shù)逐一描述:
N表示隱狀態(tài)S的個(gè)數(shù),其取值為{S1,S2,…,SN},
M表示顯狀態(tài)O的個(gè)數(shù),其取值為{O1,O2,…,ON},
2.3 隱馬爾科夫可以解決的三個(gè)問題
①評(píng)估問題:已知一個(gè)顯狀態(tài)序列O={O1,O2,…,ON},并且有確定的λ={N,M,A,B,∏}組成的HMM參數(shù),求發(fā)生此顯狀態(tài)的概率P(O|HMM)有效的解決算法是前向算法。
②解碼問題:在己知一個(gè)顯狀態(tài)序列O={O1,O2,…,ON},并且有確定的λ={N,M,A,B,∏}組成的HMM參數(shù),求解最有可能產(chǎn)生此顯狀態(tài)序列的隱狀態(tài)序列S。較為有效的解決方法是Viterbi算法。
③優(yōu)化問題:在己知一個(gè)顯狀態(tài)序列O={O1,O2,…,ON},通過對(duì)參數(shù)N,M,A,B,∏的修正,使得發(fā)生此顯狀態(tài)的概率P(O|HMM)最大,有效解決算法是Baum-Welsh算法[4,5]。
3 基于隱馬爾科夫的移動(dòng)應(yīng)用端行為模式識(shí)別
本文通過對(duì)移動(dòng)應(yīng)用端的下載,看視頻,打電話,聊微信、QQ,視頻通訊,網(wǎng)絡(luò)語音通訊,衛(wèi)星導(dǎo)航及混合行為下這8個(gè)特定行為進(jìn)行監(jiān)控,抽樣出大量時(shí)間數(shù)據(jù)序列,對(duì)每一個(gè)時(shí)間序列進(jìn)行歸一化處理,綜合多方面歸一化結(jié)果給出對(duì)應(yīng)編碼序列,以此建立出不同行為的隱馬爾可夫模型,對(duì)于待識(shí)別的時(shí)間序列進(jìn)行隱馬爾可夫模型的估值計(jì)算,即相似度計(jì)算。取相似度計(jì)算值最大所對(duì)應(yīng)的隱馬爾科夫模型的行為模式作為待識(shí)別序列的行為模式判別結(jié)果。同時(shí)使用該待測(cè)序列對(duì)其所匹配的隱馬爾可夫模型進(jìn)行優(yōu)化,以便提高之后識(shí)別準(zhǔn)確率。
3.1 獲取時(shí)間序列
本文以Android平臺(tái)為例,獲取運(yùn)行環(huán)境的CPU使用率、內(nèi)存使用率、進(jìn)程數(shù)、服務(wù)數(shù)、流量使用情況等五方面信息的時(shí)間序列。具體實(shí)現(xiàn)是在固定時(shí)間間隔,通過平臺(tái)API調(diào)用訪問和解析相關(guān)系統(tǒng)文件來獲取Android平臺(tái)運(yùn)行環(huán)境的CPU使用率、內(nèi)存使用率、進(jìn)程數(shù)量、服務(wù)數(shù)量、流量數(shù)等信息[6,7]。
3.2 時(shí)間序列歸一化處理及綜合編碼
對(duì)每一個(gè)時(shí)間序列進(jìn)行歸一化處理[8],使其平均分配在[0,1]上5個(gè)均分區(qū)間內(nèi)(事實(shí)上均分區(qū)間數(shù)目越多越能反映真實(shí)的波動(dòng)趨勢(shì),但考慮到編碼復(fù)雜度,本文選擇歸一化區(qū)間為5個(gè)均等分)。并為其分配{1,2,3,4,5}的標(biāo)識(shí),由此可以得到每個(gè)時(shí)間序列的波動(dòng)趨勢(shì)。同時(shí)為了綜合多方面信息考慮,可以對(duì)多類時(shí)間序列的歸一化標(biāo)識(shí)進(jìn)行編碼,本文研究了CPU、內(nèi)存、進(jìn)程數(shù)、服務(wù)數(shù)、流量數(shù)這5類序列,所以可以產(chǎn)生5×5=25種編碼,分別用{A,B,C…V,W,X}25個(gè)字母表示。以編碼的序列結(jié)果作為隱馬爾可夫模型輸入序列,然后以此建立出不同行為的隱馬爾可夫模型,對(duì)于待識(shí)別的時(shí)間序列進(jìn)行隱馬爾可夫相似度計(jì)算。
3.3 隱馬爾可夫模型初始化及訓(xùn)練
本文HMM模型初始參數(shù)設(shè)置為:λ={N,M,A,B,∏},其中,N=8(八個(gè)隱狀態(tài),即本文考慮的7個(gè)行為外加一個(gè)混合行為),M=25(可能出現(xiàn)的25種顯狀態(tài),即輸入的編碼序列所能看到的25個(gè)碼元狀態(tài)),根據(jù)對(duì)實(shí)驗(yàn)數(shù)據(jù)各狀態(tài)轉(zhuǎn)換頻率占比的統(tǒng)計(jì),可以設(shè)置A為:
而B由于是在25個(gè)顯狀態(tài)時(shí)背后所處的8個(gè)隱狀態(tài)概率,所以可以暫且設(shè)置元素為1/25=0.04的25階矩陣:
分別使用3.2節(jié)獲得的7種行為和1種在混合行為下所監(jiān)控得到的歸一化序列作為上述初始化模型的輸入值,分別訓(xùn)練可以得到8個(gè)隱馬爾科夫模型,分別用Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ、Ⅶ、Ⅷ來表示。
3.4 行為模式識(shí)別
對(duì)于待識(shí)別的行為模式,依然是按照3.2節(jié)的方式產(chǎn)生隱馬爾科夫模型的輸入序列。計(jì)算該待測(cè)序列與3.3節(jié)訓(xùn)練出的8個(gè)隱馬爾科夫模型之間的相似度,即2.3.1所述參數(shù)評(píng)估問題。取8個(gè)相似度中最大值所對(duì)應(yīng)的隱馬爾科夫模型的行為模式作為該待測(cè)序列的識(shí)別結(jié)果。
為了每一次識(shí)別的準(zhǔn)確性,本文還采取了隱馬爾可夫模型的優(yōu)化處理。具體方式:在每一次識(shí)別后,使用待測(cè)序列去更新其對(duì)應(yīng)的隱馬爾科夫模型參數(shù),即2.3.3節(jié)所述模型優(yōu)化問題。圖1是隱馬爾科夫訓(xùn)練模型的流程。
4 實(shí)驗(yàn)以及結(jié)果
為了對(duì)本文方法的有效性驗(yàn)證,依次在下載,看視頻,打電話,聊微信、QQ,視頻通訊,網(wǎng)絡(luò)語音通訊,衛(wèi)星導(dǎo)航及混合行為下這8個(gè)特定行為下分別抽樣2萬條長(zhǎng)度為10個(gè)抽樣點(diǎn)的時(shí)間序列,共計(jì)16萬數(shù)據(jù)樣本。實(shí)驗(yàn)將每個(gè)行為獲取的2萬條時(shí)間序列中前一萬條用于模型訓(xùn)練,第一次實(shí)驗(yàn)用前一萬條進(jìn)行行為識(shí)別,第二次用后一萬條進(jìn)行行為識(shí)別,取兩次實(shí)驗(yàn)準(zhǔn)確率的平均值作為最終準(zhǔn)確率。同時(shí)使用相同的實(shí)驗(yàn)樣本,依托支持向量機(jī)SVM模型對(duì)同樣的8個(gè)特定行為進(jìn)行識(shí)別,將本文方法準(zhǔn)確率與其結(jié)果作為比對(duì),由表1可以看到本文方法除聊微信、QQ和混合行為模式判別的準(zhǔn)確率低于SVM方法之外,其他行為模式識(shí)別都較SVM方法的準(zhǔn)確率有明顯提高,所以本文提出的行為模式識(shí)別方式具有一定有效性。
5 小結(jié)
本文給出了一種基于隱馬爾科夫模型的行為模式識(shí)別方式,進(jìn)行實(shí)驗(yàn),通過該方法和SVM方法結(jié)果比對(duì)可以看出該方法具有一定的有效性,但在聊微信、QQ和混合行為模式判別準(zhǔn)確率上要低于SVM方法,這一點(diǎn)也是后續(xù)研究要解決的問題。由于本文旨在提出一種可行性辦法,所以實(shí)驗(yàn)中對(duì)特的選取還有待進(jìn)一步斟酌與研究。本文以Android平臺(tái)的監(jiān)控?cái)?shù)據(jù)為例,但該方法同樣適用于其他操作系統(tǒng)的移動(dòng)應(yīng)用端行為模式識(shí)別中。
參考文獻(xiàn):
[1]周正,劉毅,李建,等.計(jì)算機(jī)抗惡意代碼免疫模型[J].計(jì)算機(jī)工程,2008,34(17):7-9.
[2]曹凱,于善義,于少偉.基于多隱馬爾可夫模型的車輛機(jī)動(dòng)行為識(shí)別與預(yù)測(cè)[J].信息與控制,2014,43(4):506-512.
[3]王相海,叢志環(huán),方玲玲,等.混合種群多樣性自適應(yīng)遺傳操作的HMM訓(xùn)練模型[J].計(jì)算機(jī)研究與發(fā)展,2014,51(8):1833-1844.
[4]張?jiān)鲢y,元昌安,胡建軍,等.基于GEP和Baum-Welch算法訓(xùn)練HMM模型的研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(9):2027-2029.
[5]劉云冰.基于HMM的說話人識(shí)別中下溢問題的修正[J].微計(jì)算機(jī)信息,2006.
[6]Bose,A, Hu,X., Shin, K.G., Park,T. Behavioral detection of malware on mobile handsets. 2008.ACM.
篇7
摘要:選擇9個(gè)化學(xué)參數(shù)和合適的擴(kuò)展系數(shù),對(duì)一批26個(gè)拮抗藥化合物的活性建立了廣義回歸神經(jīng)網(wǎng)絡(luò)識(shí)別模式。選擇21個(gè)樣本為訓(xùn)練集,5個(gè)樣本為預(yù)測(cè)集。結(jié)果表明,該種網(wǎng)絡(luò)具有設(shè)計(jì)簡(jiǎn)單與收斂快的優(yōu)點(diǎn),可用于小樣本問題的學(xué)習(xí),獲得滿意的預(yù)測(cè)結(jié)果。
關(guān)鍵詞:廣義回歸神經(jīng)網(wǎng)絡(luò);模式識(shí)別;活性有機(jī)分子的結(jié)構(gòu)
活性關(guān)系研究是藥物分子設(shè)計(jì)的重要手段。一般用線性回歸方法總結(jié)各種量子化學(xué)、結(jié)構(gòu)化學(xué)參數(shù)與分子生物活性的關(guān)系,但當(dāng)訓(xùn)練集各分子的結(jié)構(gòu)相差較大時(shí),上述關(guān)系有時(shí)呈現(xiàn)強(qiáng)非線性。不少作者采用BP網(wǎng)絡(luò)進(jìn)行藥物活性的模式識(shí)別研究,都取得相當(dāng)?shù)某晒?。然而,由于BP神經(jīng)網(wǎng)絡(luò)是基于梯度下降的誤差反向傳播算法進(jìn)行學(xué)習(xí)的,所以網(wǎng)絡(luò)訓(xùn)練速度通常很慢,而且很容易陷入局部極小點(diǎn),盡管采用一些改進(jìn)的快速學(xué)習(xí)算法可以較好地解決某些實(shí)際問題,但是在設(shè)計(jì)過程中往往都要經(jīng)過反復(fù)的試湊和訓(xùn)練過程,無法嚴(yán)格保證每次訓(xùn)練時(shí)BP算法的收斂性和全局最優(yōu)性。此外,BP網(wǎng)絡(luò)隱層神經(jīng)元的作用機(jī)理及其個(gè)數(shù)選擇已成為BP網(wǎng)絡(luò)研究中的一個(gè)難點(diǎn)問題[1,2]。為此,本研究采用廣義回歸神經(jīng)網(wǎng)絡(luò)用于拮抗藥化合物活性的模式識(shí)別研究,結(jié)果滿意。
1廣義回歸神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)與算法[3~6]
廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)是Donald F.Specht在1991年提出的一種新型神經(jīng)網(wǎng)絡(luò),其具體公式推導(dǎo)和理論可參見文獻(xiàn)。該種網(wǎng)絡(luò)建立在數(shù)理統(tǒng)計(jì)的基礎(chǔ)上,能夠根據(jù)樣本數(shù)據(jù)逼近其中隱含的映射關(guān)系,即使樣本數(shù)據(jù)稀少,網(wǎng)絡(luò)的輸出結(jié)果也能收斂于最優(yōu)回歸平面。目前,該神經(jīng)網(wǎng)絡(luò)在在系統(tǒng)辯識(shí)和預(yù)測(cè)控制等方面得到了應(yīng)用。
GRNN由一個(gè)徑向基網(wǎng)絡(luò)層和一個(gè)線性網(wǎng)絡(luò)層組成,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1廣義回歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
a1i表示第一層輸出a1的第i個(gè)元素,W1表示第一層權(quán)值矩陣,P表示輸入向量,R表示輸入向量的維數(shù)。Q=K=輸入/目標(biāo)矢量對(duì)的個(gè)數(shù)。網(wǎng)絡(luò)的第一層為徑向基隱含層,單元個(gè)數(shù)等于訓(xùn)練樣本數(shù)Q,該層的權(quán)值函數(shù)為歐幾里德距離度量函數(shù)(用dist表示),其作用是計(jì)算網(wǎng)絡(luò)輸入與第一層的權(quán)值之間的距離,b1為隱含層閾值。符號(hào)“.”表示dist的輸出與閾值b1的元素與元素之間的乘積關(guān)系,并將結(jié)果形成凈輸入n1,傳送到傳遞函數(shù)。隱含層的傳遞函數(shù)為徑向基函數(shù),常用高斯函數(shù)Ri(x)=exp(-x-ci 2σ2i),式中, σi決定第i個(gè)隱含層位置處基函數(shù)的形狀。網(wǎng)絡(luò)的第二層為線性輸出層,其權(quán)函數(shù)為規(guī)范化點(diǎn)積函數(shù)(用nprod)表示,計(jì)算出網(wǎng)絡(luò)的向量n2,它的每個(gè)元素就是向量a1與權(quán)值矩陣W2每行元素的點(diǎn)積再除以向量a1各元素之和的值,并將結(jié)果n2送入線性傳遞函數(shù),計(jì)算網(wǎng)絡(luò)輸出。
GRNN連接權(quán)值的學(xué)習(xí)修正仍然使用BP算法,由于網(wǎng)絡(luò)隱含層節(jié)點(diǎn)中的作用函數(shù)(基函數(shù))采用高斯函數(shù),高斯函數(shù)為一種局部分布對(duì)中心徑向?qū)ΨQ衰減的非負(fù)非線性函數(shù),對(duì)輸入信號(hào)將在局部產(chǎn)生響應(yīng),即當(dāng)輸入信號(hào)靠近基函數(shù)的中央范圍時(shí),隱含層節(jié)點(diǎn)將產(chǎn)生較大的輸出,由此看出這種網(wǎng)絡(luò)具有局部逼近能力,這也是該網(wǎng)絡(luò)之所以學(xué)習(xí)速度更快的原因。此外,GRNN人為調(diào)節(jié)的參數(shù)少,網(wǎng)絡(luò)的學(xué)習(xí)全部依賴數(shù)據(jù)樣本,這個(gè)特點(diǎn)決定了網(wǎng)絡(luò)得以最大限度地避免人為主觀假定對(duì)預(yù)測(cè)結(jié)果的影響。
2拮抗藥化合物活性的預(yù)測(cè)
取文獻(xiàn)[7]所列的26個(gè)化合物為本工作的樣本集,數(shù)據(jù)見表1。表1文獻(xiàn)所列的26個(gè)化合物樣本列表將上述原始數(shù)據(jù)作歸一化處理,調(diào)用MATLAB語言工具箱中的函數(shù)newgrnn(P,T,SPREAD)進(jìn)行廣義回歸神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),計(jì)算結(jié)果如表2。
表2的計(jì)算結(jié)果表明,廣義回歸神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練樣本有很好的預(yù)測(cè)結(jié)果。在此基礎(chǔ)之上,嘗試從26個(gè)樣本中取出5個(gè)(表1中的5、10、15、20、25號(hào)樣本)作為預(yù)測(cè)集,其余21個(gè)樣本作為訓(xùn)練集,訓(xùn)練結(jié)果和預(yù)測(cè)結(jié)果分別列于表3和表4。表226個(gè)訓(xùn)練樣本的計(jì)算結(jié)果 表45個(gè)預(yù)測(cè)樣本的計(jì)算結(jié)果
在調(diào)用net=newgrnn(P,T,SPREAD)函數(shù)進(jìn)行網(wǎng)絡(luò)設(shè)計(jì)中,對(duì)上述計(jì)算當(dāng)擴(kuò)展系數(shù)SPREAD取0.1,0.2或0.3時(shí),網(wǎng)絡(luò)預(yù)測(cè)效果好;當(dāng)SPREAD大于0.3時(shí),網(wǎng)絡(luò)預(yù)測(cè)效果開始變差。
3結(jié)論
上述結(jié)果表明,廣義回歸神經(jīng)網(wǎng)絡(luò)具有設(shè)計(jì)簡(jiǎn)單與收斂快的優(yōu)點(diǎn),具有較好的預(yù)測(cè)和泛化能力,為復(fù)雜的、高度非線性問題的模式識(shí)別提供了可選手段。傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)在確定網(wǎng)絡(luò)連接權(quán)值時(shí)具有隨機(jī)性,其預(yù)測(cè)結(jié)果存在差異,不利于實(shí)際應(yīng)用[8]。而廣義回歸神經(jīng)網(wǎng)絡(luò)在選取輸入神經(jīng)元數(shù)目之后,網(wǎng)絡(luò)的結(jié)構(gòu)和連接權(quán)值也隨之確定,在訓(xùn)練過程中不涉及隨機(jī)數(shù),而且需要的樣本量少。因此,廣義回歸神經(jīng)網(wǎng)絡(luò)可作為藥物構(gòu)效關(guān)系研究的有效手段。
參考文獻(xiàn)
1陳念貽,欽佩,陳瑞亮,等.模式識(shí)別方法在化學(xué)化工中的應(yīng)用. 北京:科學(xué)出版社,2000,88~90.
2陳錦言,姚芳蓮,孫經(jīng)武,等.人工神經(jīng)網(wǎng)絡(luò)及其在化學(xué)領(lǐng)域中的應(yīng)用. 計(jì)算機(jī)與應(yīng)用化學(xué),1999,16(2):111~114.
3Sprecht D F.A General Regression Neural Network.IEEE Trans Neural Network,1991,2:568~576.
4Sprecht D F. The General Regression Neural Network Rediscove
red. Neural Networks,1993,6:1033~1034.
5周昊,鄭立剛,樊建人,等. 廣義回歸神經(jīng)網(wǎng)絡(luò)在煤灰熔點(diǎn)預(yù)測(cè)中的應(yīng)用. 浙江大學(xué)學(xué)報(bào)(工學(xué)版),2004,38(11):1479~1482.
6趙闖,劉凱,李電生,等.基于廣義回歸神經(jīng)網(wǎng)絡(luò)的貨運(yùn)量預(yù)測(cè). 鐵道學(xué)報(bào),2004,26(1):12~15.
7Livinstone D J.Multivariate Data Display Using Neural Networks,Chapter 7 in "Neural Networks in QSAR and Drug Design",Edited by J Devillars,London:Academic Press,1996,157~176.
篇8
[關(guān)鍵詞]模糊貼近度;OWA加權(quán);模式識(shí)別
doi:10.3969/j.issn.1673 - 0194.2017.12.060
[中圖分類號(hào)]F279.23 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1673-0194(2017)12-0-03
模糊貼近度作為一種處理客觀研究對(duì)象不確定性的數(shù)學(xué)工具,在企業(yè)管理的控制、決策、推理等多個(gè)環(huán)節(jié)中有著廣泛的應(yīng)用。本文主要研究模糊貼近度在工商企業(yè)管理領(lǐng)域進(jìn)行模式識(shí)別的應(yīng)用。當(dāng)一個(gè)對(duì)象在諸多樣本標(biāo)準(zhǔn)中與某一樣本標(biāo)準(zhǔn)的貼近度最大,則認(rèn)為這一對(duì)象歸屬這一樣本是合理的,這就是最大貼近度原則。趙沁平對(duì)模糊集合的貼近度進(jìn)行了梳理和歸納。盧國(guó)祥提出了一種基于模糊信息的距離測(cè)度,即模糊對(duì)稱交互熵,指出模糊對(duì)稱交互熵可用于模式識(shí)別。本文的創(chuàng)新之處在于對(duì)模糊對(duì)稱交互熵進(jìn)行深入研究,揭示其數(shù)值的形態(tài)特征,提出模糊對(duì)稱交互熵貼近度的概念和方法,同時(shí),提出以下的論題:本文的任務(wù)不是羅列各種模式識(shí)別的方法,得出各種模式識(shí)別的結(jié)論,而是要在各種方法的基礎(chǔ)上,綜合出一種更為合理的結(jié)論。
1 模糊貼近度
常見的模糊貼近度用以下各式進(jìn)行表示。
定義1:設(shè)離散論域X={x1,x2,x3,…,xn},?和為X上的模糊子集,∨和∧表示通常的格運(yùn)算。
(1)最大最小貼近度
(1)
(2)算術(shù)平均最小貼近度
(2)
(3)幾何平均最小貼近度
(3)
(4)Hamming貼近度
(4)
2 模糊對(duì)稱交互熵貼近度
2.1 模糊對(duì)稱交互熵
盧國(guó)祥闡述了模糊對(duì)稱交互熵的定義。
定義2:設(shè)A=(μA(x1),μA(x2),…,μA(xn));B=(μB(x1),μB(x2),…,μB(xn))為兩個(gè)模糊向量。
對(duì)于某個(gè)xi,定義μA(xi)對(duì)μB(xi)的交互熵為:
于是兩個(gè)模糊集A對(duì)B的模糊交互熵(Fuzzy Cross Entropy,F(xiàn)CE)可定義為:
(5)
上述定義的模糊交互熵(FCE)只滿足非負(fù)性,但不滿足對(duì)稱性和三角不等式。所以對(duì)其進(jìn)行改進(jìn),提出如下的模糊對(duì)稱交互熵定義。
定義3:設(shè)A=(μA(x1),μA(x2),…,μA(xn));B=(μB(x1),μB(x2),…,μB(xn))為兩個(gè)模糊向量。
F(A||B)和F(B||A)分別是A對(duì)B和B對(duì)A的模糊交互熵。由此對(duì)應(yīng)A與B的模糊對(duì)稱交互熵(Fuzzy Symmetric Cross Entropy,F(xiàn)SCE)為:
D(A||B)=F(A||B)+F(B||A)(6)
文[2]中證明了模糊對(duì)稱交互熵具有非負(fù)性、對(duì)稱性,滿足三角不等式,因此構(gòu)成兩個(gè)模糊向量的度量。這在某種意義上可以表現(xiàn)為兩個(gè)模糊向量之間的距離。當(dāng)距離較大時(shí),可以認(rèn)為其較不“貼近”或“貼近”的度量較??;當(dāng)距離較小時(shí),可以認(rèn)為其較“貼近”或“貼近”的度量較大。顯然,模糊對(duì)稱交互熵用于模式識(shí)別也是可行的,只是它的度量和貼近度的度量意義正好相反。為了使模糊對(duì)稱交互熵和貼近度在相同意義下用于模式識(shí)別,對(duì)兩者的數(shù)值特性進(jìn)行比較是必要的。一個(gè)問題是模糊對(duì)稱交互熵的數(shù)值是不是和貼近度一樣滿足0≤σ≤1,下文進(jìn)行一個(gè)具體的數(shù)值計(jì)算。
2.2 模糊對(duì)稱交互熵的數(shù)值討論
例1:設(shè):A=(0.2,0.4,0.5,0.1);B=(0.2,0.3,0.5,0.2)
同樣可計(jì)算F(B||A)=0.066,于是D(A||B)=0.1254。
這一模糊對(duì)稱交互熵正好在[0,1],但是一般情況需要深入討論。從模糊對(duì)稱交互熵的計(jì)算公式可以看出,模糊對(duì)稱交互熵是關(guān)于兩個(gè)模糊向量的2n個(gè)隸屬度的多元函數(shù)。為了簡(jiǎn)化討論,又不失一般性,這里僅對(duì)兩個(gè)一元互補(bǔ)模糊向量進(jìn)行討論。
例2:設(shè):
例3:設(shè)
從例2和例3可以看出,模糊對(duì)稱交互熵是超出[0,1]的。并且當(dāng)A的隸屬度取值在0~0.5,隸屬度趨向于0時(shí),F(xiàn)(A||B)是增加的,隸屬度趨向于0.5時(shí),F(xiàn)(A||B)是減少的。
定理1:設(shè)模糊向量A=(1-x),B=(x);x∈[0,0.5]則:
(1)F(A||B)在所論區(qū)間上是遞減函數(shù);
(2);
(3);
證:(1)
求導(dǎo)數(shù)
故為遞減函數(shù)。
(2)
故,
(3)代入即可。
定理2:設(shè)模糊向量A=(1-x),B=(x);x∈[0,0.5]
則F(A||B)=F(B||A),于是D(A||B)=2F(A||B)=2F(B||A)證:
即得C明。
2.3 模糊對(duì)稱交互熵貼近度
有了上述簡(jiǎn)明情況作為基礎(chǔ),為了和貼近度有同樣的數(shù)值性質(zhì),現(xiàn)定義以下的模糊對(duì)稱交互熵的貼近度變換式是合適的。
定義4:設(shè)A=(μA(x1),μA(x2),…,μA(xn));B=(μB(x1),μB(x2),…,μB(xn))為兩個(gè)模糊向量。稱:
(7)
為模糊對(duì)稱交互熵貼近度,可記為FSCE貼近度,在本文中FSCE貼近度記為σ5(A,B)。
3 OWA加權(quán)平均
有了文中5種貼近度,可以進(jìn)行5種模式識(shí)別。它們的差別表達(dá)了各種不同方法對(duì)對(duì)象和樣本之間相似狀況的各種不同視角的反映。人們似乎不必在意其間的所謂優(yōu)劣,轉(zhuǎn)而對(duì)其進(jìn)行綜合處理是一種可行的方法。在處理時(shí),可以采取抑制極端值,提升中間值的OWA加權(quán)平均方法。
3.1 三角模糊集及權(quán)重
設(shè)有模糊集合B=(b1,b2,…,bi,…,bn)
bi為第i位評(píng)分者的評(píng)分值。0≤bi≤1,i=1,2,…,n?,F(xiàn)在論域U=R上建立三角模糊集
(8)
顯然,這是一個(gè)三角模糊集以為軸的對(duì)稱分布的圖形。
如,n=5,則其分布為:
(0.2, 0.6, 1, 0.6, 0.2)(9)
由于權(quán)重wi必須滿足wi∈[0,1],
所以對(duì)(8)式進(jìn)行歸一化處理,得基于三角模糊數(shù)的權(quán)重分布
(10)
由此,可得(9)式的權(quán)重分布為
(0.077 0,0.203 8,0.384 6,0.203 8,0.077 0)(11)
3.2 正態(tài)模糊集及權(quán)重
設(shè)有模糊集合B=(b1,b2,…,bi,…,bn)
bi為第i位評(píng)分者的評(píng)分值。0≤bi≤1,i=1,2,…,n現(xiàn)在論域U=R上建立正態(tài)模糊集:
(12)
其中
顯然,這是一個(gè)正態(tài)模糊集以為軸的對(duì)稱分布的圖形。
如,n=5,則其:
則其分布為:
(0.367 9,0.778 8,1,0.778 8,0.3679)(13)
對(duì)(12)式進(jìn)行歸一化處理,得基于正態(tài)模糊數(shù)的權(quán)重分布:
(14)
其中,i=1,2,…,n
于是式(13)變換為:
(0.112 0,0.236 0,0.304 0,0.236 0,0.112 0) (15)
3.3 OWA加權(quán)平均
1989年美國(guó)學(xué)者Yager提出OWA算子
設(shè)F:RnR,如果
(16)
其中,(a1,a2,…,an)為模糊向量,w=(w1,w2,…,wn)T是權(quán)重向量,其是與F相關(guān)聯(lián),由F所決定的。顯然,,aj∈[0,1]wj∈[0,1],且(j=1,2,…,n)。(b1,b2,…,bn)是把(a1,a2,…,an)重新由大到小排列后得到的,其第j大的數(shù)記為bj,即bj=σ(j)。
上述的F稱為n維OWA算子。OWA算子的關(guān)鍵之處在于,要對(duì)(a1,a2,…,an)這一表示評(píng)語集的數(shù)組按大到小重新排列,而對(duì)第j大的數(shù)據(jù)bj賦予wj的權(quán)重。這里wj只與第j個(gè)位置相關(guān),而這一位置放置的數(shù)據(jù)即為第j個(gè)大,或由大到小排列時(shí)居第j位。
第(16)式給出的加權(quán)是通常采用的(?,+)型加權(quán)。如果權(quán)重采用上述的三角模糊數(shù)型,或正態(tài)模糊數(shù)型,由于其中間位置取值較大,兩側(cè)對(duì)稱地取逐次遞減的較小的值。加權(quán)時(shí),將使中間位置的數(shù)值得以提升,而兩側(cè)、較大、較小的值得以抑制,達(dá)到了減弱極端值在整體評(píng)價(jià)中的比重的作用。
例,在對(duì)某一指標(biāo)評(píng)價(jià)中,有5位評(píng)分者,得到的評(píng)分向量為
(0.2,0.7,0.5,0.9,0.4)
按數(shù)值由大到小,重新排列后,得(0.9,0.7,0.5,0.4,0.2)
應(yīng)用(11)式所示的權(quán)向量,應(yīng)用OWA算子,所得的F值為:
(17)
bij為(a1j,a2j,a3j,a4j,a5j)依大到小,重新排列后第i大的值。即bij=σ(i)。
cj表示BcAj的OWA綜合加權(quán)平均貼近程度。用它于模式識(shí)別具有抑制極端值,提升中間值的作用,比較科學(xué)客觀。
5 應(yīng)用實(shí)例
在工商企業(yè)管理領(lǐng)域有眾多需要進(jìn)行模糊模式識(shí)別的領(lǐng)域,如產(chǎn)業(yè)集群發(fā)展模式的識(shí)別、并購中目標(biāo)企業(yè)的評(píng)估、中小企業(yè)技術(shù)創(chuàng)新模式的選擇、新興商業(yè)模式的評(píng)測(cè),以及市場(chǎng)營(yíng)銷中難以通過準(zhǔn)確量化進(jìn)行衡量的質(zhì)量判定問題等。本文試通過實(shí)例確立基于OWA加權(quán)平均的模糊貼近度在模式識(shí)別問題領(lǐng)域的數(shù)學(xué)應(yīng)用模型。在管理學(xué)中常見的模式識(shí)別問題中,以A1、A2、A3、A4、A5、A6分別代表不同的標(biāo)準(zhǔn)模式;本實(shí)證研究選取各模式中最具代表性特征的Z1、Z2、Z3三個(gè)指標(biāo)為測(cè)評(píng)指標(biāo);B表示待估樣本。依據(jù)專家打分取均值的方法,確立標(biāo)準(zhǔn)模式及待估樣本的指標(biāo)數(shù)據(jù),并標(biāo)準(zhǔn)化到[0,1],從而建立模糊集合。如表2所示。
即σ5(A1,B)=0.6646
對(duì)于數(shù)據(jù)進(jìn)行從大到小的排列,且采用式(11)賦予的權(quán)重,根據(jù)式(17)計(jì)算得:C1=0.7631×0.0770+0.7452×0.2038+0.69×0.3846
+0.6646×0.2038+0.5939×0.0770=0.6572
同理可求C2、C3、C4、C5、C6。
的計(jì)算結(jié)果看,樣本的OWA綜合加權(quán)平均貼近度C2最高,表示樣本與A2集合最為貼近,可以判定待估樣本為A2標(biāo)準(zhǔn)模式。表中的其他數(shù)據(jù)提供了樣本與其他標(biāo)準(zhǔn)貼近的不同情況的信息,也有價(jià)值。
6 結(jié) 語
模糊貼近度是模糊數(shù)學(xué)中的重要理論,在模糊數(shù)學(xué)以及模糊信息處理中具有重要的理論和實(shí)際意義。本文梳理了各種模糊貼近度,還在此基礎(chǔ)上提出了模糊對(duì)稱交互熵貼近度的概念和方法。并且運(yùn)用OWA加權(quán)平均的方法,對(duì)5種模糊貼近度進(jìn)行均衡處理,得出了較為合理的識(shí)別結(jié)果。
主要參考文獻(xiàn)
篇9
關(guān)鍵詞:復(fù)雜工業(yè)場(chǎng)景 場(chǎng)景識(shí)別 模式識(shí)別
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2012)12(b)-00-01
近幾年來,對(duì)場(chǎng)景模式識(shí)別的研究越來越多,越來越細(xì)化。但是國(guó)內(nèi)外的研究者都圍繞著對(duì)生活場(chǎng)景和醫(yī)用診斷等方面研究,忽略了重要的復(fù)雜工業(yè)領(lǐng)域。該文針對(duì)復(fù)雜工業(yè)場(chǎng)景模式識(shí)別的問題進(jìn)行了探索與研究。
1 場(chǎng)景模式識(shí)別簡(jiǎn)介
1.1 模式識(shí)別簡(jiǎn)介
模式識(shí)別是對(duì)信號(hào)(圖像、視頻、聲音等)進(jìn)行分析,對(duì)其中的物體對(duì)象或行為進(jìn)行判別和解釋的過程。模式識(shí)別是人類的一項(xiàng)基本智能,在日常生活中,人們經(jīng)常在進(jìn)行“模式識(shí)別”。隨著20世紀(jì)40年代計(jì)算機(jī)的出現(xiàn)以及50年代人工智能的興起,人們當(dāng)然也希望能用計(jì)算機(jī)來代替或擴(kuò)展人類的部分腦力勞動(dòng)。(計(jì)算機(jī))模式識(shí)別在20世紀(jì)60年代初迅速發(fā)展并成為一門新學(xué)科。
在模式識(shí)別系統(tǒng)的研究中,模式分類是最重要的一個(gè)主題。它的中心任務(wù)就是找出某“類”事物的本質(zhì)屬性, 即在一定的度量和觀測(cè)的基礎(chǔ)上把待識(shí)別的模式劃分到各自模式類中。
1.2 場(chǎng)景模式識(shí)別簡(jiǎn)介
由于模式識(shí)別的對(duì)象是存在于感知信號(hào)中的物體和現(xiàn)象,那么它研究的內(nèi)容還包括信號(hào)、圖像、視頻的處理、分割、形狀和運(yùn)動(dòng)分析等,以及面向應(yīng)用(如文字識(shí)別、語音識(shí)別、生物認(rèn)證、醫(yī)學(xué)圖像分析、遙感圖像分析等)的方法和系統(tǒng)研究。
場(chǎng)景模式識(shí)別,又叫做場(chǎng)景分類。它是根據(jù)視覺感知組織原理,找出圖像中存在的某些特定區(qū)域,這些區(qū)域可能是整幅圖像,也可能是圖像中的某個(gè)區(qū)域,其目標(biāo)是根據(jù)給定的一組語義類別對(duì)圖像數(shù)據(jù)庫進(jìn)行自動(dòng)標(biāo)注,如海岸、山脈、森林等。
2 復(fù)雜工業(yè)場(chǎng)景模式識(shí)別研究
在現(xiàn)代科技學(xué)術(shù)不斷發(fā)展的今天,怎樣讓計(jì)算機(jī)具有人的智能,是當(dāng)前很多科研工作者研究的主要內(nèi)容。盡管現(xiàn)有的場(chǎng)景分類已經(jīng)囊括了海洋、山脈、森林、街道、建筑物等在內(nèi)的生活場(chǎng)景,但是在復(fù)雜工業(yè)場(chǎng)景上的研究與應(yīng)用至今還是空白。本研究主要是服務(wù)于室內(nèi)外移動(dòng)機(jī)器人,應(yīng)用于復(fù)雜工業(yè)控制現(xiàn)場(chǎng)等不適宜人工操作的環(huán)境。以往的移動(dòng)機(jī)器人在作業(yè)時(shí),通常使用傳感器以及超聲波對(duì)場(chǎng)景進(jìn)行識(shí)別分類。本研究則應(yīng)用機(jī)器人視覺來對(duì)場(chǎng)景進(jìn)行識(shí)別。與以前的識(shí)別方法相比,機(jī)器人視覺更直觀更穩(wěn)定更可靠。
復(fù)雜工業(yè)現(xiàn)場(chǎng)的設(shè)備與管道很多,不適宜工人長(zhǎng)期駐守。本研究最終目的在于提高復(fù)雜工業(yè)現(xiàn)場(chǎng)的自動(dòng)化程度。任何一個(gè)復(fù)雜工業(yè)現(xiàn)場(chǎng)都可以大致分為兩類,即室內(nèi)場(chǎng)景與室外場(chǎng)景。室內(nèi)場(chǎng)景即中央控制室,室外場(chǎng)景即現(xiàn)場(chǎng)設(shè)備與管道。這樣,移動(dòng)機(jī)器人在復(fù)雜工業(yè)現(xiàn)場(chǎng)巡視時(shí),便可依據(jù)這兩類來進(jìn)行現(xiàn)場(chǎng)操作以及蔽障繞行等行為。
3 復(fù)雜工業(yè)場(chǎng)景模式識(shí)別研究流程圖
4 結(jié)語
篇10
中圖分類號(hào):TG333.7 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-914X(2016)21-0016-01
1 統(tǒng)計(jì)模式識(shí)別問題簡(jiǎn)介
統(tǒng)計(jì)模式識(shí)別問題可以看作是一個(gè)更廣義的問題的特例,就是基于數(shù)據(jù)的機(jī)器學(xué)習(xí)問題?;跀?shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中十分重要的一個(gè)方面,主要研究如何從一些觀測(cè)數(shù)據(jù)出發(fā)得出目前尚不能通過原理分析得到的規(guī)律,利用這些規(guī)律去分析客觀對(duì)象,對(duì)未來數(shù)據(jù)或無法觀測(cè)的數(shù)據(jù)進(jìn)行預(yù)測(cè)?,F(xiàn)實(shí)世界中存在大量我們尚無法準(zhǔn)確認(rèn)識(shí)但卻可以進(jìn)行觀測(cè)的事物,因此這種機(jī)器學(xué)習(xí)在從現(xiàn)代科學(xué)、技術(shù)到社會(huì)、經(jīng)濟(jì)等各領(lǐng)域中都有著十分重要的應(yīng)用。當(dāng)我們把要研究的規(guī)律抽象成分類關(guān)系時(shí),這種機(jī)器學(xué)習(xí)問題就是模式識(shí)別。
統(tǒng)計(jì)是我們面對(duì)數(shù)據(jù)而又缺乏理論模型時(shí)最基本的分析手段,傳統(tǒng)統(tǒng)計(jì)學(xué)所研究的是漸進(jìn)理論,即當(dāng)樣本數(shù)目趨向于無窮大時(shí)的極限特性,統(tǒng)計(jì)學(xué)中關(guān)于估計(jì)的一致性、無偏性和估計(jì)方差的界等,以及分類錯(cuò)誤率諸多結(jié)論,都具有這種漸近特性。但實(shí)際應(yīng)用中,這種前提條件卻往往得不到滿足,當(dāng)問題處在高維空間時(shí)尤其如此,這實(shí)際上是包括模式識(shí)別和神經(jīng)網(wǎng)絡(luò)等在內(nèi)的現(xiàn)有機(jī)器學(xué)習(xí)理論和方法中的一個(gè)根本問題。
V.Vapnik等人早在20世紀(jì)60年代就開始研究有限樣本情況下的機(jī)器學(xué)習(xí)問題。由于當(dāng)時(shí)這些研究尚不十分完善,在解決模式識(shí)別問題中往往趨于保守,且數(shù)學(xué)上比較艱澀, 90年代以前并沒有提出能夠?qū)⑵淅碚摳吨T實(shí)現(xiàn)的較好的方法。加之當(dāng)時(shí)正處在其他學(xué)習(xí)方法飛速發(fā)展的時(shí)期,因此這些研究一直沒有得到充分的重視。直到90年代中期,有限樣本情況下的機(jī)器學(xué)習(xí)理論研究逐漸成熟起來,形成了一個(gè)較完善的理論體系――統(tǒng)計(jì)學(xué)習(xí)理論(Statistical Learning Theory,簡(jiǎn)稱SLT)。同時(shí),神經(jīng)網(wǎng)絡(luò)等較新興的機(jī)器學(xué)習(xí)方法的研究則遇到一些重要的困難,比如如何確定網(wǎng)絡(luò)結(jié)構(gòu)的問題、過學(xué)習(xí)與欠學(xué)習(xí)問題、局部極小點(diǎn)問題等等。在這種情況下,試圖從更本質(zhì)上研究機(jī)器學(xué)習(xí)問題的統(tǒng)計(jì)學(xué)習(xí)理論逐步得到重視。
為了解決有限樣本的機(jī)器學(xué)習(xí)問題,在過去二十多年里,發(fā)展了很多新的統(tǒng)計(jì)學(xué)方法,其中V.Vapnike等發(fā)展了專門研究小樣本統(tǒng)計(jì)估計(jì)和預(yù)測(cè)的統(tǒng)計(jì)學(xué)習(xí)理論以及結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則(Structural Risk Minimization,SRM)。
統(tǒng)計(jì)學(xué)習(xí)理論就是研究小樣本統(tǒng)計(jì)估計(jì)和預(yù)測(cè)的理論, 主要內(nèi)容包括四個(gè)方面:
1) 經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則下統(tǒng)計(jì)學(xué)習(xí)一致性的條件;
2) 在這些條件下關(guān)于統(tǒng)計(jì)學(xué)習(xí)方法推廣性的界的結(jié)論;
3) 在這些界的基礎(chǔ)上建立的小樣本歸納推理準(zhǔn)則;
4) 實(shí)現(xiàn)新的準(zhǔn)則的實(shí)際方法(算法)。
其中, 最有指導(dǎo)性的理論結(jié)果是推廣性的界,與此相關(guān)的一個(gè)核心概念是VC維。
2 VC維
模式識(shí)別方法中VC(Vapnik Chervonenk Dimension)維的直觀定義是:對(duì)一個(gè)指示函數(shù)集, 如果存在h 個(gè)樣本能夠被函數(shù)集中的函數(shù)按所有可能的2h種形式分開, 則稱函數(shù)集能夠把h 個(gè)樣本打散;函數(shù)集的VC維就是它能打散的最大樣本數(shù)目h。若對(duì)任意數(shù)目的樣本都有函數(shù)能將它們打散, 則函數(shù)集的VC維是無窮大。有界實(shí)函數(shù)的VC維可以通過用一定的閾值將它轉(zhuǎn)化成指示函數(shù)來定義。
VC維反映了函數(shù)集的學(xué)習(xí)能力,VC維越大則學(xué)習(xí)機(jī)器越復(fù)雜(容量越大)。 遺憾的是,目前尚沒有通用的關(guān)于任意函數(shù)集VC維計(jì)算的理論,只對(duì)一些特殊的函數(shù)集知道其VC維。比如在n維實(shí)數(shù)空間中線性分類器和線性實(shí)函數(shù)的VC維是n+1, 而上一節(jié)例子中的VC維則為無窮大。對(duì)于一些比較復(fù)雜的學(xué)習(xí)機(jī)器(如神經(jīng)網(wǎng)絡(luò)),其VC維除了與函數(shù)集(神經(jīng)網(wǎng)結(jié)構(gòu))有關(guān)外, 還受學(xué)習(xí)算法等的影響,其確定更加困難。對(duì)于給定的學(xué)習(xí)函數(shù)集, 如何(用理論或?qū)嶒?yàn)的方法)計(jì)算其VC維是當(dāng)前統(tǒng)計(jì)學(xué)習(xí)理論中有待研究的一個(gè)問題。
3 推廣性的界
統(tǒng)計(jì)學(xué)習(xí)理論系統(tǒng)地研究了對(duì)于各種類型的函數(shù)集,經(jīng)驗(yàn)風(fēng)險(xiǎn)和實(shí)際風(fēng)險(xiǎn)之間的關(guān)系,即推廣性的界。關(guān)于兩類分類問題,結(jié)論是:對(duì)指示函數(shù)集中的所有函數(shù)(包括使經(jīng)驗(yàn)風(fēng)險(xiǎn)最小的函數(shù)),經(jīng)驗(yàn)風(fēng)險(xiǎn)和真實(shí)風(fēng)險(xiǎn)之間以至少1-η的概率滿足如下關(guān)系:
上式右端第一項(xiàng)反映訓(xùn)練樣本的擬合程度;第二項(xiàng)稱為Vapnik Chervonenkis置信范圍(又稱VC置信范圍),h是函數(shù)集的VC維。
式(1)表明,在有限訓(xùn)練樣本下,學(xué)習(xí)機(jī)器的VC維越高(復(fù)雜性越高) 則置信范圍越大, 導(dǎo)致真實(shí)風(fēng)險(xiǎn)與經(jīng)驗(yàn)風(fēng)險(xiǎn)之間可能的差別越大。這就是為什么會(huì)出現(xiàn)過學(xué)習(xí)現(xiàn)象的原因。機(jī)器學(xué)習(xí)過程不但要使經(jīng)驗(yàn)風(fēng)險(xiǎn)最小,還要使VC維盡量小以縮小置信范圍,才能取得較小的實(shí)際風(fēng)險(xiǎn),即對(duì)未來樣本有較好的推廣性。
4 結(jié)構(gòu)風(fēng)險(xiǎn)最小化(SRM)原則
在傳統(tǒng)方法中,選擇學(xué)習(xí)模型和算法的過程就是調(diào)整置信范圍的過程,如果模型比較適合現(xiàn)有的的訓(xùn)練樣本(相當(dāng)于 n/h 值適當(dāng)),則可以取得比較好的效果。但因?yàn)槿狈碚撝笇?dǎo),這種選擇只能依賴先驗(yàn)知識(shí)和經(jīng)驗(yàn),造成了如神經(jīng)網(wǎng)絡(luò)等方法對(duì)使用者“技巧”的過分依賴。
當(dāng) n/h 較大時(shí),式(1)右邊的第二部分就較小,真實(shí)風(fēng)險(xiǎn)就接近經(jīng)驗(yàn)風(fēng)險(xiǎn)的取值。如果n/h 較小,那么一個(gè)小的經(jīng)驗(yàn)風(fēng)險(xiǎn)值并不能保證小的真實(shí)風(fēng)險(xiǎn)值。在這種情況下,要最小化真實(shí)風(fēng)險(xiǎn)值,就必須對(duì)不等式(1)右邊的兩項(xiàng)同時(shí)最小化。但是需要注意,不等式(1)右邊的第一項(xiàng)取決于函數(shù)集中的一個(gè)特定函數(shù),而第二項(xiàng)取決于整個(gè)函數(shù)集的VC維。因此要對(duì)風(fēng)險(xiǎn)的界,即式(1)的右邊的兩項(xiàng)同時(shí)最小化,我們必須使VC維成為一個(gè)可以控制的變量。
統(tǒng)計(jì)學(xué)習(xí)理論提出了一種新的策略,即把函數(shù)集構(gòu)造為一個(gè)函數(shù)子集序列,使各個(gè)子集按照 VC 維的大?。ㄒ嗉处档拇笮。┡帕校诿總€(gè)子集中尋找最小經(jīng)驗(yàn)風(fēng)險(xiǎn),在子集間折衷考慮經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍,取得真實(shí)風(fēng)險(xiǎn)的最小,如圖1所示。
于是有兩個(gè)思路:一是在每個(gè)子集中求最小經(jīng)驗(yàn)風(fēng)險(xiǎn), 然后選擇使最小經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍之和最小的子集。這種方法比較費(fèi)時(shí), 當(dāng)子集數(shù)目很大甚至是無窮時(shí)不可行。于是有第二種思路, 即設(shè)計(jì)函數(shù)集的某種結(jié)構(gòu)使每個(gè)子集中都能取得最小的經(jīng)驗(yàn)風(fēng)險(xiǎn)(如使訓(xùn)練誤差為0),然后只需選擇適當(dāng)?shù)淖蛹怪眯欧秶钚?,這個(gè)子集中使經(jīng)驗(yàn)風(fēng)險(xiǎn)最小的函數(shù)就是最優(yōu)函數(shù)。支持向量機(jī)就是這種思想的具體實(shí)現(xiàn)。
- 上一篇:爆破器材
- 下一篇:物資管理信息系統(tǒng)