信息化水平聚類分析論文

時間:2022-01-14 03:17:00

導(dǎo)語:信息化水平聚類分析論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

信息化水平聚類分析論文

1、變量指標的選取

國家統(tǒng)計局在其《中國信息能力報告》中,設(shè)計了一套評價我國信息化水平的指標:指標體系共分4級,有25個指標:①信息技術(shù)和信息設(shè)備應(yīng)用能力:a.每千人擁有PC數(shù);b.每千人擁有傳真機數(shù);c.每百人擁有電話數(shù);d.每千人擁有電視機數(shù);e.每千人擁有收音機數(shù);f.每萬人接入因特網(wǎng)用戶;g.每百萬人互聯(lián)網(wǎng)上網(wǎng)主機數(shù);h.每平方公里光纜長度;i.每百家企事業(yè)單位上網(wǎng)數(shù);j.基礎(chǔ)信息產(chǎn)業(yè)產(chǎn)值占GDP比重。②信息資源及開發(fā)利用能力:a.每戶打國際電話時間;b.每百人期刊發(fā)行量;c.每日信息量;d.網(wǎng)絡(luò)用戶平均上網(wǎng)時間;e.每萬人Web站點數(shù)。③人口素質(zhì):a.每萬人平均科學(xué)家和工程師數(shù);b.第三產(chǎn)業(yè)從業(yè)人數(shù)占就業(yè)總?cè)丝诒戎?;c.大學(xué)入學(xué)率;d.每十萬人在校學(xué)生數(shù);e.計算機專家和工程師數(shù)。④國家對信息產(chǎn)業(yè)發(fā)展的支撐:a.信息產(chǎn)業(yè)產(chǎn)值占GDP比重;b.研究開發(fā)(R&G)支出占GDP比重;c.每主線電信投資;d.人均GNP;e.教育投入。

鑒于遵循數(shù)據(jù)的客觀性和代表性,以及易得性,本文采取以下指標:每千人工業(yè)增加值x1;每千人電信業(yè)務(wù)量x2;每千人移動通信交換機容量x3;移動電話普及率x4;電話普及率x5;廣播綜合人口覆蓋率x6;電視綜合人口覆蓋率x7;有線電視普及率x8;每十戶寬帶上網(wǎng)用占有戶數(shù)x9;R&D經(jīng)費支出占GDP比重x10;每十人從事科技活動人員總數(shù)占有的人數(shù)x11;每十人在校大學(xué)生人數(shù)占有的人數(shù)x12;每千人專利授權(quán)數(shù)占有數(shù)x13。其中缺省值用平均值代替或者臨近年數(shù)內(nèi)值代替。由于篇幅有限,指標數(shù)據(jù)省略。

2、因子分析

因子分析法是能夠?qū)崿F(xiàn)數(shù)據(jù)簡化目的的有效方法之一。其基本思想是根據(jù)相關(guān)性大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,使不同組的變量相關(guān)性較低,每組變量代表一個基本結(jié)構(gòu),這個基本結(jié)構(gòu)稱為公共因子。運用因子分析法,借助EXCEL多元統(tǒng)分析,對已得的指標數(shù)據(jù)進行分析處理,在處理過程中選取方差貢獻比率為0.80。

按照方差貢獻比率大于80%,應(yīng)提取前四個因子,它們所解釋的方差占總方差的84.58%,這四個因子就可以解釋原始數(shù)據(jù)的大部分信息了。

分析結(jié)果中可以得到每個城市的四個因子得分情況F1,F(xiàn)2,F(xiàn)3和F4。最后,對28個城市的信息化水平進行綜合評價并排序。以旋轉(zhuǎn)后四個因子的方差貢獻率為權(quán)數(shù)計算綜合得分,計算公式為:F=0.5923F1+0.09957F2+0.0804F3+0.0736F4,最終可以得到所有城市的綜合得分排名。

由于變量指標取值的同向性,得分越高代表信息化水平越高。排名依次為:北京,天津、廣東、浙江、江蘇、湖南、福建等等。

3、聚類分析

聚類分析是統(tǒng)計學(xué)中研究“物以類聚”問題的多元統(tǒng)計分析方法,在統(tǒng)計分析的應(yīng)用領(lǐng)域已經(jīng)得到了極為廣泛的應(yīng)用。其思路為:首先每個數(shù)據(jù)對象自成一類,并且計算各個類之間的“距離”或者相似性。然后每次將最相似的兩類合并,合并后重新計算新類與其他各個類之間的距離或相似度。這一“凝聚”的過程一直繼續(xù)直到所有對象都歸為一類為止。利用各城市的因子得分,還可對28個城市進行分類,得分值相近的城市被認為具有較相似的屬性。

4、結(jié)果分析

由所得到的聚類圖可以看出,全國信息化水平基本上可以分為五類,北京,山西各成一類,從上面的綜合水平排名可以看出,北京信息化水平處于全國領(lǐng)先地位,這首先歸功于北京的地理位置和政治人文環(huán)境,其次結(jié)合因子得分矩陣,北京在因子1上的得分最高,而根據(jù)因子載荷矩陣可以看出,因子1在13個變量指標上的載荷系數(shù)都比較大,證明北京在城市信息化的各個方面都比較出色。山西的信息化綜合水平排名第10,屬于中等偏上的水平,在因子4上的得分較高,因子4在變量指標x1,x2上的載荷量較大,這正好符合山西是個煤礦大省的特征,通信電信比較發(fā)達繁榮。天津、廣東、江蘇、福建、浙江歸為一類,這幾個城市都是發(fā)達城市,信息化水平偏高,在每個指標上得分都比較平均。而河北、黑龍江、河南、江西、遼寧、吉林、湖北、湖南、安徽、山東、四川、海南、重慶可以歸為一類,這幾個城市由于地理環(huán)境、產(chǎn)業(yè)結(jié)構(gòu)、人口眾多等因素使得信息化水平中等偏下。最后一類,信息化水平偏下的一類包括:內(nèi)蒙古、甘肅、青海、寧夏、廣西、云南、西藏和陜西,信息化水平底下源于經(jīng)濟發(fā)展水平不高、對于信息化認識薄弱以及對信息產(chǎn)業(yè)的投入不夠。

5、政策建議

雖然我國信息化應(yīng)用工作已取得了較大的成績,但在發(fā)展的過程中還存在著一些問題和不足使信息化帶動經(jīng)濟發(fā)展的優(yōu)勢難以更好地發(fā)揮與國外發(fā)達國家相比還有很大差距,就是同亞洲一些發(fā)展中國家(或地區(qū))比較也存在不小的距離。當前,經(jīng)濟全球化、我國加入世界貿(mào)易組織和世界信息產(chǎn)業(yè)的新發(fā)展,都對我國信息化應(yīng)用發(fā)展提出了新的要求,因此,我們應(yīng)認真分析中國信息化水平現(xiàn)狀,分析與國外信息化發(fā)展的差距,有效地針對問題和不足進行改進,正確地規(guī)劃未來發(fā)展方向和應(yīng)采取的對策。

對策和建議主要有:(1)加快有關(guān)信息化法律、法規(guī)的制定,確保應(yīng)用中的可靠性和安全性(2)降低成本,普及大眾。(3)加強信息化知識普及與培訓(xùn)力度。(4)加大國家對信息化投資力度縮小地區(qū)間差距。(5)加強信息資源建設(shè),提高信息化服務(wù)質(zhì)量與水平。(6)建立信息化數(shù)據(jù)采集系統(tǒng)和評價監(jiān)測體系。

另外,由上文的分析,信息化水平測度的數(shù)據(jù)很不全面,在每個地區(qū)城市的報告中尚未包括有些信息化水平測度指標,比如說信息產(chǎn)業(yè)增加值占地區(qū)生產(chǎn)值的比重。完整的數(shù)據(jù)不僅可以幫助很好的測度信息化水平,同時可以鞭策及時發(fā)現(xiàn)問題,提出相應(yīng)的解決辦法,這對于提高信息化水平是必要的途徑。

參考文獻:

[1]張海永.基于因子分析和聚類分析的江蘇省13個城市社會發(fā)展水平研究.西南民族大學(xué)學(xué)報·自然科學(xué)版,2007,(2).

[2]陳小磊,鄭建明,萬里鵬.信息化水平測度指標體系理論研究述評.圖書情報知識,2006,(9).

[3]盧紋岱.SPSSforWindows統(tǒng)計分析.電子工業(yè)出版社(第三版),2006.480-483.

【摘要】本文認真參考了信息化水平指標,總結(jié)出信息化水平指標評價體系,同時采用因子分析法對全國各省份的信息化水平進行排序,并在此基礎(chǔ)上進行聚類分析,最后按不同類型對各省份進行簡單分析,進一步提出讓信息化水平提高的對策。

【關(guān)鍵詞】信息化指標體系因子分析聚類分析