數(shù)據(jù)挖掘在未成年人口數(shù)量統(tǒng)計(jì)的應(yīng)用
時(shí)間:2022-09-20 04:34:06
導(dǎo)語:數(shù)據(jù)挖掘在未成年人口數(shù)量統(tǒng)計(jì)的應(yīng)用一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:隨著各地各省市教育大會(huì)的召開,未成年的教育問題備受關(guān)注,本文通過對(duì)中國近年來各地區(qū)的青少年的人口進(jìn)行數(shù)據(jù)收集,運(yùn)用數(shù)據(jù)挖掘的方法進(jìn)行預(yù)測(cè),得知未來青少年的人口數(shù)量和各地區(qū)青少年人口結(jié)構(gòu)情況,從而可以明晰數(shù)據(jù)背后的意義和規(guī)律,對(duì)未成年展開適合的教育有著十分重要的意義。
關(guān)鍵詞:未成年人口;教育;數(shù)據(jù)挖掘
根據(jù)黨的“”報(bào)告,中國經(jīng)濟(jì)已由高速增長階段轉(zhuǎn)向高質(zhì)量發(fā)展階段,報(bào)告指出“在轉(zhuǎn)變發(fā)展方式、優(yōu)化經(jīng)濟(jì)結(jié)構(gòu)、轉(zhuǎn)換增長動(dòng)力的攻關(guān)期,建設(shè)現(xiàn)代化經(jīng)濟(jì)體系是跨越關(guān)口的迫切要求和我國發(fā)展的戰(zhàn)略目標(biāo)”。實(shí)現(xiàn)此目標(biāo)的驅(qū)動(dòng)和載體就是人才,并且未成年人的教育會(huì)間接影響國家人才的質(zhì)量和數(shù)量,只有了解各地區(qū)青少年的人口數(shù)量,才可以因地制宜,更好的進(jìn)行教育工作。國內(nèi)有許多專家學(xué)者已經(jīng)運(yùn)用數(shù)據(jù)挖掘方法進(jìn)行了研究。采用數(shù)據(jù)挖掘的方法,對(duì)北京市人口增長影響因素進(jìn)行分析,通過進(jìn)行相關(guān)性分析,挖掘出34個(gè)與北京市人口增長相關(guān)性較強(qiáng)的因素,構(gòu)建了一個(gè)較為完整的北京市人口增長影響因素指標(biāo)體系。通過屬性規(guī)約和屬性相關(guān)分析對(duì)人口信息系統(tǒng)的數(shù)據(jù)進(jìn)行了預(yù)處理,對(duì)預(yù)處理后的屬性采用信息增益方法構(gòu)造決策樹,并對(duì)決策樹表示的知識(shí)利用決策表的規(guī)則合并方法進(jìn)行合并,據(jù)此得出了人口變動(dòng)的基本規(guī)律。
數(shù)據(jù)潛在信息的重要技術(shù),將它運(yùn)用在分析中國人口方面一定能起到非常好的效果。研究各個(gè)地區(qū)的未成年人的人口數(shù)量是一個(gè)嚴(yán)峻的工作,本文使用spssmodeler軟件對(duì)2006-2017各個(gè)地區(qū)未成年人的數(shù)量進(jìn)行分析,對(duì)未成年的教育工作提出一些建議。模型建立—聚類分析聚類分析是一種對(duì)物品、樣品或者指標(biāo)進(jìn)行分類的一種統(tǒng)計(jì)分析方法,它們討論的一般是量比較大的物品,要求按照物品各自的特性進(jìn)行合理的劃分,沒有任何的前提要求和參考標(biāo)準(zhǔn),即是在沒有先驗(yàn)知識(shí)的情況下進(jìn)行的分析。本文中案例數(shù)據(jù)主要來源于中國統(tǒng)計(jì)年鑒,數(shù)據(jù)中主要包括了各個(gè)地區(qū)青少年的人口數(shù)量從2005到2016的數(shù)量情況。本文采用聚類分析的方法,按照中國各個(gè)地區(qū)的未成年的人口增長趨勢(shì)的不同將地區(qū)進(jìn)行聚類,明晰各組聚類數(shù)據(jù)的特點(diǎn),從而能更好的把握中國未成年人口增長的地區(qū)性特征。根據(jù)第五次人口普查資料,按各省(區(qū))人口平均密度可分成4類地區(qū):(1)非常稠密區(qū)。每平方公里人口在400人以上,包括滬、京、津、蘇、魯、豫、粵、浙、皖等6省3市。占全國總?cè)丝诘?8.8%,平均每平方公里高達(dá)552人。(2)稠密區(qū)。每平方公里人口在200-400人之間,包括渝、冀、鄂、湘、遼、閩、贛、瓊、晉、黔等10省市。(3)較稠密區(qū)。每平方公里人口在100-200人之間,包括桂、陜、川、吉、云、寧等6省(區(qū)),占全國總?cè)丝诘?94%,平均每平方公里155人,高于全國平均人口密度。(4)稀少區(qū)。每平方公里人口在100人以下,包括黑、甘、蒙、新、青、藏等6個(gè)省(區(qū)),人口1.13億人,只占全國總?cè)丝诘?%,平均每平方公里20人,遠(yuǎn)遠(yuǎn)低于全國平均的人口密度。根據(jù)以上數(shù)據(jù)的分類,可以將此次聚類數(shù)目設(shè)置為4類。根據(jù)聚類結(jié)果可以看出,聚類1中包含的省份有北京,天津,內(nèi)蒙古,吉林,上海,海南,重慶,甘肅,青海,寧夏,新疆。未成年人口的初始數(shù)量在1000萬人和500萬人左右,并且在持續(xù)快速的增長。聚類2包括山東,廣東,河南,四川,初始未成年人口數(shù)量在8000萬人左右,并且增長速度穩(wěn)定較緩慢。聚類3包含河北,江蘇,湖北,湖南,初始未成年人口數(shù)量在5000萬人左右,無明顯的增長。聚類3包含陜西,云南,貴州,廣西,安徽,福建,黑龍江,遼寧,初始未成年人口數(shù)量在4000萬人左右。
通過對(duì)數(shù)據(jù)的預(yù)處理、數(shù)據(jù)的聚類分析之后,我們對(duì)2005到2016年之間人口的增長狀況有了全面的把握,不僅可以較為科學(xué)合理的預(yù)測(cè)出人口增長的大致趨勢(shì),也可以了解到各個(gè)地區(qū)的人口增長特點(diǎn)。運(yùn)用數(shù)據(jù)挖掘中聚類的分析方法,我們將各個(gè)省份近幾年的未成年的人口增長方式進(jìn)行分類,將中國的未成年的人口增長方式分為了5類。對(duì)于人口基數(shù)大,并且人口平穩(wěn)增長的城市,相關(guān)政府要合理控制人口增長速度,鼓勵(lì)本城市人口向外地發(fā)展,緩解城市內(nèi)部由于人口過多,積壓而產(chǎn)生的社會(huì)矛盾。對(duì)于人口基數(shù)不大,人口增長緩慢的城市,政府應(yīng)當(dāng)積極出臺(tái)相關(guān)政策進(jìn)行吸引,鼓勵(lì)外來人口進(jìn)行務(wù)工,為外來人口提供較為舒適的居住環(huán)境和工資條件。同時(shí)對(duì)于教育問題,政府也需要根據(jù)未成年門口的變化趨勢(shì),因地制宜,靈活運(yùn)用教育政策,促進(jìn)未成年人教育的高效發(fā)展,同時(shí)國家應(yīng)完善法律法規(guī),健全未成年人權(quán)益保護(hù)制度;父母應(yīng)履行家庭保護(hù)的職責(zé)和撫養(yǎng)義務(wù),教育、引導(dǎo)未成年人;學(xué)校應(yīng)全面貫徹國家教育方針,保證未成年人的身心健康和全面發(fā)展;社會(huì)為未成年人健康成長提供良好的社會(huì)環(huán)境;青少年自身增強(qiáng)自我保護(hù)意識(shí),掌握日常生活中自我保護(hù)的方法和技巧。
參考文獻(xiàn):
[1]馮守平.中國人口發(fā)展預(yù)測(cè)模型的構(gòu)建與應(yīng)用[J].統(tǒng)計(jì)與決策,2010,(15):24-27.
[2]柳德江,殷鳳玲,唐紅燕.玉溪市未來人口預(yù)測(cè)三種模型的分析[J].中國人口•資源與環(huán)境,2011,(3):17-19.
[3]龍承星,張波.昆明市人口預(yù)測(cè)模型研究[J].云南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2011,(7):258-261.
[4]趙沙,張福平.西安市未來人口規(guī)模預(yù)測(cè)及人口發(fā)展對(duì)策研究[J].干旱區(qū)資源與環(huán)境,2012,(2):7-12.
[5]沈巍,武鑫.基于數(shù)據(jù)挖掘的北京市人口增長影響因素研究[J].中國人口•資源與環(huán)境,2013,23(S2):470-473.
作者:王瑤 臧子雁 單位:北京物資學(xué)院
熱門標(biāo)簽
數(shù)據(jù)分析論文 數(shù)據(jù)挖掘論文 數(shù)據(jù)管理論文 數(shù)據(jù)安全論文 數(shù)據(jù)庫論文 數(shù)據(jù)誤差 數(shù)據(jù)統(tǒng)計(jì) 數(shù)據(jù)挖掘總結(jié) 數(shù)據(jù)采集 數(shù)據(jù)分析 心理培訓(xùn) 人文科學(xué)概論