醫(yī)療數(shù)據(jù)分析論文
時(shí)間:2022-03-27 03:04:54
導(dǎo)語(yǔ):醫(yī)療數(shù)據(jù)分析論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
將醫(yī)院、醫(yī)療保健組織等數(shù)字化的醫(yī)療數(shù)據(jù)以特定的格式、協(xié)議發(fā)送到醫(yī)療數(shù)據(jù)分析模塊進(jìn)行分析與疾病預(yù)測(cè).醫(yī)療數(shù)據(jù)提取模塊:該模塊由醫(yī)院電子病歷系統(tǒng)負(fù)責(zé)實(shí)現(xiàn),我們使用openEHR系統(tǒng)作為醫(yī)院電子病歷系統(tǒng),并在openEHR中實(shí)現(xiàn)醫(yī)療數(shù)據(jù)的提取功能.openEHR系統(tǒng)是一個(gè)開源、靈活的電子病歷系統(tǒng),支持HL7衛(wèi)生信息交換標(biāo)準(zhǔn).很多醫(yī)療健康組織、政府和學(xué)術(shù)科研單位都使用openEHR進(jìn)行開發(fā)和科研工作.如一種基于openEHR的患者病歷數(shù)據(jù)管理模型、openEHR等許多開源的電子病歷平臺(tái)的對(duì)比與評(píng)估和基于openEHR的檔案建模等.?dāng)?shù)據(jù)交換模塊:基于Web服務(wù)的數(shù)據(jù)交換模塊使用醫(yī)療數(shù)據(jù)通信協(xié)議實(shí)現(xiàn)醫(yī)療數(shù)據(jù)分析模塊與醫(yī)療數(shù)據(jù)提取模塊的數(shù)據(jù)交換.Web服務(wù)是一個(gè)平臺(tái)獨(dú)立、松耦合的Web應(yīng)用程序.由于Web服務(wù)的跨平臺(tái)特性,許多模型與框架是基于Web服務(wù)構(gòu)建的,如基于Web服務(wù)集成分布式資源和數(shù)據(jù)流分析測(cè)試等.在本文提出的醫(yī)療數(shù)據(jù)分析模型中,使用Web服務(wù)來(lái)連接醫(yī)療數(shù)據(jù)分析模塊和醫(yī)療數(shù)據(jù)提取模塊.醫(yī)療數(shù)據(jù)提取模塊作為Web服務(wù)的服務(wù)端,實(shí)現(xiàn)的方法包括存取數(shù)據(jù)、數(shù)據(jù)預(yù)處理、序列化等,改進(jìn)后的模型要求實(shí)現(xiàn)指定維度,指定屬性數(shù)據(jù)的讀?。疚奶岢龅尼t(yī)療數(shù)據(jù)分析模塊作為Web服務(wù)的客戶端,通過(guò)HTTP服務(wù)向數(shù)據(jù)提取模塊請(qǐng)求獲取數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理.醫(yī)療數(shù)據(jù)分析模塊:我們使用Caisis開源平臺(tái)作為醫(yī)療數(shù)據(jù)分析與疾病預(yù)測(cè)系統(tǒng)實(shí)現(xiàn)這一模塊.Caisis是基于Web的開源癌癥數(shù)據(jù)管理系統(tǒng),一些臨床醫(yī)學(xué)研究使用Caisis系統(tǒng)管理和歸檔數(shù)字顯微圖像,通過(guò)向Caisis系統(tǒng)中添加特征選擇和SVM算法,使用SVM算法對(duì)醫(yī)療數(shù)據(jù)進(jìn)行分析和疾病預(yù)測(cè),因此使用的特征選擇算法需要基于SVM,可以提高數(shù)據(jù)分析和疾病預(yù)測(cè)過(guò)程的效率和準(zhǔn)確度.
2數(shù)據(jù)分析模塊與算法
2.1SVM算法SVM算法最初是由Vapnik等人在1995年提出的一種可訓(xùn)練的機(jī)器學(xué)習(xí)算法.依據(jù)統(tǒng)計(jì)學(xué)習(xí)理論、VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論,從一定數(shù)目的樣本信息在學(xué)習(xí)能力和復(fù)雜度(對(duì)訓(xùn)練樣本的學(xué)習(xí)程度)中找到最佳折中,以期望獲得最好的推廣能力(或稱泛化能力).
2.2基于SVM的醫(yī)療數(shù)據(jù)分析模塊將SVM分類算法應(yīng)用到醫(yī)療數(shù)據(jù)分析模塊中,進(jìn)行疾病預(yù)測(cè).基于SVM的醫(yī)療數(shù)據(jù)分析模塊,通過(guò)數(shù)據(jù)交換模塊獲取原始組數(shù)據(jù)(患病病人醫(yī)療數(shù)據(jù)和對(duì)照組病人數(shù)據(jù)).通過(guò)特征選擇過(guò)程輸入到SVM分類器中進(jìn)行訓(xùn)練,訓(xùn)練后可以對(duì)新的醫(yī)療數(shù)據(jù)進(jìn)行分析預(yù)測(cè).
3改進(jìn)的醫(yī)療數(shù)據(jù)交換模塊
3.1醫(yī)療數(shù)據(jù)交換模塊在原始的醫(yī)療數(shù)據(jù)交換模塊中,數(shù)據(jù)請(qǐng)求原語(yǔ)只由4條通信原語(yǔ)組成.由原始醫(yī)療數(shù)據(jù)分析模型的3個(gè)模塊構(gòu)建,其中在醫(yī)療數(shù)據(jù)分析模塊與醫(yī)療數(shù)據(jù)提取模塊之間的4條通信原語(yǔ)包括2條請(qǐng)求和2條應(yīng)答.由于醫(yī)療數(shù)據(jù)的維度極大,屬性很多,但是在預(yù)測(cè)某個(gè)疾病時(shí),只有很少的一部分屬性會(huì)對(duì)分類預(yù)測(cè)產(chǎn)生影響.這樣的全部維度的數(shù)據(jù)都需要傳輸,浪費(fèi)了時(shí)間,降低了數(shù)據(jù)傳輸效率,影響了醫(yī)療數(shù)據(jù)分析模塊的算法效率.
3.2改進(jìn)的醫(yī)療數(shù)據(jù)交換模塊在改進(jìn)的醫(yī)療數(shù)據(jù)交換模塊中,在數(shù)據(jù)傳輸協(xié)議中增加了4條原語(yǔ).在每條原語(yǔ)中不僅有醫(yī)療記錄條數(shù)的要求,還包括對(duì)所請(qǐng)求醫(yī)療數(shù)據(jù)維度和屬性的具體說(shuō)明.醫(yī)療數(shù)據(jù)分析模塊先請(qǐng)求一小部分全部維度的數(shù)據(jù),對(duì)這小部分?jǐn)?shù)據(jù)進(jìn)行特征選擇.然后醫(yī)療數(shù)據(jù)分析模塊只請(qǐng)求特征選擇出來(lái)的對(duì)預(yù)測(cè)相關(guān)的屬性的剩余所有醫(yī)療數(shù)據(jù).最后通過(guò)SVM分類算法進(jìn)行訓(xùn)練和預(yù)測(cè).在新的醫(yī)療數(shù)據(jù)交換模塊中,大部分?jǐn)?shù)據(jù)中只有小部分相關(guān)屬性被傳輸?shù)綌?shù)據(jù)分析模塊,極大地減少了數(shù)據(jù)傳輸總量,也同時(shí)增加了分析模塊預(yù)測(cè)算法的效率.
4原始模型與改進(jìn)模型的對(duì)比結(jié)果
在對(duì)改進(jìn)后的模型進(jìn)行實(shí)驗(yàn)評(píng)估時(shí),當(dāng)Caisis系統(tǒng)請(qǐng)求的訓(xùn)練數(shù)據(jù)總數(shù)從100~600條變化時(shí),特征選擇請(qǐng)求的數(shù)據(jù)條數(shù)均取100條.當(dāng)Caisis系統(tǒng)請(qǐng)求的訓(xùn)練數(shù)據(jù)總數(shù)為100條時(shí),改進(jìn)模型與原始模型的總數(shù)據(jù)傳輸時(shí)間是相同的,這是因?yàn)楫?dāng)Caisis系統(tǒng)請(qǐng)求的訓(xùn)練數(shù)據(jù)總數(shù)與改進(jìn)模型的特征選擇請(qǐng)求的數(shù)據(jù)條數(shù)都是100條.無(wú)論是原始模型還是改進(jìn)模型,openEHR系統(tǒng)發(fā)送回來(lái)的數(shù)據(jù)都是100條的全部屬性.所以,當(dāng)Caisis請(qǐng)求的訓(xùn)練數(shù)據(jù)總數(shù)與進(jìn)行特征選擇的條數(shù)相同時(shí),改進(jìn)模型降級(jí)為與原始模型具有相同傳輸效率.但是隨著Caisis系統(tǒng)請(qǐng)求的訓(xùn)練數(shù)據(jù)總數(shù)的不斷增加,改進(jìn)模型則具有非常明顯的優(yōu)勢(shì).對(duì)改進(jìn)模型的評(píng)估.當(dāng)Caisis系統(tǒng)請(qǐng)求的醫(yī)療數(shù)據(jù)總數(shù)一定時(shí),隨著Caisis系統(tǒng)進(jìn)行特征選擇所請(qǐng)求的數(shù)據(jù)條數(shù)變化,總數(shù)據(jù)傳輸時(shí)間不斷增加,傳輸效率逐漸降低.Caisis系統(tǒng)第一步進(jìn)行特征選擇所請(qǐng)求的數(shù)據(jù)條數(shù)越小,就會(huì)有更少的數(shù)據(jù)以全部屬性傳輸,也就是說(shuō),更多的數(shù)據(jù)會(huì)以更少的屬性傳輸.這樣,總的數(shù)據(jù)量變小,醫(yī)療數(shù)據(jù)的傳輸效率就增大.相反,隨著Caisis系統(tǒng)第一步特征選擇所請(qǐng)求的數(shù)據(jù)條數(shù)的增加,總的傳輸數(shù)據(jù)量變大,醫(yī)療數(shù)據(jù)的總傳輸時(shí)間也會(huì)變長(zhǎng).當(dāng)Caisis系統(tǒng)第一步特征選擇所請(qǐng)求的數(shù)據(jù)條數(shù)等于需要訓(xùn)練的總數(shù)時(shí),全部數(shù)據(jù)的全部屬性都需要傳輸給Caisis,這就使得改進(jìn)模型降級(jí)為與原始模型具有相同的低效率模型系統(tǒng).實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的醫(yī)療數(shù)據(jù)交換協(xié)議具有更高的數(shù)據(jù)交換效率,并且醫(yī)療數(shù)據(jù)分析與預(yù)測(cè)系統(tǒng)進(jìn)行特征選擇時(shí)使用的數(shù)據(jù)量越小,醫(yī)療數(shù)據(jù)的交換效率越高;基于SVM的特征選擇算法提高了醫(yī)療數(shù)據(jù)分析系統(tǒng)的效率,并提高了使用SVM算法進(jìn)行預(yù)測(cè)分析的效率和準(zhǔn)確度.
作者:田宇馳胡亮單位:吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院