區(qū)域自動站數(shù)據(jù)質(zhì)量分析與評估

時間:2022-11-04 11:16:43

導語:區(qū)域自動站數(shù)據(jù)質(zhì)量分析與評估一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

區(qū)域自動站數(shù)據(jù)質(zhì)量分析與評估

常規(guī)氣象觀測數(shù)據(jù),尤其是空間密度較高的區(qū)域自動站觀測數(shù)據(jù),是制作天氣預報和氣候預測的基礎資料,其正確與否直接影響著天氣預報和氣候預測的質(zhì)量[1-3]。近年來,國內(nèi)外針對自動站觀測資料質(zhì)量控制已作了大量研究,為自動站質(zhì)量控制的業(yè)務應用奠定了良好的基礎[4-8]。氣象資料業(yè)務系統(tǒng)(簡稱MDOS)就是在此基礎上研發(fā)的一個集數(shù)據(jù)傳輸監(jiān)控、質(zhì)控信息處理與查詢反饋、基礎信息管理、產(chǎn)品制作與數(shù)據(jù)服務、元數(shù)據(jù)處理于一體的業(yè)務平臺。本研究基于MDOS中區(qū)域自動站小時數(shù)據(jù)的質(zhì)控結果,重點就MDOS正式運行之后廣東省區(qū)域自動站小時數(shù)據(jù)的質(zhì)量進行分析和評估,希望能夠為天氣應用提供可信性參考,以進一步提高中小尺度天氣系統(tǒng)的預報準確率和預警能力。

1考核區(qū)域自動站數(shù)據(jù)質(zhì)量

1.1考核標準。按數(shù)據(jù)上傳時效考核與否,區(qū)域自動站分為考核站和非考核站。本研究首先利用國家氣象局業(yè)務內(nèi)網(wǎng)的廣東省2015年7月至2018年12月考核區(qū)域自動站資料質(zhì)量,對資料可用率、錯誤率、可疑率、缺測率進行統(tǒng)計分析。考核標準中所使用的質(zhì)控碼是Z文件質(zhì)控碼,Z文件質(zhì)控碼及其描述如表1所示??捎寐实姆肿訉谝惑w化的質(zhì)控碼為0、3、4的數(shù)據(jù)個數(shù);錯誤率對應于一體化數(shù)據(jù)質(zhì)控碼2的個數(shù);可疑率對應于一體化數(shù)據(jù)質(zhì)控碼1的個數(shù);可用率、錯誤率、可疑率分母均對應于考核要素個數(shù);缺測率分子由3部分數(shù)據(jù)累加得到:1)考核要素中,質(zhì)控碼為8的個數(shù);2)考核要素中,質(zhì)控碼為7(無觀測任務)的要素個數(shù);3)快速質(zhì)控文件未上傳的考核站的考核要素個數(shù),分母對應于考核要素個數(shù)。1.2考核區(qū)域自動站總體質(zhì)量評價。圖1反映了自MDOS正式運行以來,區(qū)域自動站的各月平均可疑率及錯誤率隨月份的分布情況。由圖1可知,考核區(qū)域站的錯誤率各月份普遍偏低,冬季(12月—次年2月)錯誤率接近于0,而可疑率冬季相對其他季節(jié)偏高,12月為013%。但是與缺測率橫向比較發(fā)現(xiàn),二者對可用率的影響較小,貢獻最大月份也低于014%,相對而言,其影響可以忽略。圖1考核區(qū)域自動站疑誤率隨月份變化2015年7月至2018年12月廣東省考核區(qū)域自動站月平均可用率、缺測率的分布如圖2所示。由圖2可知,可用率存在明顯的季節(jié)變化趨勢,秋冬季節(jié)較好,數(shù)據(jù)可用率均達到975%以上。4月以后逐漸變差,7—10月是一年中數(shù)據(jù)可用率最差的時段,這與廣東省的汛期(4—10月)基本一致。結合各月平均缺測率隨月份變化曲線可知,考核區(qū)域站可用率隨月份變化的趨勢,與缺測率變化有明顯的對應關系,可用率與缺測率的皮爾遜相關系數(shù)高達-0999,通過了顯著性為1%的顯著性檢驗。導致區(qū)域自動站要素缺測的因素有移動通信故障、數(shù)據(jù)采集處理軟件故障、臺站儀器故障以及質(zhì)控確認缺測4個方面,結合廣東省幾類故障情況,統(tǒng)計同時段區(qū)域站數(shù)據(jù)缺測率可以發(fā)現(xiàn),通訊故障和數(shù)據(jù)采集處理軟件故障由于其影響范圍廣,是目前影響區(qū)域自動站數(shù)據(jù)缺測率的主要原因,約占所有缺測情況的75%以上。1.3考核區(qū)域自動站要素質(zhì)量分析。區(qū)域自動站按觀測要素個數(shù)可分為4要素站(溫度、雨量、風向、風速)和6要素站(溫度、雨量、風向、風速、氣壓和相對濕度)2種??己藚^(qū)域站各要素的正確率、錯誤率、可疑率及缺測率統(tǒng)計結果如圖3所示。由圖3可知,經(jīng)過MDOS質(zhì)量控制后的區(qū)域自動站考核要素的錯誤率及可疑率均較低,二者加起來也不到總量的05%,對各要素可用率影響較大的均為缺測率,氣溫、風速和降水的缺測率為2%左右,而氣壓和相對濕度相對較高,氣壓缺測率為50%,相對濕度缺測率為87%??紤]缺測率對數(shù)據(jù)可用率的影響較大,本研究進一步對各要素缺測率月分布情況進行分析,所得結果如圖4所示。由圖4可以看出,各要素2—5月缺測率普遍較高,4月達到最大值,此后缺測率開始降低,7—9月較低,10月以后缺測率分布又有抬升趨勢。氣溫、風速和降水的缺測趨勢基本一致,對各要素缺測率進行兩兩相關性檢驗,所得結果可以看出各要素缺測率相關性均較好,并且相關性均通過了顯著性為1%的相關性檢驗。

2MDOS質(zhì)量評估系統(tǒng)中區(qū)域自動站數(shù)據(jù)質(zhì)量

2.1各地市省級查詢與臺站反饋情況統(tǒng)計及時反饋率指疑誤信息的“查詢時間”與“反饋時間”之間的間隔未超過24h的數(shù)據(jù)個數(shù)占總下發(fā)疑誤數(shù)據(jù)的比例,它能夠量化反映臺站對疑誤信息的及時處理情況,目前在廣東省作為臺。站對于MDOS疑誤信息反饋的考核標準存在。2016—2018年,廣東省氣象局發(fā)往臺站的總疑誤信息查詢數(shù)為270766條,從反饋時效來看,及時反饋率為9307%、超時反饋率為682%、未反饋率為011%。利用MDOS質(zhì)量評估規(guī)則,分別對全省21個地市反饋及時率進行統(tǒng)計可知,東莞、深圳、中山3市臺站及時反饋率較高,均達到98%以上,而汕頭、河源、茂名、清遠的及時反饋率較低,均低于90%。2.2區(qū)域自動站疑誤信息統(tǒng)計。MDOS平臺質(zhì)量控制結果的疑誤類型分為錯誤、可疑、缺測3類,2016—2018年區(qū)域自動站共產(chǎn)生了978691條疑誤信息,系統(tǒng)判斷或人工判斷為錯誤的數(shù)據(jù)共計80252條,占據(jù)異常數(shù)據(jù)總體的82%;而可疑數(shù)據(jù)較多,占異常數(shù)據(jù)總體的622%;置缺測處理的疑誤信息共有289694條,占所有疑誤信息的296%。區(qū)域自動站數(shù)據(jù)的缺測過多,一是由于觀測設備故障或者通訊異常[9]導致的數(shù)據(jù)缺測;二是由于觀測數(shù)據(jù)經(jīng)過質(zhì)量控制后被標記為疑誤數(shù)據(jù),經(jīng)過反饋審核后確認為錯誤數(shù)據(jù),但無可用數(shù)據(jù)替代,所以當成缺測處理。分析不同要素的疑誤信息條數(shù)的結果(圖略)可知,區(qū)域自動站產(chǎn)生疑誤信息較多的要素分別為氣壓(32%)、濕度(35%)、風(18%),其中,氣壓的疑誤信息較多主要是由于廣東省土地面積大約3/5是坡地和丘陵[10],受海拔高度影響,氣壓經(jīng)常會提示未通過內(nèi)部一致性檢查等疑誤信息;風要素疑誤信息共181681條,極大風速、最大風速出現(xiàn)時間不在觀測時間范圍內(nèi),存在較多錯誤。2.3區(qū)域自動站疑誤信息質(zhì)控方法統(tǒng)計。由2016—2018年廣東省區(qū)域自動站產(chǎn)生的所有疑誤信息所采用的質(zhì)控方法(圖略)可以看出,區(qū)域自動站數(shù)據(jù)的978691條疑誤信息,主要由于數(shù)據(jù)未通過內(nèi)部一致性檢查及人工檢查得到,二者共占了所有疑誤信息引起原因的637%,快速質(zhì)控(154%)、范圍值檢查(81%)及包含多重檢查在內(nèi)的其他檢查(58%)也是發(fā)現(xiàn)疑誤信息的主要檢查方法;而未通過界限值檢查、持續(xù)性檢查、時變檢查、空間一致性檢查的疑誤信息共有67627條,占所有疑誤信息引起原因的69%。自MDOS在廣東省正式運行以來,區(qū)域站數(shù)據(jù)可疑率和錯誤率均較低,對數(shù)據(jù)可用性影響較小,各考核要素可用率主要受缺測率影響。而區(qū)域站各考核要素缺測率相關性較好,致使區(qū)域站數(shù)據(jù)缺測的的主要原因是通信故障和數(shù)據(jù)采集軟件故障。為了降低區(qū)域站數(shù)據(jù)缺測率,2018年下半年開始廣東省對新增區(qū)域站采集傳輸軟件進行了全面升級改造,2019年開始區(qū)域自動站通信系統(tǒng)也逐步進行升級,相信這些舉措都能有效改善區(qū)域自動站數(shù)據(jù)質(zhì)量。

作者:侯靈 楊玉紅 陳曉慶 單位:廣東省氣象探測數(shù)據(jù)中心