科技信息資源平臺創(chuàng)建

時間:2022-07-20 08:59:41

導語:科技信息資源平臺創(chuàng)建一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

科技信息資源平臺創(chuàng)建

1科技信息資源共建共享平臺研究現(xiàn)狀及存在的問題

1.1科技信息資源共建共享平臺研究現(xiàn)狀

由于國家的政策性扶持及引導,我國科技信息資源平臺建設與應用發(fā)展迅速,并逐漸滲透到科研活動中。從全國來看,當前絕大部分省份已建設并使用科技信息資源共享平臺。江蘇、福建、廣東三省的數(shù)字資源共建共享平臺整合的范圍不斷擴大,已擴展到應用程序與服務等方面,同時,也開始逐步注重人們的個性化信息需求,并通過各種信息資源聯(lián)合體、互助協(xié)作等形式,統(tǒng)一購買電子文獻資源,促進了研究所、圖書館的發(fā)展。但資源重復建設嚴重、缺乏統(tǒng)一的規(guī)劃與協(xié)調(diào)、數(shù)字圖書館標準不一、合作建設少等問題也越發(fā)突出,急需一個共建共享平臺來解決目前的困境。

1.2科技信息資源共建共享平臺建設存在的問題

1.2.1區(qū)域發(fā)展不同,導致其建設的不均衡經(jīng)濟發(fā)達的地區(qū)或省份,借助國家政策的支持,利用其底子厚、起步早、發(fā)展快、技術手段先進等有利條件,積極開展科技文獻平臺建設工作。比如國家科技圖書文獻中心和清華大學等,對全國性的文獻平臺進行了研究和開發(fā)。加之這些平臺的后期建設有資金支持,技術裝備先進,服務條件好,他們的科技文獻平臺建設和服務走在全國前列。其他地區(qū)的科技信息資源共建共享平臺建設無法與其相比,其發(fā)展有一定的相對性和局限性,無論是建設情況還是使用情況,都有待提高。

1.2.2共建共享協(xié)調(diào)機制不完善共享平臺建設缺乏統(tǒng)一規(guī)劃和協(xié)調(diào),處于各自為戰(zhàn)狀態(tài),或者是非常松散的簡單合作,僅僅靠一個合作協(xié)議和理事會章程等自我約束,沒有強制性的義務也沒有法理層的權利,導致科技信息資源的收藏分散、重復,難以形成服務的整體優(yōu)勢。

1.2.3平臺標準化水平、服務層次有待提高實現(xiàn)科技信息資源共享的前提就是平臺標準化。但就目前的現(xiàn)狀來說,標準化程度相當?shù)?,?guī)范標準不一致,各平臺從總體設計框架到具體實現(xiàn)的底層技術手段大相徑庭,自建數(shù)據(jù)庫五花八門,不具備和其他平臺數(shù)據(jù)庫互聯(lián)的功能,制約了科技信息資源共享的發(fā)展。

2科技信息資源共建共享平臺建設的必要性及意義

2.1科技信息資源共建共享平臺建設的必要性

2.1.1科技信息資源的高速增長目前每個資源中心的數(shù)據(jù)庫少則幾十個,多則幾百個。隨著整體教育水平的提高、人們對信息資源利用水平的提高,資源中心需要向人們提供更多、更專業(yè)的學術資源信息。一些專業(yè)的資源商也開始提供一些更細致的學術信息,比如經(jīng)濟類、法律類、標準類、教育類、醫(yī)藥類等資源。越來越多的科技信息資源在檢索利用過程中必然帶來學術資源利用率低、檢索效率低下等問題,這無論對于科技信息資源來講還是資源中心情報服務來說都是一種效益浪費。受采集資源的專業(yè)局限性影響,無論是以上哪一類信息,沒有一家資源商能夠囊括它所關注的那一類資源的所有學術信息。因此,資源中心為提供完善的信息服務,需要購買多家數(shù)據(jù)庫提供商的資源。而信資源中心向人們展示這些資源的時候,因商家不同,其使用界面和檢索方式均不相同,登錄認證方式也不一樣,所以不得不向人們分別提供這些信息,常見的方式就是在一個或多個頁面里列出各個資源的鏈接和登錄信息。人們在復雜繁多的科技資源中徘徊,要找到自己真正需要的資源往往需要熟悉各個不同的科技信息資源的檢索方式、文獻分類方式、檢索結果設置等,要耗費精力時間卻往往檢索結果不盡如人意。

2.1.2檢索期望的日益提高現(xiàn)在的學術研究需要的不再是龐雜的文獻的堆砌,而是精確的數(shù)據(jù)、事實的支持佐證。所以科研工作者在浩瀚的學術海洋里面尋找符合自己需求的文獻資源越來越難。各資源中心所提供的科技信息資源之間互相獨立,列表顯示,需要人們分別登錄訪問,并在訪問這些資源的時候,不得不點開一個個資源鏈接,登錄,輸入關鍵詞后進行搜索,由于各資源系統(tǒng)界面不一樣,搜索方式不一樣,搜索的效率很低。另外,數(shù)據(jù)量快速膨脹,逐步由找不到內(nèi)容變成找到的太多太雜,耗費幾倍的時間用于查找。因此,人們對數(shù)據(jù)檢索的要求越來越高,希望在最快的時間內(nèi)以最簡單的檢索方式找到自己的目標知識。隨著學科交叉滲透的不斷發(fā)展,學科間的聯(lián)系越來越緊密,簡單的檢索文獻已經(jīng)不能滿足人們的學習與科研要求,人們需要從繁多的學術文獻中找到關聯(lián),如何利用簡單快捷的檢索挖掘發(fā)現(xiàn)深層次的知識、整合文獻內(nèi)容從而爆發(fā)新的知識點才是未來學術發(fā)展的熱點。

2.1.3圖書館角色的升級與轉(zhuǎn)變?nèi)戮W(wǎng)絡時代的來臨使資源中心的服務理念、管理理念及相應的用戶體驗都發(fā)生了全新的變化。在信息與知識日益豐富的今天,這種變化已在迅速影響著圖書館,不斷推動圖書館向網(wǎng)絡虛擬型圖書館方向發(fā)展,逐步實現(xiàn)了無縫的用戶體驗,允許人們互動參與、以論壇社區(qū)為基礎的形式來設計程序、開源軟件的應用等。

2.2科技信息資源共享平臺建設的研究意義

資源中心可以通過各種信息資源聯(lián)合體、互助協(xié)作等形式,統(tǒng)一購買電子文獻資源,促進各資源中心的協(xié)調(diào)發(fā)展。但資源重復建設嚴重、缺乏統(tǒng)一的規(guī)劃與協(xié)調(diào)、數(shù)字圖書館標準不一、合作建設少等問題也越發(fā)突出,急需一個共建共享平臺來解決目前的困境。共享平臺的建設以CAILS的設計模式和運行機制為基礎,構建輻射的共建共享運行機制和模式,全面提升各科技信息資源建設和服務的整體發(fā)展質(zhì)量和輻射帶動能力,逐步形成覆蓋各學科的科技信息資源保障網(wǎng)絡,實現(xiàn)資源的共建共享、互惠互利,實現(xiàn)共同參與、按比例投入、共同建設、共同受益、共同管理的建設目標??萍夹畔①Y源共享平臺是資源中心在信息時代滿足學術需求、體現(xiàn)“讓大眾公平自由地獲取知識信息”這一理念的必由之路。此平臺的實現(xiàn)具有一定的理論意義。信息資源共享平臺建設有助于提高自然資源的開發(fā)利用水平和效率,減少資源浪費和能源消耗,減少對環(huán)境的污染和危害等,具有較好的經(jīng)濟效益。資源中心構建科技信息資源共建共享平臺可以加快推進節(jié)約型社會建設,實現(xiàn)信息資源的合理配置,成為推動社會發(fā)展、經(jīng)濟繁榮和科技進步的助推器,具有良好的社會效益。

3科技信息資源共享平臺的總體架構設計

科技信息資源共享平臺的總體架構可分為門戶層、管理層、數(shù)據(jù)層、硬件層四個部分。各個成員單位的系統(tǒng)相對獨立,由共享平臺的各個子系統(tǒng),如統(tǒng)一認證系統(tǒng)、聯(lián)合編目系統(tǒng)、統(tǒng)一檢索系統(tǒng)等組成,并建立了統(tǒng)一的綜合服務門戶,將每個系統(tǒng)、服務和資源整合起來。各層面說明如下:

3.1硬件層面

包括網(wǎng)絡平臺、服務器和大容量存儲設備等,是共建共享平臺的硬件設施,是賴以提供服務的硬件基礎。

3.2數(shù)據(jù)層面

包括館藏資源(圖書、期刊等)、數(shù)字資源(數(shù)字期刊、數(shù)據(jù)庫等)、各種自建和引進的特色數(shù)據(jù)庫、共建資源庫(如聯(lián)合目錄等)、統(tǒng)一認證中心數(shù)據(jù)庫等,是實現(xiàn)共享的內(nèi)容基礎。

3.3服務層面

服務各個層次,是共享體系的組織保證,是共享平臺特殊服務層。包括元數(shù)據(jù)的加工與管理、數(shù)字對象的加工與管理、聯(lián)機編目、用戶權限管理和服務評估等,分別服務于數(shù)據(jù)層、技術層、服務層等,通過有效地組織管理和運行機制保證共享體系的實施。該層通過跨越分在不同地點的所有數(shù)字資源,提供分布式數(shù)據(jù)訪問、資源聚合和過濾、數(shù)據(jù)挖掘等。

3.4應用標準與協(xié)議層面

應用標準與協(xié)議層是共建共享平臺面向用戶的統(tǒng)一服務的窗口,是共享平臺最重要的一層,為共享平臺服務提供了方便的接口。通過信息集成和服務集成,綜合門戶平臺整合了各類文獻服務和專業(yè)信息服務;通過統(tǒng)一認證,支持成員單位用戶的訪問控制和個性化定制,從而為各服務節(jié)點和用戶提供數(shù)字資源共享的環(huán)境。

4科技信息資源共享平臺建設整合內(nèi)容

4.1規(guī)范化建設研究

各資源中心的采購、編目、查詢和提供信息服務等必須采取統(tǒng)一的模式進行。這一點幾乎不可能實現(xiàn),只有從不同的信息系統(tǒng)平臺中提取標準化的信息數(shù)據(jù),建立合作的館藏資源,統(tǒng)一科技信息資源的合理配置與協(xié)調(diào),有選擇、有重點地建設科技信息資源,才能為整個共享網(wǎng)絡提供信息服務,發(fā)揮群體效益。在數(shù)字資源整合方面,采取的措施有2種:一種是研究各個資源中心的管理系統(tǒng)、數(shù)字資源的底層設計,抽取關鍵字段,進行標準化處理,由平臺開發(fā)人員整合各個成員單位的館藏數(shù)據(jù),形成統(tǒng)一館藏資源,可以實時進行更新數(shù)據(jù),但比較費時麻煩,甚至需要各個軟件的開發(fā)部門的配合才能得以完成。另一種就是利用CALIS整合文獻資源的模式,由成員單位定期上傳或提交數(shù)據(jù),實時整合資源,這樣更新速度慢,簡單方便,但需要成員單位密切配合,容易實現(xiàn)。在實際操作中,2種方法的結合,達到了較好的預期效果。為了強調(diào)數(shù)字資源的標準化,館藏圖書目錄方面,我們采用第二種方法———CALIS整合文獻資源模式,要求成員單位及時提供標準的MARC編目數(shù)據(jù),定期上傳,建立和完善書目數(shù)據(jù)庫,形成聯(lián)合目錄以實現(xiàn)數(shù)據(jù)庫的轉(zhuǎn)換、交換、兼容和不同系統(tǒng)資源的共享;并由專門人員負責收集整理,實現(xiàn)起來比較容易。對于非標準化的數(shù)字資源,針對各種資源的特點,采用同構跨庫檢索技術基本能實現(xiàn)非標準化數(shù)據(jù)的檢索問題。這一技術的應用將在下面的技術層面進行詳解。

4.2技術支撐平臺建設研究

通過信息規(guī)劃、信息采集、信息加工處理、信息管理、信息、信息服務、用戶權限、信息傳輸交換,實現(xiàn)了各種文獻資源采集、整合、加工處理、管理、和對外開展文獻資源檢索服務、原文傳遞服務的技術支撐平臺的建設。同構跨庫檢索是資源整合系統(tǒng)的新理念與發(fā)展趨勢。單純的跨庫檢索與數(shù)字資源整合,不能體現(xiàn)學術文獻間的互相聯(lián)系。在Lib2.0環(huán)境下,基于發(fā)現(xiàn)與傳遞服務的一站式同構跨庫檢索系統(tǒng),則較好地解決了上述矛盾,給資源整合提供了一種新的發(fā)展思路。利用同構跨庫檢索技術使用先進的數(shù)據(jù)萃取技術,可以把多種標準、多種格式或非標準自建的數(shù)據(jù)庫,比如常見的中外文數(shù)據(jù)庫,如書生、超星、方正、同方、維普、萬方、SpringLink、AIAA、Proquest、Open-Access等,以及資源中心的自建數(shù)據(jù)庫、網(wǎng)絡數(shù)據(jù)庫、光盤數(shù)據(jù)庫等在內(nèi)的分布、異構和多樣化的數(shù)字信息資源進行整合。同構跨庫檢索技術無視源數(shù)據(jù)庫使用何種標準、何種格式,只要能夠以網(wǎng)頁的形式展現(xiàn)給人們,就可以獲得技術支持。同時,也支持各種外部系統(tǒng)的溝通協(xié)議,支持標準或非標準的數(shù)據(jù)交換格式,包括ISO2709(例如MARC21、UNIMARC、CMARC等)、NISO?ANSIZ39.85(DublinCore)、XML等;支持標準檢索協(xié)議規(guī)范包括Z39.50、HTTP、Z39.88等。資源門戶支持開放的體系結構,遵循信息描述、組織和資源互操作的國際標準,甚至支持以非標準協(xié)議進行的整合檢索。因此,根據(jù)各個資源中心的實際情況,可以對各種獨有的自建數(shù)據(jù)庫進行整合,最大限度地發(fā)揮擁有的數(shù)據(jù)庫資源,為人們提供更加便捷的服務。

4.3科技信息資源共享平臺建設整合研究

將平臺各聯(lián)合體的數(shù)據(jù)庫資源在科技信息資源共建共享平臺上實現(xiàn)整合,包括書目數(shù)據(jù)庫、網(wǎng)絡數(shù)據(jù)庫、電子出版物和自建特色數(shù)據(jù)庫等,整合為統(tǒng)一的檢索平臺。

4.3.1平臺建設目標要求(1)完成各種信息資源的一站式檢索數(shù)字資源按照資源類別分:圖書、期刊、學位論文、會議論文、視頻、報紙、標準等,人們可以在所有這些自然分類中同時進行搜索,也可以選擇在某個分類中進行搜索,無論使用哪種搜索方式,能更方便地找到自己所需要的信息資源至關重要。使用跨庫檢索技術檢索資源,被訪問資源正文仍然在各個資源庫,同構跨庫檢索同各個資源數(shù)據(jù)庫做了相應接口。人們訪問資源正文的時候無需再單獨登錄,即一站式登錄,登錄同構跨庫檢索系統(tǒng),既是登錄了以往的各個數(shù)據(jù)庫。人們只需在檢索口輸入目標檢索詞,例如主題、關鍵詞、全文、題名、摘要、作者、文獻來源、時間、刊號、刊名等,就可以同時在不同類型文獻資源中快速檢索目標文獻,不會受限于某個數(shù)據(jù)庫的網(wǎng)絡鏈接狀況。一站式檢索平臺使人們的檢索更加快捷、高效和全面。(2)實現(xiàn)不同信息資源檢索智能跳轉(zhuǎn)為方便人們訪問各個數(shù)據(jù)庫,不需要在各個數(shù)據(jù)庫間不斷重復輸入關鍵詞、不斷地打開、關閉數(shù)字資源等操作,實現(xiàn)了不同信息資源檢索的智能跳轉(zhuǎn)。人們只需要輸入一次關鍵詞,點擊自己關心的不同資源類型,目標檢索詞就能夠在多類型文獻資源中跳轉(zhuǎn)檢索,快速定位檢索目標,而且提供中文語義化搜索西文功能,智能分析與拆分檢索句段。(3)高級檢索方式同構跨庫檢索支持二次檢索與高級檢索,可以限定檢索詞出現(xiàn)的位置,如題名、作者、簡介、ISBN、ISSN、DOI等;可以限定資源的年代,以實現(xiàn)更精確地檢索,為專業(yè)的資源中心專家、科研人員提供深層次的學術檢索服務。(4)檢索結果自動去重融合傳統(tǒng)的學術文獻的檢索是以不同資源商提供的系統(tǒng)為基礎的,人們根據(jù)各個數(shù)據(jù)庫固有的檢索方式與功能檢索文獻,檢索結果可能會有很多重復的結果,由于系統(tǒng)間沒有關聯(lián),常常需要靠人工的方法去重,這種檢索模式割裂了不同類型資源相關學科、主題的學術關聯(lián),對人們來說是一種學術浪費,降低了學術研究的互補性與全面性。共享平臺把各種資源做了技術性的融合和去重,不是簡單的資源羅列,比如同一個資源的元數(shù)據(jù),可以把多家資源商提供的元數(shù)據(jù)互補得到一個更全面的描述,檢索出來的結果是自動去重后的結果,大大提高了檢索的效率,并能為人們提供全面的學術文獻。(5)語義化中文直接檢索西文大部分中國人習慣使用中文進行搜索,利用同構跨庫檢索技術可以讓人們使用中文關鍵詞搜索到相應的外文期刊或者外文論文,并能做更進一步的智能優(yōu)化處理。比如搜索“美國”可以搜索到含有“America”、“USA”、“National”等外文關鍵詞的文獻,搜索“高速公路”可以搜索到含有“Highway”、“Freeway”、“Superhighway”、“Motorway”等外文關鍵詞的文獻。(6)檢索結果優(yōu)化聚類利用同構跨庫檢索技術為人們提供精確全面的檢索結果優(yōu)化處理。比如:系統(tǒng)根據(jù)文獻出版時間、所屬學科、相關度、文獻檢索字段、文獻來源等對檢索結果提供精確的聚類導航分析,進一步縮小和精確檢索結果;系統(tǒng)還可以針對每一種文獻資源的屬性設置相匹配的檢索字段檢索,對中文資源系統(tǒng)支持基于中圖分類的四級類別的學科分類;人們可以逐步縮小檢索的范圍以實現(xiàn)更精確地篩選檢索,協(xié)助用戶挖掘信息,從而做出更深入的專題研究。

4.3.2共享平臺建設整合方法采用同構跨庫檢索模式,通過對本地各類鏡像數(shù)據(jù)庫、館藏印刷型資源、遠程數(shù)據(jù)庫建立超級統(tǒng)一索引,可以使人們根據(jù)檢索需要進行檢索,進行一站式發(fā)現(xiàn)與傳遞,為人們提供一站式解決方案,簡化了從資源發(fā)現(xiàn)到獲取的檢索過程,使人們能夠快速找到和獲得準確、高質(zhì)量的信息。同構跨庫檢索技術的技術原理如圖1所示:這樣通過數(shù)據(jù)融合,可以得到一個元數(shù)據(jù)信息最豐富最全面的頁面,包括題名、作者、分類、時間、摘要、參考文獻、關鍵詞、主題詞等??梢詾橛脩籼峁┙y(tǒng)一的界面設置,提供多字段匹配,并且檢索結果匹配率高、全面,能合并95%以上的重復文獻。能夠?qū)⑶岸巳藗兎蘸秃蠖烁黝悎D書館的資源管理連成一體,能夠為圖書館向新的信息系統(tǒng)架構轉(zhuǎn)型提供可靠的技術支持。資源整合的過程是自動化的,對各種頁面類型內(nèi)容智能識別和抽取結構數(shù)據(jù)。沒有開放接口的數(shù)據(jù)庫能像具有openurl的系統(tǒng)一樣互聯(lián)互通,為同構跨庫檢索提供了有力的技術支持,實現(xiàn)了資源的統(tǒng)一共享。

4.4知識產(chǎn)權保護技術研究

對于每個成員單位購買的科技信息資源的全文可以直接下載閱讀,也可以跳轉(zhuǎn)到原數(shù)據(jù)庫的詳細頁面。成員單位全文鏈接提供兩種解決方式:一種方式為服務器獲取方式,成員單位內(nèi)安裝服務器和相應的全文系統(tǒng),當人們點擊獲取正文請求時,直接由全文系統(tǒng)處理返回全文的下載或者閱讀頁面。另一種方式為客戶端控件獲取方式,通過文獻元數(shù)據(jù)頁面內(nèi)嵌的一個控件,模擬人們登錄原文數(shù)據(jù)庫和搜索原文的過程,返回文獻正文的鏈接地址。這兩種方式完成的目標是一樣的,區(qū)別在于任務是由服務器端來處理還是由客戶端來處理。非自己購買的科技信息資源為避免版權問題,可以采用各種文獻資源的搜索服務和元數(shù)據(jù)同構展示,需要全文服務的,利用自動文獻傳遞的方式獲得,以避免版權糾紛,保證人們的利益最大化。

5科技信息資源共建共享平臺建設的建議

將平臺各聯(lián)合體的數(shù)據(jù)庫資源在科技信息資源共建共享平臺上實現(xiàn)整合,發(fā)揮各協(xié)作館印刷性文獻、電子型文獻和網(wǎng)絡信息資源的優(yōu)勢,加強交流和合作,按統(tǒng)一的標準加以整合,建立起互惠互利的信息資源共享關系,構建印刷型資源和數(shù)字化資源并存的信息資源共建共享體系。通過1年的建設,基本建成覆蓋科技信息資源領域的、較完整的、適應科技創(chuàng)新要求的、具有區(qū)域特色的科技信息資源保障體系。

5.1建立共享組織體制和工作機制

加強對科技信息資源共建共享的協(xié)作機制的建設,建立分布式數(shù)字資源加工、集中元數(shù)據(jù)存儲檢索服務、分布式全文提供和原文傳遞的共建共享組織體制和工作機制,成立科技信息資源共建共享協(xié)會,共同組織實施。

5.2建立分類科學、配置合理的科技信息資源保障體系

整合全省各種來源、各種媒體、各種類型的科技信息資源,建立與各資源中心發(fā)展相適應的、各學科文獻資源相對齊全、文獻類型覆蓋期刊、圖書、專利、標準、學位論文、會議論文、檢索數(shù)據(jù)庫等的共享的、分布式的大型科技信息數(shù)據(jù)庫群,建立分類科學、配置合理、共建共享、服務于科技的信息資源保障體系。

5.3建立共建共享的科技信息服務技術支撐平臺

建立軟件技術支撐平臺,實現(xiàn)各科技資源成員單位的本地數(shù)據(jù)標引、加工與全文電子資源制作;完成集中元數(shù)據(jù)管理、資源整合與統(tǒng)一服務;實現(xiàn)元數(shù)據(jù)、全文信息的無障礙傳遞;形成統(tǒng)一的、安全的資源管理、整合和信息服務平臺。

5.4建立完善的平臺標準規(guī)范體系

(1)規(guī)范平臺的建設標準制定合理的平臺總體框架、技術標準規(guī)范、平臺擴展規(guī)范、數(shù)據(jù)庫接口規(guī)范等,規(guī)范跨平臺的數(shù)據(jù)共享。(2)對平臺的信息資源進行規(guī)范制定平臺元數(shù)據(jù)標準,以便建立相應的基本元數(shù)據(jù)規(guī)范,包括格式定義、語義定義、開放標記規(guī)范、擴展規(guī)則等。(3)規(guī)范平臺的服務標準制定平臺的應用服務規(guī)范、檢索服務規(guī)范等,規(guī)范平臺提供的查新、檢索以及科技咨詢等服務,提高信息服務水平。

5.5建立資源共建共享協(xié)調(diào)機制

要實現(xiàn)跨系統(tǒng)、跨區(qū)域的科技資源共享,就要成立由政府部門牽頭或指定的跨系統(tǒng)、跨區(qū)域的協(xié)調(diào)機構,解決管理體制帶來的障礙。這樣不僅能解決資金緊張問題,而且可避免資源的重復建設。