ML自動化信息方案
時間:2022-03-11 11:04:00
導語:ML自動化信息方案一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
[摘要]信息是任何電子商務和電子政務網(wǎng)站必須解決的技術問題,本文介紹了一種基于Xml的信息自動化方案,方案中無需引入數(shù)據(jù)庫管理系統(tǒng),降低了網(wǎng)站建設成本,提高了信息的效率。
[關鍵詞]信息XML電子商務電子政務
一、引言
隨著Internet的飛速發(fā)展和普及,電子商務和電子政務網(wǎng)站已經(jīng)成為企事業(yè)單位重要的信息平臺,也是人們快速獲取各種信息的重要途徑。目前國內很多公司都建立了自己的門戶網(wǎng)站和部門網(wǎng)站,來各類新聞和通知等信息。
當前信息大致有兩種方式:第一種是通過固定的模板來信息,即根據(jù)已有的HTML格式的信息模板,通過簡單的內容替換來生成靜態(tài)的頁面,然后通過FTP上傳到服務器,再修改主頁上的連接進行;第二種是將信息數(shù)據(jù)保存到數(shù)據(jù)庫或者文件中,當用戶閱讀具體信息的時候,從數(shù)據(jù)庫或文件中調出數(shù)據(jù),動態(tài)生成顯示頁面。
第一種方式,信息格式靈活,顯示速度較快,但整個過程很繁瑣,維護起來非常麻煩;第二種方式,信息的和管理比較方便;本文主要介紹一種基于XML的自動化信息方案,無需引入數(shù)據(jù)庫系統(tǒng),將靜態(tài)HTML頁面顯示速度快的特點和文件存儲節(jié)省成本和便于維護的特點相結合,提供一種便捷的信息和維護方式,尤其適用于中小型網(wǎng)站信息。
二、XML技術的特點
XML(extensibleMarkupLanguage)是W3C在1998年9月設計的一個SGML(StandardGeneralizedMarkupLanguage標準通用標記語言)的簡化版本。XML是一種簡單而有效的通用語言規(guī)范,屬于元標記語言。XML文檔是用純文本編寫的,可以用多種方法創(chuàng)建和編輯。XML文檔允許用戶根據(jù)自己的需要,靈活定義數(shù)據(jù)組織方式。采用XML技術進行數(shù)據(jù)存儲具有以下特點:
通用性:XML是開放的國際化標準,W3C正式批準的,具有標準的名域說明方法,支持文檔對象模型標準、可擴展類型語言標準、可擴展鏈接語言標準和XML指針語言標準。使用XML可以在不同的計算機系統(tǒng)間交換信息。
易用性:XML對SGML進行了精簡,它拋棄了SGML中不常用的部分,方便用戶編寫Web頁面同時也給設計人員實現(xiàn)XML瀏覽器降低了困難。
跨平臺性:由于XML本身具有良好的跨平臺性,只要數(shù)據(jù)存儲為XML格式,那么這些數(shù)據(jù)就可以被任何其他語言或系統(tǒng)識別。
高性價比的存儲方案:相比于普通的文件,XML文檔在數(shù)據(jù)定位和修改等操作方面具有明顯的優(yōu)勢,具有較好的速度和效率;XML文檔可以代替數(shù)據(jù)庫實現(xiàn)常用的數(shù)據(jù)操作,無需單獨安裝數(shù)據(jù)庫系統(tǒng)軟件,使得系統(tǒng)的整體成本得以降低。
目前,處理XML文檔的方式主要有SAX與DOM兩種。SAX(SimpleAPIforXML)是一種基于流的,以事件處理方式工作的接口。DOM(DocumentObjectModel)則是在對XML文檔進行分析后,在內存中建立起一個完整的樹結構,然后在此基礎上進行各種操作。簡單地比較來看,SAX對系統(tǒng)資源要求低,速度快,但對文檔的操作是只讀的;DOM的處理能力強大!但要求大量的系統(tǒng)資源,尤其是對于大的文檔。而后還出現(xiàn)了Xpath和XPointer用以完成XML的搜索和轉換;XSML和XSLT和SOAP用以完成XML的遠程對象訪問,XMLQueryLanguages的出現(xiàn)使XML查詢語言可用于任何XML文檔。
三、基于XML的信息方案
公司網(wǎng)站的信息不僅包括新聞,還包括通知,公告,招聘信息和各種動態(tài)信息,其整體流程為:系統(tǒng)管理員為信息者設置權限,信息者根據(jù)自己的用戶名和口令登錄到信息界面,進行信息的和管理,部分信息在前還需要系統(tǒng)管理員進行審批。本方案以新聞信息為例進行說明:
1.總體設計方案
根據(jù)Web軟件B/S結構的特點,方案中新聞數(shù)據(jù)的存儲采用XML文件格式,開發(fā)工具選擇ASP[根據(jù)實際需要,可以自由選擇其他語言工具(如JSP,PHP等)與XML文件自由組合]。
為了充分利用傳統(tǒng)信息中靜態(tài)HTML頁面前臺顯示速度快的優(yōu)點,在新聞數(shù)據(jù)寫入XML文檔的同時,由程序根據(jù)約定模板自動生成當前新聞的靜態(tài)HTML頁面,采用當前時間作為文件的名稱(如20080201091011.html,此命名方式在新浪網(wǎng)等門戶網(wǎng)站大量使用),同時為了避免XML文件過大造成解析過慢,新聞分為近期新聞和早起新聞,對于近期新聞采用XML文件和靜態(tài)HTML頁面雙重存儲格式,XML文件用于支持對新聞數(shù)據(jù)的修改,修改后重新生成靜態(tài)HTML頁面用于前臺顯示;早期新聞只保留靜態(tài)HTML頁面供瀏覽,XML文件中不進行數(shù)據(jù)保存,不提供修改操作。管理員可以通過管理界面將當前的近期新聞轉為過期新聞,轉換的同時將XML文件中對應的數(shù)據(jù)刪除。同時考慮到新聞中經(jīng)常出現(xiàn)的多媒體信息(如圖片,音頻和視頻數(shù)據(jù)),根據(jù)其數(shù)據(jù)量大,獨立引用的特點,只保存多媒體文件的名字,當新聞瀏覽時通過多線程的方式直接到指定目錄進行加載。新聞流程如下圖:
信息系統(tǒng)包括前臺新聞顯示部分和后臺新聞和維護部分。核心功能簡介如下:
(1)新聞管理。提供新聞,刪除,編輯,近期新聞轉為過期新聞等管理操作。
(2)權限管理。引入角色組的概念,它是權限控制的單位,每個角色組具有對網(wǎng)站部分資源的控制權限。
(3)用戶管理。提供用戶添加,刪除和修改等操作入口。每個用戶必須歸屬于某個角色組。
(4)模板管理。對新聞的靜態(tài)HTML模板進行添加,修改和刪除等操作。
(5)文件上傳。將新聞中可能需要鏈接的各種文件上傳到服務器指定目錄。
2.XML文檔設計
XML文檔主要用于保存新聞中的非多媒體信息,多媒體信息則保存目錄信息。每個新聞節(jié)點中包含了構成新聞的各個要素,內容正文部分按段落錄入,為了區(qū)分普通的文本內容和多媒體內容,每段還包括了段落的標識和段落的內容。下面是一個保存新聞內容的XML文檔部分內容示例:
<?xmlversion="1.0"encoding="gb2312"?>
<?xml:stylesheettype="text/xsl"?>
<document>
<news>
<title>新聞的標題</title>
<date>新聞錄入的時間</date>
<link>新聞對應HTML靜態(tài)頁面鏈接</link>
<class>新聞的類別</class>
<keyWords>新聞的關鍵字</keyWords>
<author>新聞的作者</author>
<segment>
<segmentTag>段落內容的標識</segmentTag>
<segmentContent>段落內容數(shù)據(jù)</segmentContent>
</segment>
</news>
</document>
3.關鍵技術的研究與實現(xiàn)
(1)新聞模板設計。典型的新聞內容中包含新聞的關鍵字,新聞標題,日期,單位,者,正文等要素,信息的關鍵在于正文數(shù)據(jù)已何種形式寫入到XML文件中。本方案中將新聞的具體內容分段進行處理,一則新聞的正文部分由若干段組成,每一段的內容可以是單一的文本,圖片或者其他允許的多媒體,也可以是多種文件按照一定順序和空間排列的組合形式。信息的初始狀態(tài)每段只有一欄,者可以根據(jù)實際需要對某一段落進行分欄,每一欄內放置單一的文件內容。從而使得新聞內容的組合方式更靈活,簡單,實用。(2)面向對象的編碼實現(xiàn)。方案中服務器端采用VBScript進行編碼,該腳本支持面向對象的編碼,為了充分發(fā)揮其面向對象的可重用性,靈活高效的特點,在對系統(tǒng)整體進行編碼進行研究和分析之后,引入了面向對象的知識,設計了用于操作XML文件的類。操作主要包括以節(jié)點為單位的獲取,修改,刪除,增加等操作。該類的主要描述如下:
ClassCls_News
‘屬性變量的定義
…………
PublicPropertyGetnewsId
''''獲取XML文件中節(jié)點具體屬性的值
EndProperty
…………
PublicFunctionGetInfoFromXml(objXmlDoc)
''''從Xml中讀取指定節(jié)點的數(shù)據(jù),并填充各個屬性
EndFunction
PublicFunctionAddToXml(objXmlDoc,xmlFile)
''''添加信息到XML文件中
EndFunction
PublicFunctionEditToXml(objXmlDoc,xmlFile)
''''編輯當前XML文件中信息
EndFunction
PublicFunctionDeleteFromXml(objXmlDoc,xmlFile)
''''從XML文件中刪除數(shù)據(jù)
EndFunction
…………
EndClass
四、總結
本文介紹的技術已經(jīng)在中小型的電子商務網(wǎng)站中有了初步的應用,高性價比的存儲方案獲得了單位的充分肯定。當然使用過程中我們也發(fā)現(xiàn)一些問題需要改進,這其中包括加快大數(shù)據(jù)量XML文檔的解析速度,探索XML文檔的檢索方式和增強信息模板的靈活性等幾個方面的內容,這些將是我們后續(xù)研究的主要工作??傊?,采用XML技術進行信息的自動化具有很高的實用意義,尤其是對于中小型電子商務和電子政務網(wǎng)站的信息,能夠提供高性價比的內容存儲和方案。
參考文獻:
[1]吳志剛等:基于Web的信息資源模型.計算機應用研究,2000,17(3)
[2]張海永等:精通ASP+XML+CSS網(wǎng)絡開發(fā)混合編程.電子工業(yè)出版社,2006
[3]魏英:Internet環(huán)境下自動新聞系統(tǒng).計算機應用,2004年第24卷
[4]楊友河等:XML技術在電子商務的數(shù)據(jù)中的應用研究.機械,2004年z1期
[5]萬靜等:鐵路貨運電子商務信息規(guī)范-tfbXML注冊中心模式研究.商場現(xiàn)代化,2007年18期
- 上一篇:男性正式禮服穿戴禮儀
- 下一篇:社會生活禮儀