- 相關推薦
基于本體的通用數據訪問方法
基于本體的通用數據訪問方法
摘 要 從數據使用者的角度,分析異構數據資源的特征和用法,提出了基于本體的通用數據訪問方法和軟件架構,研究了此架構所用到的關鍵技術。
基于本體的通用數據訪問系統的核心在于構建出合適的統一數據描述模型,以此模型為基礎,構建數據訪問引擎,并通過抽取配置工具建立了數據描述模型與數據實體之間的映射關系,最終通過通用數據訪問軟件實現異構數據的統一訪問和展現。
【關鍵詞】異構數據 本體 描述模型 映射 通用訪問
1 引言
隨著近年來網絡技術的快速發展,各領域之間數據共享的需求日益增強,在網絡基礎設施日益完善的前提下,如何對不同行業和格式的數據資源進行統一訪問和集成使用就成為了關鍵的問題。
國內外對于異構數據庫數據的集成近期提出了ETL(數據抽取、傳輸、加載)機制,在實現中采用XML(可擴展標記語言)實現通用的數據交換,利用全局邏輯視圖或者集成的綜合數據庫的方式實現對各類異構數據資源的集成。
本文通過定義數據本體,設計了一種通用的數據訪問方法,建立不同的數據資源與本體之間的映射,使得綜合系統直接訪問各個異構業務數據庫,從而提高數據的使用效率,降低數據冗余。
通用數據訪問面向的異構數據具有海量、多元、復雜、動態、移動、實時等特征,為了更好的解決異構數據資源的訪問、集成和展現,在設計與實現通用數據訪問系統時,必須提供用戶對異構數據源透明、一致和實時的訪問能力:
(1)透明性,是指屏蔽底層數據源的差異,從用戶的角度看來,得到的數據不是來自于若干個數據源,而是一個數據源;(2)一致性,是指消除數據源之間的存在的結構異構和語義異構;(3)實時性,是指訪問到的數據是最新的數據,并且對數據庫中實時變化的信息能夠及時地捕獲與展現。
2 總體思路及架構
基于本體的通用數據訪問方法面向圖形化的數據展現,快速的從異構數據資源中抽取出適用的對象,對其進行統一管理,并借助地理信息系統或表單顯示工具向用戶提供清晰直觀的數據展現。
其主要解決異構數據的統一使用問題,在避免數據格式轉換帶來大量工作的前提下,實現數據的動態加載,保證應用系統與底層數據資源的分離,同時具有良好的擴展性,在數據種類發生變化時,只需要通過工具界面配置,就能夠快速加載新增的數據資源。
基于本體的通用數據訪問方法采用分層的體系結構,下層軟件給上層軟件提供運行支撐或輸入,共分為四層,從底到頂分別是:本體定義及管理層、元數據映射層、數據訪問層和數據展現層。
2.1 本體定義及管理層
本體定義及管理層主要負責建立基于本體的統一數據描述模型,并制訂出一套對該數據描述模型的訪問接口規范,是整個方法實現的核心和基礎。
2.2 元數據映射層
元數據映射層主要實現數據的靈活配置,通過人工界面配置的手段在數據庫元數據與統一數據描述模型之間建立對應關系,并把映射關系保存為XML文件,供通用數據訪問軟件讀取。
2.3 數據訪問層
數據訪問層主要完成對數據庫中實際數據的讀取和輸出。
通用數據訪問軟件在實現時遵循本體定義及描述層制訂的規范,內部的數據組織關系來自于元數據庫映射層生成的映射關系XML文件。
2.4 數據展現層
數據展現層主要包括兩種展現手段:基于地理信息的圖形化顯示工具和表格形式的表單顯示工具。
數據展現層屬于業務應用范疇,主要需要考慮的是基于地理信息系統(GIS)的數據表現以及海量數據高性能顯示的問題,與通用數據訪問的實現沒有直接關系,因此在本文中不對這部分的實現進行討論。
3 關鍵技術及實現
3.1 統一數據描述模型
統一數據描述模型的內容包括圖層公共信息(本體)和特征屬性族,各類異構的數據在按照統一數據描述模型表述為本體和特征屬性族的過程中,消除其原有的異構性,形成統一的數據表述。
統一數據描述模型主要由圖層公共信息和一組特征屬性族組成。
統一數據描述模型確定種類繁多的數據信息之間存在的內在共同點,建立圖層公共信息的統一描述。
圖層公共信息:
其中標識屬性、空間位置屬性、時間屬性以及符號屬性,這幾個屬性的組合體現了數據對象在全維圖形上的基本價值。
在統一數據描述模型中除了建立統一的圖層公共信息描述以外,還借鑒可擴展標記語言的思想,建立了一個對象特征屬性族描述方法,用來存放每類數據對象的具體屬性項。
該屬性族由數據對象的類型確定,其可擴展的特性保證了每一類數據對象信息項的完整,同一類對象屬性族項的數量和構成保持一致。
特征屬性族定義:
3.2 數據圖層映射轉換
采用根據數據庫中字段的取值確定圖層對象的動態映射機制,并提供多種方法來規范映射,提供了語義映射機制,通過將數據庫字段與統一數據描述模型中的屬性建立字段映射機制;采用數據庫數據到圖層對象的語義映射,提供量綱映射機制,通過規范數據庫中數據到圖層對象的取值處理標準,提供多種量綱轉換機制,如經緯度的轉換機制和時間格式轉換機制等等;采用字段映射機制或條件映射機制來處理圖層顯示屬性。
如果顯示屬性采用字段映射機制進行配置處理,那么將使用配置字段的取值進行顯示處理;如果顯示屬性采用條件映射機制進行配置,那么在進行顯示處理時,將對這組字段的取值進行判斷,符合某組合的取值,則用該組合的設置值進行顯示,沒有符合的條件組合就是用默認值進行顯示。
4 結束語
本文的研究對象主要是針對數據庫形態的數據資源,而文中提出的方法對其他形態的數據資源也同樣適用,因此,后續的工作將以建立各種形態數據資源統一訪問的軟件系統為目標。
參考文獻
[1]繆嘉嘉,鄧蘇,劉青寶.E T L綜述計算機工程,2004(2).
[2]沈鐳.基于XML的異質多數據庫集成系統的設計與實現[J].河南大學學報(自然科學版),2007(9):530-532.
[3]吳姍姍,彭向陽.基于XML的通用數據庫訪問引擎的設計與實現[J].指揮信息系統與技術,2010(01).
【基于本體的通用數據訪問方法】相關文章:
基于角色訪問控制的OA系統的設計與實現10-26
基于Linux 的學習方法10-06
基于Excel的數據加密方案的論文范文10-07
基于學習目的的學習方法10-05
基于Web Service的物聯網數據平臺的設計與實現10-06
基于旅游管理的時空數據模型研究論文10-08
excel數據引用公式的使用方法10-26
基于運動捕獲數據的三維角色動畫設計10-26
基于.NET的管道SCADA維護數據管理系統的設計與實現10-26
基于編譯技術的協議解析方法10-26