地理教师网之数字地球导论
当前位置: > 地理书库 > 数字地球导论 > 空间数据仓库

空间数据仓库

时间:2010-01-29 03:18 来源:地理教师网 作者:云中雪 责任编辑:地理教师
-------

1.概述

分布在不同地点、不同部门的分布式数据库与信息系统,由高速计算机有线(光缆)与无线(通信卫星)相连接,并组成 WebGIS,Object Web GIS和 ComGIS实现同构系统的远程互操作和互运算;通过OpenGIS的标准与规范,实现异构系统间的远程互操作和互运算,但对于数字地球的海量数据和频繁交互过程来说,它还需要通过中间组织的帮助来实现,包括:

空间数据仓库( Spatial data ware house);

空间数据站(Spatial data Station);

空间数据交换中心(Spatial data clearing house)。

空间数据仓库是指支持管理、决策过程的、面向主题的、集成的随时间而变化的、持久的和具有空间坐标的,即地球数据的集合。数据站场的结构与数据仓库相似,区别在于最终用户的侧重点。数据交换中心是指网上数据的集散地,是虚拟的数据仓库。空间数据库、面向空间对象的数据库与空间数据仓库的主要区别是:

(1)空间数据库:将大量的各种专题地图、遥感影像、设计和规划图及音频、声频等数据集成为关系型数据库进行存贮和管理。

(2)面向空间对象数据库:面向空间对象的数据库中的面向对象模型嵌套了更多的语义,允许定义复杂的空间数据,它把真实世界几乎所有的实体都表示为对象,数据对象的逻辑关系将它们的物证存贮聚集在一起减少了数据I/O访问,提高了运行速度,具有处理不确定性和模糊对象的即席查询能力,特别是在已有知识工程支持的情况下,可以进一步面向内容的图像查询;它还可以通过创建子类,实现复杂的完整性约束、继承性以及方便的数据库的扩充与维护。

(3)空间数据仓库:它将根据一定的主题内容集成来自不同数据中的数据,数据在结构上具有综合性;它可以截取从瞬态到区段,直到全体等不同时间尺度上的信息,可以从多个专业应用系统中寻找答案。空间数据仓库将数据的时间属性和空间属性紧密地结合起来,通过构建面向分析的多值空间数据模型,利用多维分析方法,从多个不同的角度进行分析比较,提取隐藏在数据中的信息,实现面向数据和面向模型的分析方法的统一,数据仓库是指随时间不断更新的数据库。

 

2.空间数据仓库

 

1)基本概况

空间数据仓库( Spatial data ware house)是数据仓库( Data ware house)的一种特殊形式,是WebGIS的核心技术之一。

数据仓库是90年代发展起来的一种数据存贮、管理和处理的技术。按W.H.Inmon的定义为:“数据仓库是支持管理、决策过程的、面向主题的、集成的、随时间而变化的、持久的数据集合”(Harjinder 1996)。还有人认为:它是一种体系结构;它是一种语义一致的数据库的集合,以满足不同的数据存取、文档报告的需求;它是一个把多个异质的原始数据融合在一起用以支持结构式即席查询、分析和决策支持的技术系统。从本质上讲,数据仓库是网络数据库的管理系统及其应用系统。

数据仓库的另一位创始人Aaron Zornes指出,要实现数据仓库需要做到以下几项工作:

(1)从不同数据源中,即从分布式的不同地点、不同部门的数据库,如何集成数据和Metadata;

(2)数据的质量的精确和简练;

(3)数据的概括和聚集;

(4)数据仓库和数据源(分布式的任何地点的数据库)的同步更新问题;

(5)Metadata的管理问题。

2)数据仓库与数据库的区别

Data ware house与 Data base的区别在于前者是由后者通过网络而链接组成的网络数据。数据仓库就是网络数据库,是具有在线事务处理功能的数据库网络系统。它具有如下的特点:

(1)它可以根据用户的需求组织和提供数据(面向主题),而一般数据库的用户只能根据数据库中现存的数据来选择所需数据。

(2)数据仓库必须管理大量的信息,需要在不同层次上提供概括和聚集机制来管理数据,包括当前的和历史的数据等,所以数据仓库的数据量远远大于一般数据库的数据量。

(3)由于数据仓库的数据分散在由网络连接起来的无数不同的存贮介质或数据库中,所以管理功能特别重要。

(4)数据仓库可将信息(数据)概括和聚集,并以易于人们理解的方式提供出来。概括和聚集对于理解大量信息是十分关键的。

(5)从许多存贮格式不同、版本不同、数据语义不同的许多数据库中取得的数据或信息集成,并使之关联,在操作这些数据或信息时要涉及到多个应用程序,所以数据仓库必须收集、组织和处理这些来自不同应用程序、不同数据库的信息。

3)数据仓库的数据的复杂性

由于数据仓库的数据有以下两个来源:

第一,来源于从不同地点、不同部门的分布式数据库中,通过Internet/Intranet获得的数据来源十分复杂,它们的类型、格式、精度、编码等存在很大的差别。

第二,虽然直接来源于信息源,但也由于信息源存在着差异,格式的差异(专题地图与遥感影像),多重数据定义等,使应用过程遇到不少困难。

为了实现地学空间数据共享的目的,使地学空间数据在Internet/Intranet上能为全球、全国充分应用,必须要有统一的标准和规范,或者能相互转换、相互翻译,有一个互联互通的,即相互构通的方法,尤其对数据仓库来说,特别重要。目前,国际标准化组织(ISO)、欧洲标准化委员会(CEN)、美国联邦地理数据委员会(FGDC)和开放地理信息系统协会(OGC)组织了大量的人力、物力在研究这个问题。

4)解决来源于分布式数据库的数据的复杂性需采用的办法

(1)建立数据源(分布式数据库中的所有的数据类型与数据格式)的Metadata,包括标识、质量、结构、空间参照系、实体属性等的描述。

(2)统一数据元素的名称,区分多义词和同义词,或在数据字典里标明数据元素的同义词。

(3)选择数据仓库所需要的数据子集。并非所有的数据都适合于数据仓库的查询分析要求,可以把有关信息放入信息代理的无数据内容中。

(4)Metada应能反映数据结构的变化全过程的历史档案,包括编码方案的变化、数据格式的变化等。

5)数据仓库与其Metadata的关系

数据仓库的Metadata是数据仓库的重要组成部分。数据的求精处理、重构工程及数据仓库的建设与Metadata是密不可分的;

Metadata的提取过程,包括了标准化过滤与匹配、净化、标明时间戳、确认数据质量等求精处理的方面;

Metadata的创建,包括对来自分布式数据库中的数据的集成与分割、概括与聚集、预测与推导、翻译与格式化、转换与再映像等重构工程;

Metadata的创建词汇表,包括建模、概括、聚集、调整与确认建立结构化查询等数据仓库的功能;

Metadata的数据浏览与导航等功能。

6)Metadata在数据仓库中的作用与意义

(1)对来自分布式数据库的数据,根据需要进行集成、概括、预算和衍生处理;

(2)对来自分布式数据库的数据进行翻译,转换提供规则服务;

(3)提供数据源(包括分布式数据库)和数据仓库之间的映射关系和规则;

(4)提供数据仓库本身的结构和描述,包括数据建模模式、数据逻辑和物理模块;

(5)浏览数据仓库的存取路径和规则;

(6)业务词汇表;

(7)已设计的和预定义的查询和报表清单。

7)空间数据仓库的多维数据模型

空间数据仓库利用多维分类机制组织大量的空间数据,建立立方或超立方数据模型。维的数目确定是由需求来定。地学查询一般分时间维、空间维、主题维(属性维)来组织数据。

“维”通常按层次来组织。分割到不同的等级(又称精度)或层次,例如:

时间维:可划分为年、月、旬、周、日、时、分、秒等层次;

空间维:可划分为洲、国家、地区、省(市)、县、乡(镇)、村、户等层次;

主题(属性)维:可以划分为:类、亚类、种、亚种。

8)数据仓库的主要功能

数据仓库的主要任务是将来源于分散在不同地点、不同单位的分布式数据库中的类型不同、结构不同、存贮格式不同、内容与格式丰富多彩的原始数据,进行标准化、过滤与匹配、净化,标明时间戳和确认数据质量的处理,即求精过程,然后再根据任务的需要,将来源于分布式数据库的不同性质、不同格式的数据再进行集成与分割、概括与聚集、预测与推导、翻译与格式化、转换与再映像处理,最后进行数据库仓库的建模、概括、聚集、调整与确认及建立结构化查询等功能建设。 9)数据仓库的结构

数据仓库由以下主要模块组成(表14.1):

(1)求精部分:负责标准化、净化、过滤与匹配,为所选数据源中提取数据的原始信息打上时间戳。在求精部分中,Metadata被映射为标准数据名称的定义。

(2)重构工程部分:负责检验是否满足用户分析的需求,包括对多个系统中不同类型的数据进行集成,用以创建新数据;按时间顺序分割数据,以便分析,对不同来源数据的翻译和格式化,对概括信息进行预测和推导,以便将其统一、持久地结合起来。

(3)对已存贮数据进行转移或再映像到原始数据中,以便对最新衍生、创建或转换的数据不断进行更新。

(4)数据仓库的存取和使用主要由以下模块组成:

存取与检索

分析与报表

·数据仓库直接存取

·报表工具

·数据站场存取

·分析工具、决策支持系统

·重建工程

·业务建模工具

·转换为多维结构

·数据挖掘工具

·创建局部存贮

·OLAP(在线事务处理)

Metadata抽取与创建

Metadata处理与报表

(5)空间数据仓库结构框架:

·数据源:分布式数据库系统:卫星遥感(EOS等),GIS与数据库系统,其它系统。

· Metadata数据源:遥感影像、专题地图、各种图形、符号数据、数字、文字、音响。

· Metadata互操作协议: Internet/Intranet。

·数据抽取求精:标准化、过滤与匹配、净化、标明时间戳、确认质量。

(6)元数据创建与浏览数据仓库:建模、概括、聚集、调整与确认、建立空间SQL。

(7)存取与检索:数据仓库直接存取、重构工程、调整与确认、建立空间索引。

(8)Metadata管理及查询与分析:报表工具、可持续发展决策系统(应用)、建模接口、数据挖掘及OLAP。

传输协议和互操作协议

WebGIS的数据仓库是靠Internet/ Intranet与WWW而运行的,它之所以成功,是因为它几个简单而被广泛接受的传输协议。WebGIS的数据仓库的运行需要不同层次的操作协议,以解决传输问题。开放的地理信息系统协会(OGC)正在解决这个问题。

10)数据站场和数据交换中心

数据站场的结构与数据仓库相似,区别在于最终用户的侧重点。数据交换中心是网上数据集散地,是虚拟的数据仓库。


  本文标题:空间数据仓库
  手机页面:http://m.dljs.net/dlsk/shudao/10333.html
  本文地址:http://www.dljs.net/dlsk/shudao/10333.html
    顶一下
    (0)
    0%
    踩一下
    (0)
    0%
    -------
    欢迎你对空间数据仓库发表评论
     发表评论请自觉遵守互联网相关的政策法规,本站地址:http://www.dljs.net
    评价:
    用户名: 验证码: 点击我更换图片
    (输入验证码,选匿名即可发表)
    关于空间数据仓库的最新评论 >>>查看详细评论页