数据仓库构建实施方法及步骤(二)

2.技术准备工作
这一阶段的工作包括:
• 技术评估
• 技术环境准备

这一阶段的成果是:
• 技术评估报告
• 软硬件配置方案
• 系统(软、硬件)总体设计方案

管理数据仓库的技术要求与管理操作型环境中的数据与处理的技术要求区别很大,两者所考虑的方面也不同。我们之所以在一般情况下总是将分析型数据与操作型数据分离开来,将分析型数据单独集中存放,也就是用数据仓库来存放,技术要求上的差异是一个重要原因。

2.1技术评估
进行技术评估,就是确定数据仓库的各项性能指标。一般情况下,需要在这一步里确定的性能指标包括:

• 管理大数据量数据的能力
• 进行灵活数据存取的能力
• 根据数据模型重组数据的能力
• 透明的数据发送和接收能力
• 周期性成批装载数据的能力
• 可设定完成时间的作业管理能力

2 .2技术环境准备
一旦数据仓库的体系化结构的模型大体建好后,下一步的工作就是确定我们应该怎样来装配这个体系化结构模型,主要是确定对软硬件配置的要求;我们主要考虑相关的问题:

• 预期在数据仓库上分析处理的数据量有多大?
• 如何减少或减轻竞争性存取程序的冲突?
• 数据仓库的数据量有多大?
• 进出数据仓库的数据通信量有多大?等等。

根据这些考虑,我们就可以确定各项软硬件的配备要求,并且在这一步工作结束时各项技术准备工作应已就绪,可以装载数据了。这些配备有:

• 直接存取设备(DASD)
• 网络
• 管理直接存取设备(DASD)的操作系统
• 进出数据仓库的界面(主要是数据查询和分析工具)

管理数据仓库的软件,目前即选用数据库管理系统及有关的选件,购买的DBMS产品不能满足管理数据仓库需要的,还应考虑自己或软件集成商开发有关模块等等。

3. 逻辑模型设计
在这一步里进行的工作主要有:

• 分析主题域,确定当前要装载的主题
• 确定粒度层次划分
• 确定数据分割策略
• 关系模式定义
• 记录系统定义

逻辑模型设计的成果是,对每个当前要装载的主题的逻辑实现进行定义,并将相关内容记录在数据仓库的元数据中,包括:

• 适当的粒度划分
• 合理的数据分割策略
• 适当的表划分
• 定义合适的数据来源等

3.1 分析主题域
在概念模型设计中,我们确定了几个基本的主题域,但是,数据仓库的设计方法是 一个逐步求精的过程,在进行设计时,一般是一次一个主题或一次若干个主题地逐步完成的。所以,我们必须对概念模型设计步骤中确定的几个基本主题域进行分析,并选择首先要实施的主题域。选择第一个主题域所要考虑的是它要足够大,以便使得该主题域能建设成为一个可应用的系统;它还要足够小,以便于开发和较快地实施。如果所选择的主题域很大并且很复杂,我们甚至可以针对它的一个有意义的子集来进行开发。在每一次的反馈过程中,都要进行主题域的分析。

3.2 粒度层次划分
数据仓库逻辑设计中要解决的一个重要问题是决定数据仓库的粒度划分层次,粒度层次划分适当与否直接影响到数据仓库中的数据量和所适合的查询类型。确定数据仓库的粒度划分,通过估算数据行数和所需的DASD数,来确定是采用单一粒度还是多重粒度,以及粒度划分的层次。

3.3 确定数据分割策略
在这一步里,要选择适当的数据分割的标准,一般要考虑以下几方面因素:数据量(而非记录行数)、数据分析处理的实际情况、简单易行以及粒度划分策略等。数据量的大小是决定是否进行数据分割和如何分割的主要因素;数据分析处理的要求是选择数据分割标准的一个主要依据,因为数据分割是跟数据分析处理的对象紧密联系的;我们还要考虑到所选择的数据分割标准应是自然的、易于实施的:同时也要考虑数据分割的标准与粒度划分层次是适应的。

3.4 关系模式定义
数据仓库的每个主题都是由多个表来实现的,这些表之间依靠主题的公共码键联系在一起,形成一个完整的主题。在概念模型设计时,我们就确定了数据仓库的基本主题,并对每个主题的公共码键、基本内容等做了描述在这一步里,我们将要对选定的当前实施的主题进行模式划分,形成多个表,并确定各个表的关系模式。

<<待续>>

Target Coupons

  

No Comments

Be the first to comment on this entry.

Leave a comment

Name(required)
Mail (will not be published)(required)
Website

Fields in bold are required. Email addresses are never published or distributed.

Some HTML code is allowed:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>
URLs must be fully qualified (eg: http://www.dbifan.com),and all tags must be properly closed.

Line breaks and paragraphs are automatically converted.

Please keep comments relevant. Off-topic, offensive or inappropriate comments may be edited or removed.

    搜索本站

    站点日历

    3月 2006
    « 2   4 »
     12345
    6789101112
    13141516171819
    20212223242526
    2728293031  

    订阅本站

    文章分类

    最新日志

    热点文章

    日志存档

    常用标签