《数据仓库与数据挖掘》第三章 数据仓库的设计(31P).ppt
《《数据仓库与数据挖掘》第三章 数据仓库的设计(31P).ppt》由会员分享,可在线阅读,更多相关《《数据仓库与数据挖掘》第三章 数据仓库的设计(31P).ppt(31页珍藏版)》请在三一文库上搜索。
1、1,第三章 数据仓库的设计,本章要点 数据仓库的设计步骤 高层设计 技术准备工作 中层设计 低层设计 数据仓库生成,2,数据仓库的数据组织:简单堆积,3,数据仓库的数据组织轮转综合,4,高细节:低粒度 低细节:高粒度 例:顾客一个月内通话细节 顾客一个月内通话综合,日期 月份 时间 通话总次数 通话人姓名 通话人姓名 通话人ID 通话人ID 接线员帮助 长途次数 电话接通状态 中断次数 通话时间 平均时长 长途 移动电话 特别折扣率,5,李三 2005年四月份 2005年月日下午 : 李三 54000345 54000345 接线员帮助 通话次数 2005年月日下午 :018:12 通话平均长
2、度分钟 长途 长话次数个 2005年月日下午 : 接线员帮助个 未接通电话个 2005年月日下午 :9: 2005年月日下午 : 未接通 2005年月日下午 : 号码错误,6,综合数据表-细节数据表,7,数据仓库的数据组织简单直接,2001年1月采购表 2001年2月采购表,8,数据仓库的数据组织连续文件,9,收集应用需求,分析应用需求,构建数据库,数据仓库建模,数据获取与集成,构建数据仓库,系统实施,应用编程,系统测试,DSS应用编程,系统测试,理解需求,DB,应用B,应用A,DB,DB,外部 数据,DW,SDLC方法,10,数据仓库设计的技术要求,对大量数据的组织和管理。 支持高性能的复杂
3、分析。 对提取出来的数据进行集成。 对高层决策的最终用户提供工具。,11,数据仓库的设计步骤,高层设计 技术准备工作 中层设计 低层设计 数据仓库生成,12,高层设计(概念模型设计),高层设计: 创建信息包图的过程:分析用户需求,收集信息将信息打包的过程。 分析用户需求(确定系统边界): 确定用户要做的决策类型 确定用户决策时需要的信息 确定原始信息 决定数据仓库所需要的信息的级别,采用多级信息包图,13,制造业E-R图,零件,供应商,订单,生产线,14,高层设计(概念模型设计),定义关键性能指标(确定主要的主题域): 主题域的公共键码 主题域间的联系 充分代表主题的属性 定义维度: 定义类别
4、:,15,数据仓库应用实例,航空公司的佣金计算系统 座位(是否还有剩余 座位是否可以优先使用 涉及哪些转换航班 是否能转换得上) 票价 佣金 零售个性化系统 市场(男/女,职业/其他,城市/乡村) 顾客(上次购买时间,上次所购商品,产品市场分类) 信用审核 偿还历史 私有财产 收入 开销,16,高层设计(概念模型设计),创建信息包图: 确定涉及的主题域,例如:时间、顾客、地理位置和产品。 设计可以跟踪的确定一个事件怎样被完成和运行的关键指标。 决定在给定的用户分析或查询中实际包含了多少数据。 确定用户如何按层次聚合数据和移动数据。 决定数据层次。 估计数据仓库的大小。 确定一个数据仓库里数据的
5、更新频率。 定义如何访问数据。 决定数据如何被传递给仓库的用户。,17,保险公司: 2-3年 银行信托: 2-5年 电话公司: 顾客使用情况: 30-60天 供货商/销售商活动: 2-3年 普通银行: 小额客户: 30天 销售商: 1 年 贷款: 2-5年 零售业: 1-14天,销售商 1 个月 航空公司:座位30-90天, 供应/销售1-2年 公用事业:顾客60-90天, 供应商1-5年,18,技术准备工作,技术评估 技术环境准备 确定软硬件的配备要求,19,中层设计(逻辑模型设计),中层设计:建立数据仓库的逻辑模型,对前期收集的信息的细化,将信息包图转换成星形图模型。 主要工作: 定义指标
6、实体。 定义维度实体。 定义详细类别实体。 设计成果: 适当的粒度划分 合理的数据分割策略 适当的表划分 定义适当的数据源,20,银行活动,帐号 业 存款 票据 日期 务 需要邮寄 金额 类 地点 型 提款 余额需要核实 类型 现金/支票/其他 出纳员 服 ATM ID号 务 请求超出限额 类 时间戳 型 出纳员 出纳员ID 自动核实 顺序号 现金库余额 ,21,低层设计(物理数据模型设计),低层设计阶段的任务:建立数据仓库的物理模型,确定数据仓库的存储结构、数据的存储位置和索引策略。 设计人员需要了解和考虑的问题: 所选用的数据库系统,特别是存储结构和存取方法; 数据环境、数据的使用频率、使
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库与数据挖掘 数据仓库与数据挖掘第三章 数据仓库的设计31P 数据仓库 数据 挖掘 第三 设计 31
链接地址:https://www.31doc.com/p-4917954.html