利用分区执行高速数据加载和滚动窗口操作

OBE 主页 > 数据库 10g > 单个实例 > BIDW > 数据加载和滚动窗口操作

利用分区执行高速数据加载和滚动窗口操作

目的

在本教程中，您将了解如何使用 Oracle10g 进行高速数据加载以及如何利用 Oracle 分区进行滚动窗口操作。

所需时间

大约 2 个小时

主题

本教程包括下列主题：

	概述
	情景
	前提条件
	为销售历史模式实施模式更改
	使用外部表加载数据
	使用 SQL*Loader 与使用外部表进行简单加载和转换的比较
	利用表压缩节省磁盘空间、降低 TCO
	利用 Oracle 分区执行滚动窗口操作
	总结
	相关信息

查看屏幕截图

将光标置于此图标上可以加载和查看本教程的所有屏幕截图。（警告：因为此操作会同时加载所有屏幕截图，所以网速较慢时，响应时间可能会比较长。）

注意：此外，还可以在下面的步骤中将光标放在每个单独的图标上，从而仅加载和查看与该步骤相关的屏幕截图。

概述

大多数情况下，向数据仓库提供数据的 OLTP（源）系统都没有直接连接到提取新数据的数据仓库系统。通常，这些 OLTP 系统以外部文件的形式发送数据馈送。必须将这些数据加载到数据仓库中（最好是并行地），以便充分利用现有资源。

另外，由于示例公司 MyCompany 的业务需求和磁盘空间的限制，只有过去三年的数据与分析需求相关。这就意味着，在插入新数据时必须清除旧数据或者利用 Oracle 表压缩来释放磁盘空间。这种所谓滚动窗口操作的维护是通过 Oracle 分区完成的。

返回主题列表

情景

外部表

为了将外部文件加载到它们的数据仓库中，MyCompany 使用了 Oracle10g 外部表特性。该特性允许将外部数据（如平面文件）在数据库中表现为像一个普通的数据库表一样。由于可以使用 SQL 访问外部表，因此可以使用 SQL、PL/SQL 和 Java 的所有功能直接并行地查询外部文件。通常在提取、转换和加载 (ETL) 过程中使用外部表，从而将数据转换（通过 SQL）与数据加载组合到一个步骤中。外部表一个非常强大的特性，在 ETL 和其他处理平面文件的数据库环境中有很多可能的应用；它是使用 SQL*Loader 的替代方法。

并行执行

并行执行可以显著减少大型数据库上通常与决策支持系统 (DSS) 和数据仓库相关的数据密集型操作的响应时间。您还可以在某些类型的联机事务处理 (OLTP) 系统和混合系统上实施并行执行。简单来说，并行就是将任务分割，并且多个进程同时执行工作的每个部分一，而不是在一个进程中由一个查询执行所有工作。例如，四个进程处理一年中的四个不同季度，而不是一个进程独自处理所有四个季度。

利用 Oracle 分区执行滚动窗口操作

数据仓库内部管理系统中一个非常重要的任务就是保持数据与 OLTP（源）系统中的各种更改同步。另外，从分析角度而言，数据的寿命通常非常短，因此在加载新数据时必须将旧数据从目标系统中清除；这种操作通常称为滚动窗口操作。应该尽快得完成该操作，且不应涉及任何数据仓库系统并发联机访问。

返回主题列表

前提条件

开始学习本教程之前，您应已经：

完成了教程使用真正应用集群 (RAC) 和自动存储管理 (ASM) 在 Windows 上安装 Oracle 数据库 10g

或者

完成了教程在 Linux 上安装 Oracle 数据库 10g

下载 etl1.zip 并将其解压缩到工作目录中 (/home/oracle/wkdir)

下载 setup_dwh.zip 并将其解压缩到工作目录中 (/home/oracle/wkdir)

返回主题列表

为销售历史模式实施模式更改

有必要对现有销售历史模式对象进行一些更改以及为用户 SH 增加一些系统权限。实施这些更改的 SQL 文件为 modifySH_10g.sql。该文件在 setup_dwh.zip 文件中提供。要利用数据仓库教程的设置文件，执行下列步骤：

1.	打开一个终端窗口，执行以下命令： cd /home/oracle/wkdir sqlplus sh/sh @modifySH_10g

返回主题列表

使用外部表加载数据

在该教程的本节中，您将要使用外部表将数据加载到数据仓库中（外部表是在 Oracle9i Release 1 中引入的）。

为了演示如何创建和使用外部表，执行下列步骤：

1.	创建必要的目录对象。
2.	创建外部表。
3.	从外部表中选择。
4.	提供外部表的并行访问。
5.	复习 Oracle 的并行插入功能。
6.	执行并行插入。

返回主题列表

1. 要创建必要的目录对象，执行下列步骤：

在创建外部表之前，您需要在数据库中创建一个目录对象，该对象将指向数据文件所在文件系统上的目录。您还可以将日志、坏文件和废弃文件的位置与这些数据文件的位置分隔开。要创建该目录，执行下列步骤：

在登录到 SH 模式的 SQL*Plus 会话中，运行 create_directory.sql，或将下列 SQL 语句复制到 SQL*Plus 会话中：

@create_directory.sql

DROP DIRECTORY data_dir;
DROP DIRECTORY log_dir;
CREATE DIRECTORY data_dir AS '/home/oracle/wkdir';
CREATE DIRECTORY log_dir AS '/tmp';

这些脚本是针对 Linux 系统创建的，并且假设上机操作讨论会已经解压缩到了驱动器 /home/oracle/wkdir 中。
请注意，由于安全方面的原因，该数据库不支持符号链接作为 DIRECTORY 对象。

1.	用于在数据库中表示表的元数据信息
2.	用于从外部文件提取数据的 HOW 访问参数定义

1.	创建一个临时表。
2.	使用 SQL*Loader 将数据加载到该临时表中。
3.	将该临时表加载到目标数据库中。
4.	删除该临时表。

1.	滚动窗口操作，第 1 部分：准备一个包含新数据的独立表
2.	滚动窗口操作，第 2 部分：向事实表添加新数据
3.	滚动窗口操作，第 3 部分：从事实表删除旧数据
4.	Oracle 数据库 10g 为本地索引维护提供的性能增强：联机本地索引维护将最近的季度分区分割为月分区，这是 Oracle 数据库 10g 的一个新功能
5.	使用 Oracle 的全局索引维护：使用 Oracle9i 为全局索引维护提供的性能增强。

1.1	修改该外部表以使用 DBMS_STATS 处理第一季度销售数据。
1.2	为这些新的第一季度销售数据创建该表。
1.3	加载该表。
1.4	为该表创建位图索引。
1.5	为该表创建约束。

2.1	如果尚不存在任何分区，则创建一个新的分区。
2.2	交换该分区。这只是一个数据字典操作，不会触及任何数据。
2.3	从分区进行选择以保证成功。
2.4	分割近期的分区以确保（业务）数据完整性。

3.1	创建空的独立表。
3.2	为该表创建位图索引。
3.3	为该表创建约束。
3.4	显示交换前分区中的数据。
3.5	将这个新的空表与现有的 Q1-1998 分区进行交换。
3.6	显示交换后分区中的数据。

4.1	使用默认放置规则分割近期的分区。
4.2	使用为本地索引维护扩展的 SQL 语法分割分区。
4.3	清理。

5.1	准备进行全局索引维护。
5.2	构建全局索引。
5.3	交换带有全局索引维护的分区，并体验它对全局索引的影响。
5.4	交换不带全局索引维护的分区，并体验它对全局索引的影响。
5.5	删除全局索引，并交换回来（清理）。

	使用外部表加载数据
	比较了 SQL*Loader 与外部表的使用
	执行表压缩来节省磁盘空间
	利用 Oracle 分区执行滚动窗口操作

	要了解关于 Oracle 数据库 10g 的更多信息，请参考 OTN 网站上的其他 OBE。
	要了解其他商务智能产品的详细信息，请参阅位于此处的 BI OBE。
	有关本 OBE 教程的问题，请在 OBE 论坛上提问。

OBE 主页 > 数据库 10g > 单个实例 > BIDW > 数据加载和滚动窗口操作