选择题整理
来源:
商务智能往年/商务智能2015试卷A、商务智能往年/商务智能2015试卷B。
说明:原目录中的选择题-非标答.txt作为“往年给的答案”。我根据题干和课程知识点重新判断;如有不同,会在答案处同时标明。
[TOC]
2015 试卷 A
A-1 商务智能
题干:
关于商务智能,下列论述中正确的有:
题目:
A. 商务智能试图以信息化技术自动完成数据到信息、信息到知识的提取过程
B. 从信息技术方面来看,商务智能涵盖了数据仓库、多维建模、ETL、OLAP、仪表盘、报表查询、数据统计、数据挖掘等多种相关技术
C. 从商业应用方面来看,商务智能不仅支持最新的 IT 技术,同时也应该提供打包的商务解决方案
D. 从层次结构方面来看,可以将商务智能体系结构划分为:数据源层、数据获取层、数据存储和管理层及信息访问/展现层
E. 鉴于商务智能的重要作用,企业在进行信息化时,应以企业数据模型为蓝本,同步事务处理系统和分析处理系统
答案:
- 往年给的答案:BCD
- 我认为的答案:BCD
解析:
- A 错:BI 是利用信息技术支持数据到信息、知识和决策的过程,但“自动完成”说法过强,容易把商务智能等同于全自动知识提取
- B 对:从技术角度看,BI 涵盖数据仓库、ETL、OLAP、报表、仪表盘、数据挖掘等
- C 对:从商业应用角度看,BI 不只是技术集合,也包括面向业务的打包解决方案
- D 对:BI 体系结构可按数据源、数据获取、数据存储管理、信息访问/展现等层次理解
- E 错:事务处理系统和分析处理系统应分离,不应简单同步建设或混在同一环境中
A-2 多维建模
题干:
在进行多维建模时,下列论述中正确的有:
题目:
A. 由于规范化引入了查询时的额外开销,在维度表规模不大的前提下,一般不考虑采用雪花模型。然而,在应对大型快变维度时,仍然可以采用雪花模型/微型维度的方式节约存储开销
B. 非事实型事实表在多个维度间建立连接关系。但是由于没有独立的度量值,非事实型事实表无法独立使用,必须依附于其他事实表参与分析应用
C. 在采用累积快照进行多维建模时,事实表中记录了单个生命周期中多个关键环节所产生的信息,并使用多个日期类型的维表对这些关键环节进行标记
D. 为方便与操作型数据环境的对接,简化 ETL 的处理过程,用以连接维度表和事实表的关键字可以直接来源于操作型数据环境的关键字
E. 退化维度一般用以对事实表进行分组,并偶尔用以连接操作型数据环境
答案:
- 往年给的答案:ABCE
- 我认为的答案:ABCE
解析:
- A 对:星型模型通常更适合 OLAP 查询;雪花模型/微型维度可在维度大、层次复杂或快变属性多时节约空间
- B 对:非事实型事实表没有度量值,主要表达维度组合或事件发生关系,通常依附分析场景使用
- C 对:累积快照事实表跟踪一个生命周期,常有多个日期外键表示下单、付款、发货、收货等关键节点
- D 错:数据仓库通常使用代理键,不应直接依赖操作型系统主键,以保证性能、隔离和历史一致性
- E 对:退化维度如订单号、发票号、POS 交易号直接存放在事实表中,可用于分组和追溯操作型业务
A-3 数据仓库
题干:
关于数据仓库,下列论述中正确的有:
题目:
A. 数据仓库是数据库技术进一步发展的必然阶段。由于数据仓库数据容量大、数据模型先进且允许存在冗余,数据仓库正日益替代数据库,成为主流的数据存储技术
B. 原子层拥有数据仓库最低粒度的数据,因此,在数据通过 ETL 进入原子层时,应与数据源保持相同粒度
C. 由于数据仓库的“不可更新”特性,数据仓库中的数据实际上是“滞后”的,所以数据仓库必须定期/不定期采用刷新方式,将数据库等数据源中最新的数据变化反映到数据仓库中来
D. 数据仓库是一种反映主题的全局性数据组织,在执行周期性分析应用或局部分析应用时,往往效率不高。在这种情况下,可以按部门或个人分别建立反映各个子主题的局部性数据组织,称作数据集市
E. 数据仓库内部以“快照”的数据结构为中心来组织。快照通常包括关键字、时间、非关键字的主要数据和二级数据四个部分,其中非关键字的主要数据是数据仓库用以存放信息的主要部分
答案:
- 往年给的答案:CDE
- 我认为的答案:CDE
解析:
- A 错:数据仓库服务分析型处理,不会替代传统数据库/事务处理数据库
- B 错:原子层是数据仓库较低粒度数据层,但不要求与源系统完全相同粒度;ETL 可能清洗、集成、转换和重构粒度
- C 对:数据仓库不实时频繁更新,需要通过刷新反映源系统变化
- D 对:企业级数据仓库较大,数据集市用于满足部门、个人或子主题的局部分析需要
- E 对:该说法对应课件中数据仓库快照式数据组织的描述
A-4 OLAP
题干:
关于 OLAP,下列论述中正确的有:
题目:
A. 一般来说,ROLAP 查询效率优于 MOLAP,但装载性能劣于 MOLAP
B. 由于采用了多维数据库(MDDB),MOLAP 可以比 ROLAP 支持更多的维度
C. 在 ROLAP 中,需要采用多维综合引擎,在多维查询和结果及 SQL 查询和结果之间进行转化
D. 在 OLAP 系统中,可以融合 MOLAP 和 ROLAP 两种技术。采用关系型数据库存储细节数据,使用多维数据库来存放高层次数据或关系型数据库的查询结果
E. 在需要对多维模型进行演化时,ROLAP 相对于 MOLAP 更加灵活便利
答案:
- 往年给的答案:CDE
- 我认为的答案:CDE
解析:
- A 错:通常 MOLAP 由于预计算和多维数组结构,查询/汇总速度更快;ROLAP 更依赖关系数据库查询优化
- B 错:MOLAP 受多维数组和预计算限制,动态扩展维度通常不如 ROLAP 灵活
- C 对:ROLAP 把用户的多维查询转换为 SQL 查询,再把关系查询结果转换为多维结果
- D 对:这是 HOLAP 思路,用多维库保存汇总层,用关系库保存细节层
- E 对:ROLAP 基于关系模型,结构演化、维度扩展通常比 MOLAP 灵活
A-5 数据挖掘
题干:
关于数据挖掘,下列论述中正确的有:
题目:
A. 数据挖掘属于对数据的归纳
B. 对数据挖掘结果的评价分为主观评价和客观评价。一般来说,最常见的客观评价指标是“支持度(兴趣度)”/“置信度”
C. 与分类方法不同,聚类方法不需要给定训练数据集和测试数据集,而是使用数据之间的相似程度/相异程度进行类别划分。因此,聚类方法是一种无指导的学习
D. 采用相同的数据挖掘过程、数据挖掘方法、数据挖掘算法及相同的阈值和参数,对相同数据集进行多次数据挖掘,所得的数据挖掘结果也应该是相同的
E. 将 B 是 A 的子女记做 A→B,如存在 N1→N2,N2→N3,…,Nk-1→Nk,则称 N1 是 Nk 的祖先。如果数据库/数据仓库中存放着所有市民之间的子女关系,那么通过数据挖掘能够获取所有市民之间的祖先关系
答案:
- 往年给的答案:ABC
- 我认为的答案:ABC
解析:
- A 对:数据资源利用方式中,查询是服务,OLAP/统计偏分析,数据挖掘偏归纳发现
- B 对:关联规则等挖掘结果常用支持度、置信度等客观指标,也可结合主观兴趣度评价
- C 对:聚类没有预先类别标签,属于无监督学习
- D 错:数据挖掘过程可能受算法初始化、数据预处理、阈值设置和随机过程影响,不能笼统保证多次结果完全相同
- E 错:祖先关系可由子女关系通过确定性递推/演绎得到,不属于典型数据挖掘发现未知模式
2015 试卷 B
B-1 商务智能目标
题干:
商务智能的目标包括:
题目:
A. 为商务活动提供自动化解决方案
B. 实现商务领域的人工智能
C. 提供商务领域的专家系统
D. 进行决策支持
E. 改善信息访问方式
答案:
- 往年给的答案:DE
- 我认为的答案:DE
解析:
- A 错:BI 不是单纯为商务活动提供自动化流程解决方案
- B 错:BI 不等于人工智能
- C 错:BI 不等于专家系统
- D 对:BI 的核心目标之一是支持决策
- E 对:BI 的另一核心目标是改善信息访问
B-2 多维建模
题干:
在进行多维建模时,下列论述中正确的有:
题目:
A. 依据多级体系划分属性,可以将维度表规范化,以雪花模型替代星型模型,从而节约存储空间。然而,由于规范化引入了查询时的额外开销,在维度表规模不大的前提下,一般不考虑采用雪花模型
B. 非事实型事实表在多个维度间建立连接关系。由于没有独立的度量值,非事实型事实表无法独立使用,必须依附于其他事实表参与分析应用
C. 一般来说,对事实表进行建模时,事务模型粒度最小,周期快照粒度最大,而累积快照粒度介于两者之间
D. 为保持历史一致性,维度表的元组属性发生变化时,需要用额外的行或者列来记录历史信息。因此,在对大型快变维度进行处理时,必须采用微型维度、预设波段等方法,将快变维度转化为渐变维度
E. 为方便与操作型数据环境的对接,并简化 ETL 的处理过程,用以连接维度表和事实表的关键字应当直接来源于操作型数据环境
答案:
- 往年给的答案:AB
- 我认为的答案:AB
解析:
- A 对:雪花模型通过规范化维表节省空间,但连接增加,维表不大时通常更偏向星型模型
- B 对:非事实型事实表没有度量值,主要表达维度之间的事件或关系
- C 错:事务、周期快照、累积快照是不同事实表类型,不能简单按“粒度最小/最大/居中”这样排序
- D 错:微型维度、预设波段是快变属性的处理方法,但“必须”说法过绝对
- E 错:数据仓库一般使用代理键,避免直接依赖操作型系统关键字
B-3 OLAP 类型与操作
题干:
根据使用的数据结构不同,OLAP 可以分为 MOLAP 和 ROLAP 两种主要类型,下列论述中正确的有:
题目:
A. 一般来说,MOLAP 查询效率优于 ROLAP,但装载性能 ROLAP 优于 MOLAP
B. 由于采用了多维数据库(MDDB),MOLAP 可以比 ROLAP 支持更多的维度
C. 在需要对多维模型的维度数量等进行调整的情况下,ROLAP 相对于 MOLAP 更加灵活便利
D. 在 ROLAP 技术中,需要采用多维综合引擎,在多维查询和结果及 SQL 查询和结果之间进行转化
E. OLAP 的基本操作包括:切片/切块、旋转、上钻(Roll up)/下钻(Drill down)。其他操作包括跨钻(Drill across)/钻透(Drill through)。人们可以通过这些操作浏览数据立方体,从而获得对分析对象的全面理解
答案:
- 往年给的答案:ACDE
- 我认为的答案:ACDE
解析:
- A 对:MOLAP 通常查询快,但预计算和装载成本高;ROLAP 装载和扩展相对灵活
- B 错:MOLAP 受多维数组和预计算限制,不一定比 ROLAP 支持更多维度
- C 对:ROLAP 基于关系数据库,模型演化和维度调整更灵活
- D 对:ROLAP 需要在多维查询和 SQL 查询之间转换
- E 对:切片、切块、旋转、上钻、下钻、跨钻、钻透是 OLAP 常见操作
B-4 数据仓库
题干:
关于数据仓库,下列论述中正确的有:
题目:
A. 数据仓库是数据库技术进一步发展的必然阶段。由于数据仓库数据容量大、数据模型先进且允许存在冗余,数据仓库正日益替代数据库,成为主流的数据存储技术
B. 原子层拥有数据仓库最低粒度的数据,因此,在数据通过 ETL 进入原子层时,应与数据源保持相同粒度
C. 由于数据仓库的“不可更新”特性,数据仓库中的数据实际上是“滞后”的。这类问题可以通过使用操作数据存储(ODS)加以改善
D. 鉴于大多数的数据仓库系统仍然使用关系型数据库加以实现,在线系统需要访问数据仓库中的信息时,依然可以比照数据库的访问方式,采用 SQL 等进行直接查询
E. 即使使用关系型数据库作为数据仓库的后台存储技术,由于目标、性能和使用对象等的不同,数据仓库仍然拥有自身所特有的数据建模思想、索引及优化方法
答案:
- 往年给的答案:CE(D 不确定)
- 我认为的答案:CE
解析:
- A 错:数据仓库不是替代数据库,而是为分析型处理建立的独立数据环境
- B 错:原子层粒度较低,但不要求与源系统完全同粒度
- C 对:ODS 更接近当前业务状态,可改善数据仓库数据滞后的问题
- D 错:虽然数据仓库可用关系数据库实现,但在线事务系统直接 SQL 访问数据仓库通常不合适,会受响应时间、数据量、格式和系统耦合影响
- E 对:数据仓库面向分析,有自己的建模、索引、分区、冗余和物理优化方法
B-5 数据挖掘
题干:
关于数据挖掘,下列论述中正确的有:
题目:
A. 数据挖掘属于对数据的演绎
B. 对数据挖掘的结果的评价分为主观评价和客观评价。一般来说,最常见的客观评价指标是“支持度(兴趣度)”/“置信度”
C. 与分类方法不同,聚类方法不需要给定训练数据集和测试数据集,而是使用数据之间的相似程度/相异程度进行类别划分。因此,聚类方法是一种无指导的学习
D. 特征规则挖掘可以被用来作为其他数据挖掘方法的前继步骤,通过在“基本关系表”和“概括关系表”上应用其他数据挖掘方法,可以得到不同概念层次上的数据挖掘结果
E. 采用相同的数据挖掘过程、数据挖掘方法、数据挖掘算法及相同的阈值和参数,对相同数据集进行多次数据挖掘,所得的数据挖掘结果也应该是相同的
答案:
- 往年给的答案:BCD
- 我认为的答案:BCD
解析:
- A 错:数据挖掘属于归纳发现,不是演绎推理
- B 对:支持度、置信度是关联规则等挖掘结果的常见客观评价指标
- C 对:聚类是无监督学习,不需要预先给定类别标签
- D 对:特征规则/概念提升可作为数据概括和后续挖掘的前置步骤
- E 错:数据挖掘结果受算法、初始化、预处理、阈值和随机因素影响,不能笼统保证多次完全相同