Business Intelligence: A Managerial Perspective On ...

27
1 Business Intelligence: A Managerial Perspective On Analytics, 3E 商务智能、数据分析和决策支持概述 学习目标 理解目前动荡的商业环境,描述组织如何在这样的环境(解决问题和探索商机)中生 存并取得成就。 理解管理决策对计算机支持的需要。 描述商务智能( BI )的方法论和相关概念。 理解数据分析的不同类型。 商业环境不断发生变化并且变得越来越复杂。组织、个人、公众都面临着巨大的压力, 迫使他们对变化的环境做出快速反应,并在经营方式上进行创新。这就需要组织反应灵活, 并且频繁、快速地在战略层、战术层、操作层做决策。此类决策的制定需要大量相关数据、 信息和知识。数据必须实时快速地被处理,这通常需要计算机支持。 本书讲述如何将业务分析作为一种计算机支持应用到管理决策中,重点介绍决策支持的 理论和概念基础,同时讨论可用的商务工具和技术。本章详细介绍了这些内容,也对本书的 内容进行了概述。 1.1 开篇小插曲:Magpie Sensing 公司使用分析技术高效而安全地管理疫苗供应链 在医疗保健领域,冷链定义为包含疫苗与药物运输、存储的控温供应链。冷链由 3 个主 要部分构成——运输与存储设备、训练有素的人员以及有效的管理程序。冷链中大部分的疫 苗存储在华氏 35 46 度的环境中(摄氏 2 8 度)。对于医疗保健产品制造商来说,维持 冷链的完整性极其重要。 尤其对于疫苗来说,不恰当的存储和处理方法会降低疫苗的存活力,这是浪费金钱与时 间的事情。疫苗从生产到使用必须正确存储。任何极端的受热或受冷温度条件都会降低疫苗 的效用。这样的疫苗如果投入使用,不能发挥有效作用,甚至可能产生相反效果。 冷链产业需要在整个医疗保健供应链中实时地保持存储单元的温度(收集资源、生产、 配送、分配的整个流程)。有关存储单元标记地点的实时环境数据有助于监控这些易坏产品 的冷链温度。整个流程的监管将直接影响产品的效用。 疾病控制与预防中心(Centers for Disease Control and Prevention,CDC )对美国 45 家卫 生医疗保健产品供应商的疫苗冷链处理模式进行了调查研究,研究报告显示 3/4 的供应商有 严重的冷链处理问题。 通向可能解决方案的道路 Magpie Sensing—— 一个由 Ebers Smith Douglas 联合企业发起的项目,为医疗保健产 业提供了一套冷链监控与分析技术。这是一个在运输过程中提供冷链产品实时的、地点相关 数据的车载无线温湿度调控器。Magpie Sensing 的解决方案依赖丰富的分析算法,利用控制 1 3

Transcript of Business Intelligence: A Managerial Perspective On ...

第 1 章Business Intelligence: A Managerial Perspective On Analytics, 3E

商务智能、数据分析和决策支持概述

学习目标

理解目前动荡的商业环境,描述组织如何在这样的环境(解决问题和探索商机)中生 ●存并取得成就。

理解管理决策对计算机支持的需要。 ●描述商务智能(BI)的方法论和相关概念。 ●理解数据分析的不同类型。 ●

商业环境不断发生变化并且变得越来越复杂。组织、个人、公众都面临着巨大的压力,

迫使他们对变化的环境做出快速反应,并在经营方式上进行创新。这就需要组织反应灵活,

并且频繁、快速地在战略层、战术层、操作层做决策。此类决策的制定需要大量相关数据、

信息和知识。数据必须实时快速地被处理,这通常需要计算机支持。

本书讲述如何将业务分析作为一种计算机支持应用到管理决策中,重点介绍决策支持的

理论和概念基础,同时讨论可用的商务工具和技术。本章详细介绍了这些内容,也对本书的

内容进行了概述。

1.1 开篇小插曲:Magpie Sensing公司使用分析技术高效而安全地管理疫苗供应链

在医疗保健领域,冷链定义为包含疫苗与药物运输、存储的控温供应链。冷链由 3 个主

要部分构成——运输与存储设备、训练有素的人员以及有效的管理程序。冷链中大部分的疫

苗存储在华氏 35 ~ 46 度的环境中(摄氏 2 ~ 8 度)。对于医疗保健产品制造商来说,维持

冷链的完整性极其重要。

尤其对于疫苗来说,不恰当的存储和处理方法会降低疫苗的存活力,这是浪费金钱与时

间的事情。疫苗从生产到使用必须正确存储。任何极端的受热或受冷温度条件都会降低疫苗

的效用。这样的疫苗如果投入使用,不能发挥有效作用,甚至可能产生相反效果。

冷链产业需要在整个医疗保健供应链中实时地保持存储单元的温度(收集资源、生产、

配送、分配的整个流程)。有关存储单元标记地点的实时环境数据有助于监控这些易坏产品

的冷链温度。整个流程的监管将直接影响产品的效用。

疾病控制与预防中心(Centers for Disease Control and Prevention,CDC)对美国 45 家卫

生医疗保健产品供应商的疫苗冷链处理模式进行了调查研究,研究报告显示 3/4 的供应商有

严重的冷链处理问题。

通向可能解决方案的道路

Magpie Sensing—— 一个由 Ebers Smith 和 Douglas 联合企业发起的项目,为医疗保健产

业提供了一套冷链监控与分析技术。这是一个在运输过程中提供冷链产品实时的、地点相关

数据的车载无线温湿度调控器。Magpie Sensing 的解决方案依赖丰富的分析算法,利用控制

1~3

2 第 1 章

装置收集的数据,完善冷链各环节的效率,并在问题发生前进行有效预测。Magpie Sensing采用了 3 种分析技术——描述性(descriptive)、预测性 (predictive) 以及规范性(prescriptive)分析,将控制装置收集的原始数据转化为可执行的推荐和警告。

冷链存储系统的属性(包括存储系统恒温器的设定值、存储系统的温度范围、压缩机的

工作周期等)被实时调控并上报。这些信息帮助工作人员确认是否合理配置了存储单元存储

某一产品。所有这些存储单元的温度数据都在仪表盘中以图表形式呈现。

根据从控制装置提取的信息,Magpie 的预测性分析算法可以根据不同的产品决定存储

单元恒温器的设定值,并在系统设置错误时及时提醒用户。Magpie 的系统也会根据存储单

元的平均温度发送可能的温度设置错误警告,随后压缩机开始运行,及时将温度降到冰点以

下。Magpie 的预测性分析还会根据温度的变化趋势通过网页接口、短信或语音信息汇报可

能的人为错误,例如忘记关门或密封不好。距离存储单元达到不安全温度的时间也可以估计

出来,这就使得用户可以及时考虑后备方案,例如加干冰等方法来防止产品变质。

除了预测性分析以外,Magpie Sensing 的分析系统还可以提供规范性的推荐,以改善冷

链存储流程和商业决策。规范性分析帮助用户拨入最优的温度设定,有助于达到节能和防止

变质的平衡,这也在产品变质前提供了一个应对的缓冲期。规范性分析同时也收集冷链存储

单元的元数据,包括一天中的哪些时间使用最频繁以及系统的门在哪些时段打开。这有助于

形成附加的设计训练计划和指导性政策来确保系统的合理维持,防止过度利用。

进一步,规范性分析可以通过持续分析当前存储单元的性能,指导设备购买决策。根据

存储系统的效率,就可以基于产品的敏感度将其分配到不同的存储单元中。

使用 Magpie Sensing 的冷链分析技术可以通过确保整个供应链中产品的安全性,减少额

外的生产时间和花费,有效的药物就可以送到患者手中。通过自动收集汇报冷链产品的数据

也可以符合州政府与联邦政府的相关规定。

开篇小插曲的问题

1. Magpie Sensing 的描述性分析技术提供了哪些信息?

2. Magpie Sensing 的预测性分析技术提供了哪种支持?

3. 规范性分析如何协助商务决策?

4. 将可执行的信息实时汇报给用户的可能方式有哪些?

5. 其他哪些情景还可能需要实时监控应用?

从开篇小插曲中可以学到什么

开篇小插曲说明了商务过程中的数据如何用来生成各个层次的洞察。首先,数据的图形

分析(报表分析)帮助用户对当前情景形成一个直观感受。然后,额外的分析使用数据挖掘

技术估计未来行为,这就是预测性分析的领域。此类分析可以给用户提供具体的建议和推

荐,这就是规范性分析。最后,开篇小插曲告诉我们创新分析可以产生新的商业价值。识别

分析应用的机遇,并辅助制定决策对企业来说是一个新兴的机会。

来源:Magpiesensing.com, “Mshpir Sensing Cold Chain Analytics and Monitoring,”magpiesensing.com/wp- content/ uploads/2013/01/ColdChainAnalyticsMagpieSensing-Whitepaper.pdf (accessed July 2013); Centers for Disease Control and Prevention, Vaccine Storage and Handling, www.cdc.gov/ vaccines/pubs/pinkbook/vac-storage. html#storage(accessed July 2013); and A. Zaleski, “Magpie Analytice System Tracks Cold-Chain Products to Keep Vaccines, Reagents Fresh,” 2012, technicallybaltimore.com/profiles/startups/magpie-analytics-system-tracks-cold-chain-products-to-keep-vaccines-reagents-fresh(accessed February 2013).

4

5

商务智能、数据分析和决策支持概述 3

1.2 变化的商业环境和计算机决策支持

开篇小插曲介绍了一个公司如何使用分析制作报表,了解正在发生的事情,预测未来趋

势和制定决策来充分利用当前情景。这些步骤需要企业收集并分析大量数据。企业正在朝着

计算机支持的运营方向发展。为了理解为什么企业青睐包括商务智能在内的计算机支持,我

们建立了一个业务压力—反应—支持模型,如图 1-1 所示。

图 1-1 业务压力—反应—支持模型

业务压力—反应—支持模型

业务压力—反应—支持模型包括 3 个部分:商业环境带来的业务压力、为克服压力采取的

反应(或者对环境中有利机会的利用)以及对环境监测提供方便且能够提高组织反应能力的

计算机支持。

商业环境 如今组织面对的环境变得愈加复杂。这种复杂性一方面创造了机会,另一方

面也产生了问题。以全球化为例,今天,你可以轻松地在世界上的许多国家找到供应商和

顾客,这就意味着你可以买到更便宜的原料,并将产品和服务卖给更多的顾客,蕴含着许多

机会。然而全球化也意味着更多、更强大的竞争对手。商业环境因素可以分成 4 种类型:市

场、顾客需求、技术和社会。表 1-1 对这 4 类因素进行了总结。

表 1-1 给组织制造压力的商业环境因素

因素 描述 因素 描述

市场

激烈的竞争

扩大的全球市场

因特网上日益繁荣的电子市场

创新的营销手段

支持信息技术外包的机会

实时、按需的交易需要

技术

更多创新、新产品和新服务

不断增加的报废率

不断增加的信息过载

社交网络、Web 2.0 等

顾客需求

定制需求

追求质量、产品多样化、快速物流

顾客变得强大,并且不那么忠诚

社会环境

不断增加的政府管制和违规

劳动力更加多样化、老龄化并包括更多的女性

国土安全和恐怖袭击的担忧

萨班斯法案的必要性和其他报告的相关立法

公司日益增加的社会责任

更关注可持续性

值得注意的是这些因素的强度(intensity)会随着时间增加,导致更大的压力和更激烈

的竞争。除此之外,组织及其内部部门面临着更少的预算和来自上层管理者提高绩效和利润

6

4 第 1 章

的更大压力。在这种环境下,管理者必须快速反应、创新并保持敏捷。让我们来看看他们是

如何做的。

组织反应:反应、预期、适应和主动 私人组织和公共组织都意识到当今的商业环境和

压力,并采取不同的行动来应对压力。例如,Vodafone New Zealand(Krivda,2008) 利用商务

智能改善沟通,并在保持现有顾客和增加顾客收入方面为管理人员提供支持(参看本章末的

应用案例)。管理者可能采取其他的措施,包括以下方面:

采用战略规划。 ●应用创新性的商业模型。 ●重组业务流程。 ●加入商业联盟。 ●改善企业信息系统。 ●改善与合作伙伴的关系。 ●鼓励创新和创造性。 ●完善客户服务和关系。 ●转向电子商务(e 商务)。 ●转向订单生产以及按需生产和服务。 ●利用新的 IT 技术改善沟通、数据获取(信息发现)和合作。 ●对竞争对手的行动快速反应(例如,在定价、促销、新产品和服务方面)。 ●自动化白领雇员的许多工作。 ●某些决策过程自动化,特别是通过雇用专业分析人员来提高决策质量。 ●

即使不是全部,许多此类活动也都需要计算机支持。这些活动以及其他的响应策略经常

需要计算机决策系统的支持。

缩小战略差距 计算机决策支持系统的一个主要目标就是帮助组织缩小当前绩效与期望

绩效之间的差距,组织的期望绩效通常表示为组织的使命、方向、目标和到达目标的战略。

为了理解为什么需要计算机支持以及如何提供计算机支持,让我们来回顾一下商务智能的框

架及其在决策支持中的应用。

1.2 节复习题

1. 列举业务压力—反应—支持模型的组成部分并解释这个模型。

2. 什么是当今商业环境中最主要的因素?

3. 组织在面对当今商业环境时所做出的行动是什么?

1.3 商务智能架构

1.1 节和 1.2 节介绍的决策支持概念正在被许多提供决策支持工具和方法的供应商以

不同的名称逐渐实现。随着企业级(enterprise-wide)系统的成长,管理人员能够获取用户

友好的报告,帮助他们快速决策。这些系统通常叫做经理信息系统(Executive Information System,EIS),提供可视化、预警和绩效考评等功能。到了 2006 年,大多数的商业产品和

服务都采用了商务智能(Business Intelligence,BI)这个名称。

商务智能、数据分析和决策支持概述 5

1.3.1 BI 的定义

商务智能(BI)是个涵盖性术语,包含构架、工具、数据库、分析工具、应用和方法。

与 DSS 相似,BI 是一个内容无关(content-free)的表述,所以对于不同的人意味着不同内

容。人们对商务智能的迷惑在于相关的一些缩略语和流行语的混淆(例如,企业绩效管理

(BPM))。商务智能的主要目标就是实现数据的交互(有时候是实时的),实现对数据的操作,

使管理人员和分析人员能够进行合理的分析。通过对历史和现有数据、情景、性能的分析,

决策者得到有价值的洞察力,使他们能够做出更优的决策。BI 过程是将数据转换成信息,

然后以此为基础制定决策,最终开始行动。

1.3.2 BI 的简史

商务智能这个词是 Gartner Group 在 20 世纪 90 年代中期提出的。然而,这个概念可以追

溯到 20 世纪 70 年代的管理信息系统(Management Information System,MIS)的报表系统。

当时,报表系统是静态的、二维的,不具有分析功能。在 20 世纪 80 年代早期,经理信息系

统(EIS)的概念出现了,其中介绍了动态多维报表、预测与预报、趋势分析、下钻、状态访

问和关键成功因素(Critical Success Factor,CSF)分析等功能。这个概念将计算机支持系统扩

展到了高层经理和管理人员。到了 20 世纪 90 年代中期,这些特征才在一系列的商业产品中

出现。随后,具有相同功能的产品和新产品都以 BI 的名称出现。今天,一个基于 BI 的高质

量企业信息系统包含管理人员所需要的所有信息。因此最初的 EIS 概念转化为 BI。到了 2005年,BI 系统开始融入人工智能和强大的分析功能。图 1-2 展示了 BI 系统可能包含的各种工具

和技术,反映了 BI 的演变过程。图 1-2 中的工具提供了 BI 的功能。最复杂的 BI 产品包括大

多数功能,专业 BI 系统只提供一部分功能。第 2 ~ 6 章将更详细地介绍这些功能。

图 1-2 BI 的演变

1.3.3 BI 的架构

BI 系统通常包括 4 个主要部分:带有源数据的数据仓库、业务分析(用于操作挖掘、分

析数据仓库中数据的工具集)、用来监测和分析绩效的企业绩效管理(Business Performance

7~8

6 第 1 章

Management,BPM)、用户界面(例如,仪表盘)。这 4 个部分之间的关系如图 1-3 所示。

图 1-3 BI 的高层架构

来源:Based on W.Eckerson, Smart Companies in the 21st Century. The Secrets of Creating Successful Business Intelligent Solutions. The Data Warehousing Institute, Seattle, WA, 2003, p.32, Illustration 5。

1.3.4 BI 的起源和驱动力

数据仓库和商务智能的现代方法来源于哪里?它们的根源是什么?这些根源如何影响当

前组织管理计划?现在,考虑到信息技术产业财务底线的影响和潜能,对信息技术的投资正

在接受严格的审查。数据仓库和商务智能应用的情况也是一样的。

组织需要获取、理解并利用业务数据来支持决策,改善企业运营。现在的法律和法规

(例如,2002 年的萨班斯—奥克斯利法案)要求企业负责人以文件的形式记录业务流程,并签

字保证他们所依赖的信息和向投资者报告的信息的合法性。此外,商业周期时间现在也被极

度压缩。因此,更快、更明智、更优的决策成为竞争的必然趋势。管理者需要在正确的时间

和正确的地点获得正确的信息,这是现代商务智能方法的准则。

组织必须智慧地运营。关注商务智能计划是运营的一个方面,那么企业越来越注重商务

智能也就不足为奇了。表 1-2 提供了许多商务智能应用案例。应用案例 1.1 介绍了一个商务

智能帮助航空企业,也帮助提供商本身的案例。

表 1-2 BI 分析应用的商业价值

分析应用 商业问题 商业价值

客户细分顾客属于哪类市场细分,他们具有

什么特征个性化顾客关系,提高满意度和保留

购买倾向 哪些客户最可能响应促销 基于需求选择目标客户,增加他们对产品的忠诚度

客户收益 客户的终生盈利是多少 根据客户总的盈利,制定单独的业务交互决策

欺诈检测 怎样分辨哪些交易可能是欺诈的 快速确定欺诈,并立刻采取措施使成本最小

顾客流失 哪些顾客有流失的风险 防止高价值顾客流失,对低价值顾客则顺其自然

渠道优化在每个客户细分领域,实现客户的

最优渠道是什么根据客户的偏好和成本管理需求,与客户交互

来源:A. Ziama and J. Kasher, Data Mining Primer for the Data Warebousing Professional. Teradata, Dayton, OH, 2004。

9

~

10

商务智能、数据分析和决策支持概述 7

应用案例 1.1Sabre 公司使用仪表盘和分析技术帮助客户

Sabre 公司是一家世界领先的旅游集团,提供商家对个人(Business to Customer,B2C)服务,

也提供(商家对商家(Business to Business,B2B))服务。通过 4 个主要公司 Travelocity、

Sabre Travel Network、Sabre Airline Solutions 以及 Sabre Hospitality Solutions 为游客、导

游、企业和旅游供应商提供服务。当前易变的全球经济环境给航空公司带来了巨大的挑

战。为了在竞争中保持领先优势,Sabre Airline Solutions 意识到管理人员需要利用先进的

工具管理业务决策,淘汰浪费时间的利用人工方式收集财务等决策相关信息的传统方法。 这使得 Sabre Airline Solutions 公司能够获得全球航线的实时决策支持,通过不断增长的

数据推动洞察、智慧和顾客价值,最大化他们的信息回报。

Sabre 公司使用 Teradata 建立了企业旅游数据仓库(Enterprise Travel Data Warehouse,

ETDW),存储其庞大的数据。ETDW 近实时更新,每 15 分钟就从 Sabre 公司的所有事务

中获取数据。Sabre 公司利用 ETDW 创建仪表盘 Sabre Executive Dashboards,使用携带

Oracle Data Integrator 的 Cognos 8 BI 平台和 Oracle Goldengate 技术基础设施提供近实时

的洞察。Executive Dashboards 为客户的高级经理和决策者提供一个及时、自动、友好的

解决方案,将关键的绩效测度聚集成简化形式,并提供全方位的航线情况。Sabre 公司的

Executive Dashboards 为每一条航线提供高级管理,包括每天和一天内的关键绩效指标的

快照,以前从不同的数据源中生成相同的报表需要 8 小时,并且只能一周生成一次。仪表

盘的应用不限于外部客户,Sabre 公司还将它用于内部绩效的评估。

借助于带有可交互下钻分析能力的可视化界面, 仪表盘帮助 Sabre 公司的客户对数据

形成清晰的理解。它取代了平面表示,允许客户以更少的精力和时间集中在更重要的数据

上。仪表盘将各种销售绩效相关的数据 / 指标提供给利益相关者(stakeholder),促进了团

队的沟通和协作,这些数据包括票务、座位销售以及航班飞行和跟踪数据、客户预订、存

货等运营数据和航空公司各个销售渠道的销售绩效数据等。仪表盘系统提供了可扩展的基

础设施、图形用户界面(GUI)支持和数据集成,使决策者更加主动地采取行动,对航线

的整体状况产生了良性影响。

凭借 ETDW,Sabre 公司可以开发其他基于网页的分析和报表解决方案,通过分析客

户资料和购买行为计算客户价值,利用数据获取客户洞察。这有助于更好的客户细分,并

获得增加商业价值服务的洞察。

问题讨论

1. 传统的报表是什么?在企业中如何应用?

2. 分析技术如何被用来转换传统的报表?

3. 交互式的报表如何协助企业进行决策?

从应用案例中可以学到什么

这个案例说明,企业早期使用报表跟踪内部商业活动并满足政府相关规定,现在企业

正在向从交易数据中生成智能这个方向发展。企业正在尝试分析历史交易数据以理解隐藏

的趋势和模式,获得问题领域的洞察、发现机遇,以帮助他们更好地决策,由此报表的范

围已经被大大扩展了。报表已经发展为交互式的在线报表,用户可以快速建立客户报表,

并通过可视化显示工具连接数据库,显示报表,提供了向下钻取数据的能力。

11

8 第 1 章

来源:Teradata.com,“ Sabre Airline Solutions,”teradata.com/t/case-studies/Sabre-Aieline-Solutions-EB6281(accessed February 2013).

1.3.5 BI 中的多媒体练习

Teradata University Network(TUN)有许多介绍不同行业中分析概念的视频(类似于电

视节目 CSI)。这些视频称为“业务情况调查(Business Scenario Investigations,BSI)视频”。

不仅具有娱乐性,而且还提供了许多供讨论的问题。对于初学者,请访问 teradatauniversity- network.com/teach-and-learn/library-item/?LibraryItemId=889 或 www.youtube.com/watch?v=NXEL5F4_aKA。观看 YouTube 上的视频,假设你是客户服务中心专家。一个飞

往此地的航班误点了,几名乘客可能会错过转机,有一班飞离的航班有空位,但只能给 4 位

乘客中的 2 位提供座位。哪 2 位乘客的优先级更高?提供客户基本情况和航班信息,随着对

这些客户信息了解愈加深入,决策可能会改变。

观看视频,必要时暂停,回答哪位乘客应该优先。然后重新观看视频以获得更多信息。观看完毕

后,你可以访问 teradatauniversitynuetwork.com/templates/Download.aspx? ContentItemId=891 或

www.slideshare.net/teradata/bsi-how-we-did-it-the-case-of-the-misconnecting-passengers 找

到相关的介绍。

这个多媒体练习提供了一个案例,它说明企业数据仓库中的额外信息是怎样协助决策的。

尽管有些人将 DSS 等同于 BI,但目前为止这些系统是不同的。有趣的是,有些人认为

DSS 是 BI 的一部分——一种分析工具。其他人则认为 BI 是 DSS 的特例,主要处理报表、

交流和合作(一种数据驱动的 DSS 形式)。另一种解释(Watson,2005)认为 BI 是持续变革

的结果,而 DSS 是 BI 起初的组成部分之一。更进一步,在很多情况下 BI 被归为分析或数

据科学这两个新术语,将在下一节中会介绍。

1.3 节复习题

1. 商务智能的定义。

2. 列举并描述商务智能的主要组成部分。

1.4 智能产生、使用与商务智能治理

1.4.1 智能产生和使用的循环过程

12

图 1-4 智能产生和使用流程

数据仓库和 BI 计划遵循一个与军事智能

相似的流程。实际上,BI 的实施者经常遵循图

1-4 描述的模型。这个过程是一系列相关步骤

构成的循环。分析是将初始数据转化为决策

支持信息的主要步骤。然而,除非合理地执行

了循环中的其他步骤,否则无法实现精确或可

靠的分析。该过程的细节和实施步骤可以参考

Krizan(1999)。

来 源:L.Krizan, Intelligence Essentials for Everyone.WashingtonDC: Joint Military Intelligence College(occasional page number 6)Department of Defense, p.6。

一旦数据仓库就绪,智能产生过程就从识别和优先安排特定的 BI 项目开始。对于投资

商务智能、数据分析和决策支持概述 9

组合中的每个潜在的 BI 项目,使用投资回报(Return On Investment,ROI)和总拥有成本

评估成本效益率非常重要。这意味着每个项目都要经过通用流程阶段相关的成本以及为用户

应用维护成本的检验。此外,效益评估需要考虑对最终用户的决策影响,包括反映现金流加

速等收益的估计。有些组织将项目排序过程看作商务智能治理(BI governance)的一种形式

(Matney and Larson,2004)。一个主要的治理问题就是在 BI 项目排序中谁应该是决策者。

商务智能治理的两个关键合作关系是:1)职能负责人、产品和产品 / 服务区负责人(中间层)

之间的合作关系;2)潜在客户和供应商(业务代表和 IT 方代表)之间的合作关系。中间层

可以纵观整个组织,确保项目的优先次序反映整个企业的需求。他们确保项目在一个领域的

实施不至于陷入局部最优化。顾客可以提供有关项目产生智能的潜在效用的洞察。此外,从

交付现实(delivery realities)的观点看,供应商是非常重要的。商务智能治理团队需要解决

的典型问题包括:1)对项目进行分类(投资、商业机会、战略、强制等);2)定义项目选

择标准;3)确定并设置管理项目风险的框架;4)管理和平衡项目之间的依赖关系;5)持

续监控和调整投资组合的构成。

1.4.2 智能与窃取

虽然许多人认为智能这个词听起来就像是一个有关间谍秘密运作的缩写,用于偷取公司

秘密或政府的 CIA,但是这与事实相去甚远。虽然这种间谍活动当然会发生,但我们感兴趣

的是现代公司如何公正、合法地从他们的客户、商业环境、相关利益者、业务流程、竞争

对手和其他数据源收集具有潜在价值的信息。但信息收集仅仅是开始。大量的此类数据需要

被编录、标记、分析、分类、过滤,还必须经过一系列其他操作以产生有用的、能够影响决

策和提高底线的信息。随着企业跟踪和积累的数据越来越多,这些主题的重要性也会与日俱

增。例如,无线射频识别(Radio Frequency Identification,RFID)等传感器数据的出现,导

致原始数据量呈指数增长。对下一代 BI 专家来说,基于传感器和地理位置数据的应用将会

成为最令人激动和快速增长的应用。还有“文本挖掘”从文本资料中获取信息的新方法与

“网络挖掘”从网络资源中获取信息的方法,预示着组织正处在 BI 决策支持的一个爆炸的新

纪元的边缘。

BI 已经形成了一套专门术语、系统和概念,这些可以把它与国内外其他的间谍系统清

楚地区分开。也就是说,人们常常将这两类系统进行比较,包括把主要精力花在收集可靠的

情报源、处理情报的纯度与可靠度、产生可用信息的情报分析以及将信息恰当地传送给合适

用户的机制。

1.4 节复习题

1. 列举智能产生和使用的步骤。

2. 什么是商务智能治理?

3. 什么是情报收集?

1.5 事务处理与分析处理

为了说明 BI 的主要特性,我们首先说明从名称上看 BI 不是事务处理。我们都很熟悉

支持日常事务的信息系统,如 ATM 取款机、银行存款机、杂货店的收银机等。这些事务处

理系统持续处理操作型数据库的更新。例如,在一次 ATM 取款交易中,需要相应地减少银

13

~

14

10 第 1 章

行存款余额;一次银行存款会增加相应的金额到银行账户中;杂货店的一次购买最终反映到

商店一天的总销售计算中,并且同时应该反映相应的商店库存减少量等。这些在线事务处理

(Online Transaction Processing,OLTP,也称为联机事务处理)系统处理公司的日常实时业务。

相反,数据仓库是一个截然不同的系统,它存储分析中用到的数据。分析的目的是为管理者

提供搜索数据获得商业信息的能力,能够用来提供战术或操作决策支持。例如,一线人员

(line personnel)可以做出更快、更有根据的决策。第 2 章会给出一个数据仓库更技术化的

定义,但它足以说明数据仓库怎么利用在线分析处理(Online Analytical Processing,OLAP)系统使用的数据。

大多数企业资源计划(Enterprise Resources Planning,ERP)系统以及供应链管理(Supply Chain Management,SCM)系统或客户关系管理(Customer Relationship Management,CRM)

等互补系统中的业务数据都存储在 OLTP 系统中,这是一种典型的计算机处理,计算机快速

响应用户请求。每个请求被看作一个事务,即一个离散事件的计算机记录,例如库存收据或

者客户订单。换句话说,一个事务需要两个或多个数据库更新,并且所有更新必须都执行或

者都不执行(all-or-nothing)。

OLTP 系统能够有效进行事务处理,但对于终端用户的即席报表(adhoc report)、查询和

分析效率却比较低。在 20 世纪 80 年代,许多商业用户将他们的主机称为“黑洞”,因为所

有的信息都输入系统,但是却没有信息输出。所有的报表请求必须由 IT 人员编写程序,但

仅仅生成千篇一律(pre-canned report)的预订报表,即席实时查询基本无法实现。虽然 20世纪 90 年代的基于客户机 / 服务器的 ERP 系统可能更适用于报表,但它无法满足常规的、

非技术的终端用户对于运营报表、交互分析等方面的需求。为了解决这些问题,产生了数据

仓库(Data Warehouse,DW)和 BI 的概念。

数据仓库(DW)包含多种类型的数据,这些数据能够展现某个时间点上的商业状况。

基本想法是创建一个永远在线并且包含所有来自 OLTP 系统信息的数据库架构,包括历史数

据,但这些数据以一种快速有效地进行查询、分析和决策支持的方式重新组织和结构化。

将 OLTP 从分析和决策支持中分离出来,可以实现前面描述的 BI 优点,并提供竞争智

能和优势,下面将对此进行介绍。

1.5 节复习题

1. 定义 OLTP。2. 定义 OLAP。

1.6 成功的 BI 实施

实施和部署 BI 系统可能是一个漫长的、成本不菲的项目,并且极易失败。让我们来探

讨一些问题。

1.6.1 典型的 BI 用户群体

BI 可能拥有更大、更多样的用户群体。BI 的成功一部分取决于组织中的哪些人使用 BI系统。BI 成功的最重要方面之一是必须为整个企业带来价值,这意味着企业中的许多用户

应该在 DW 的开始阶段就参与进来。不必惊讶,企业可能会有专注于战略层的用户,也会

有专注于战术层的客户。

15

商务智能、数据分析和决策支持概述 11

组织中不同类别的用户有助于确定 DW 的架构、需要的 BI 工具和其他所需要的支持软

件。一旦 DW 就绪,每个类别的成员都是评估特定 BI 成本和利润的绝佳信息源。从上面的

讨论显而易见,擅长 BI 实施企业的一个重要特征就是正确地评价(appreciation)不同类别

的潜在用户。

1.6.2 合理规划与业务战略的统一

首先,投资 BI 的根本原因必须与公司的业务战略一致。BI 不能仅仅是信息系统部门的

技术实践,它必须改进商业流程,并将决策制定过程转变为数据驱动型,以改善公司的经营

方式。许多曾经参与过成功 BI 实施的咨询和实战专家建议:计划框架是必需的先决条件。

Gartner 公司(2004 年)曾经开发过一个框架,将计划和执行过程分解为商务、组织、功能、

基础设施几个部分。在商务和组织层,需要定义战略和运营目标,同时考虑实现这些目标可

用的组织技能。高层管理人员还应该考虑 BI 项目所处的组织文化、唤起组织人员的热情、

建立 BI 最佳实践在组织内的分享活动,同时还要制订计划应对组织变化。在这个过程中,

首先要考虑评估信息系统(IS)组织、潜在用户的基本技能以及组织文化是否适应变革。经

过这些评估,公司有理由和需要继续实施,那么公司就可以准备一个更详细的行动计划了。

另一个 BI 成功实施的关键问题是多个 BI 项目之间的整合(多数企业应用多个 BI 项目),以

及 BI 与其他存在于组织、商业伙伴中的 IT 系统之间的整合。

如果企业的战略与实施 DW 和 BI 的原因一致,如果公司的 IS 组织能够胜任这样的项

目,如果所需的用户团体和合适的动机就绪,那么开始实施 BI 并在公司中建立一个商务智

能能力中心(BI Competency Center,BICC)是非常明智的。这个能力中心能够实现以下功能

(Gartner,2004):能够证明 BI 是如何与企业战略和战略实施联系在一起的。 ●能够鼓励潜在业务客户群体与 IS 组织之间的交流互动。 ●中心能够作为不同业务之间的知识库和最好的 BI 实践传播者。 ●在 BI 实施中,好的标准能够在企业中得到拥护和鼓励。 ●IS 组织能够在与用户团体交流互动的过程中学到很多,例如所需要的各种分析工具 ●的知识。

业务用户群体和 IS 组织能够更好地理解,为了适应不断变化的业务要求,数据仓库 ●平台必须非常灵活的原因。

帮助重要的利益相关者都像高级管理人员一样明白 BI 是如何发挥重要作用的。 ●另一个 BI 的成功因素是它能够促进一个实时的、随需应变的灵活环境,下面将进行介绍。

1.6.3 实时的、随需应变的 BI 是可以实现的

当缩短业务数据与战略目标之间差距的需要越来越迫切时,对于实时的、随需应变(on-demand)存取分散信息的需求也日益增加。因此,称为实时 BI 应用的一类产品出现了(见

第 2 和 3 章)。新的数据产生技术的使用,例如 RFID,加速了实时 BI 应用的增长和对实时

BI 的需求。传统的 BI 系统使用大量的经过提取、清洗并载入数据仓库的静态数据生成报表

和分析。然而,用户需要的不仅仅是报表,因为他们需要商业监控、绩效分析以及了解事情

为什么发生。这些能够帮助用户了解(通常是实时的)数据变化或者相关报告、预警、事件

通知以及网络、电子邮件或即时通信(Instant Messaging,IM)应用中出现的事件和新趋势。

16

12 第 1 章

除此之外,可以编写商务应用程序按照实时 BI 系统发现的信息采取行动。例如,供应链管

理系统(SCM)能够在实时库存低于某一阈值时,自动地发出订单,获取更多库存;或者客户

关系管理(CRM)自动触发客户服务代表和信用检查人员查看在线发出的订单金额超过 10 000 美元

的用户情况。

一种实现实时 BI 的方法是利用传统 BI 系统的 DW 模型。在这种情况下,来自创新的

BI 平台供应商(例如,Ascential 或者 Informatica)的产品能够提供面向服务的近实时解决

方案,使得 DW 比典型的夜间提取、转换和加载(Extract/Transfer/Load,ETL)批量更新的

方式更快(见第 2 章)。第二种方法通常称为业务活动管理(Business Activity Management,BAM),这种方法被纯粹提供 BAM 和混合 BAM 中间件的供应商采用(例如,Savvion、Heration、Software、Vitria、WebMethods、Quantive、Tibco 和 VineyardSoftware)。它绕过

了 DW,应用 Web 服务(Web services)或者其他监控手段发现关键业务事件。这些软件监

控器(或者智能代理)安装在网络上的独立服务器或者事务应用数据库上,同时它们能够使

用基于事件和过程的方法主动地、智能地度量和监控操作过程。

1.6.4 开发或收购 BI 系统

现在,许多供应商都提供多样化的工具,其中一些工具完全设计好的(叫做壳(shell)),你只需要输入数字。这些工具可以购买或者租赁。关于产品、演示、白皮书、当前的产品信

息,可以访问 information-management.com,需要进行免费用户注册。几乎所有的 BI 应用都包含了壳,壳是由供应商定制或者与第三方合作完成。公司面临的问题是选择什么方

案:购买、租赁还是自建。每种方案又会有多种选择。做出选择的主要标准之一是合理的理

由(justification)和成本—收益(cost-benefit)分析。

1.6.5 理由和成本—收益分析

随着 BI 应用数目的增加,需要证明这些 BI 应用的合理性和优先次序。由于大量无形利

益的存在,这不是一项简单的任务。直接利益和无形利益都要识别。这时有关其他组织中相

似应用的知识和案例就非常有用。例如,数据仓库研究院(tdwi.org)提供了很多关于产品

和创新应用与实施的信息,此类信息能够在评估直接和间接利益时发挥作用。

1.6.6 安全和隐私保护

在任何计算机系统发展过程中这都是非常重要的问题,特别是包含战略价值数据的 BI系统。同样,员工和顾客的隐私也需要保护。

1.6.7 系统和应用的集成

除了部分较小的应用外,所有的 BI 应用都必须与数据库、遗留(legacy)系统、企业系

统(特别是 ERP 和 CRM)、电子商务系统(买卖双方)等系统进行集成。此外,BI 应用通常

连接到因特网,并多次连接商业伙伴的信息系统。

此外,有时 BI 工具之间本身也需要集成,产生协同效应。集成的需要使软件供应商不

断地添加新功能到它们的产品中。购买包含所有功能软件包的顾客只需要与一个供应商打交

道即可,无需处理系统集成的问题。然而,它们可能会失去利用“最好的”(best-of-breed)组件构建系统带来的优势。

17

18

商务智能、数据分析和决策支持概述 13

1.6 节复习题

1. 描述 BI 用户的主要类型。

2. 列举一些 Gartner 报告中强调的实施要点。

3. 列举一些 BI 成功因素。

4. 为什么很难说出 BI 应用的理由 ?

1.7 数据分析概述

数据分析(analytics)一词取代了先前计算机决策支持技术中的单个组件,以往的计算

机决策支持技术被打上了许多标签。事实上,现在很多应用人员和科研人员使用数据分析代

替 BI。尽管不同作者和顾问给出的定义稍有差异,但我们可以将数据分析视为从历史数据

中获得的洞察转化为可执行的决策或推荐的过程。运营研究和管理科学研究所(Institute for Operations Research and Management Science, INFORMS)制定了一个计划,组织和促进数据

分析。根据 INFORMS 的说法,数据分析将计算机技术、管理科学和统计学结合以解决实际

问题。当然,许多其他组织也给出了自己的解释和动机。例如,SAS 公司给出了数据分析的

8 个层次,这些层次从计算机系统的标准化报表开始。这些报表本质上提供了一个组织正在

发生什么的直观印象。其他技术使我们能够随时创建更加个性化的报表。报表的另一个扩展

引入了在线分析处理(OLAP)的查询,使用户可以深入挖掘,确定问题或机遇的根源。如今

的技术可以在满足预警条件时,自动向决策制定者发出报警。在消费者层面,我们可以看到

类似的天气或其他事项的预警。但也可以对相似的预警进行具体设置,例如在特定时段里销

售收入低于或高于某一阈值或者某产品的库存

不足。通过分析和查询从组织中收集的数据,

以上所有应用都可以实现。分析的下一个层次

需要统计学的知识来更好地理解模式。这些模

式进一步用于生成预测或模型,预测客户对某

一市场活动或服务 / 产品促销的反应。当组织

清晰地认识到正在发生什么以及将要发生什么

时,组织也可以部署其他技术制订最优策略。

这 8 个层次在 SAS 的白皮书中有更详细的介绍

(sas.com/news/sascom/analytics_levels.pdf)。这个通过数据理解正在发生什么、将要发

生什么以及如何制订最优策略的思想被 INFO- RMS 封装成数据分析的 3 个层次,被定义为

描述性、预测性以及规范性分析(informs.org/Community/Analytics)。图 1-5 展示了数

据分析 3 个层次的两种图形化的视图:一种视

图表明这 3 个层次是独立的步骤(或呈阶梯状),一种数据分析应用可以通向另一种;一种

图形化的视图将这 3 个层次表示为相互联系的圆,这种观点认为这 3 个层次有部分重叠。

无论哪种情况,不同种类的数据分析之间都明显地相互联系。下面我们将介绍数据分析的

3 个层次。

19

图 1-5 分析的 3 种类型

14 第 1 章

1.7.1 描述性分析

描述性或报表分析(descriptive or reporting analytics)是指了解企业正在发生什么,并理

解潜在的趋势和事件发生的原因。这包含了数据源的整合以及所有相关数据的可用性,这些

数据的形式便于制作报表和分析。通常构建这个数据基础架构(data infrastructure)是数据

仓库的一部分。通过这个数据基础架构,利用不同的报表工具和技术可以开发多种合适的报

表、查询、预警和趋势。

一种重要的技术逐渐成为此领域的关键,这就是可视化。使用市场上最新的可视化工具,

可以获得关于企业运营的深入洞察。应用案例 1.2 和 1.3 强调这些技术在医疗保健领域的应

用。这些应用的彩色版可以在本书的合作网站(dssbibook.com)和 Tableau 的网站上找到。

应用案例 1.2改善西雅图儿童医院的低效率状况

根据《 U.S. News & World Report》,西雅图儿童医院(Seattle Children's Hospital)在

2011 年全球最好的儿童医院排名中位列第 17。对于任何致力于挽救生命的机构来说,及

时发现并移除系统和业务流程中低效的部分是非常重要的,使更多的资源可以满足患者的

需求。在西雅图儿童医院,管理人员不断寻找新方法,以提高质量和安全性,改善患者从

挂号到出院的整个流程。为此,他们花费了大量时间分析与患者相关的数据。

为了尽快将患者和医院数据转化为洞察力,西雅图儿童医院采用了 Tableau Software公司的商务智能应用。Tableau Software 公司提供了一个基于用户易于使用数据分析的浏

览器,使个人可以直觉地产生可视化表示并理解提供的数据是什么。数据分析师、商务经

理、金融分析师、护士、医生和研究人员都使用描述性分析更快地解决不同问题。他们

自己正在开发可视化系统,例如仪表盘和记分卡(scorecard),帮助定义标准和当前绩效,

将当前绩效与当前标准进行比较。通过每日每月仪表盘的投入使用,西雅图儿童医院每天

的决策水平得到了极大的改善。

西雅图儿童医院测量患者的等候时间,并借助可视化分析这些数据,以发现造成患者

等待的原因。他们发现早期的延误会影响一整天。为了解决这个问题,他们将致力于准时

的患者预约服务,缩短患者的整体等待时间并提高床位利用率。医院在整个供应链中节约

了 300 万美元。此外,借助 Tableau 等工具,医院正在寻找新方法进一步节省成本,同时

治疗尽可能多的孩子。

问题讨论

1. 工具的使用者是谁?

2. 仪表盘是什么?

3. 可视化如何帮助决策?

4. 使用 Tableau 的重大作用有哪些?

从应用案例中可以学到什么

这个案例说明报表分析,包括仪表盘等可视化工具,可以获得对现有数据的深入洞

察,这个案例还说明企业中不同领域、不同部门的用户如何帮助改善业务流程和质量。此

外,可视化地探索数据能够帮助发现问题的根源,为找出可行的解决方案打下了基础。

来源:Tableausoftware.com,“ Eliminating Waste at Seattle Childrens, ”tableausoftware.com/eliminating-waste-at-seattle-childrens(accessed February 2013).

商务智能、数据分析和决策支持概述 15

应用案例 1.3以思考的速度分析

作为纽约西部最大的医疗保健供应商,Kaleida Health 拥有超过 1 万名雇员,5 家医院、

多所诊所和疗养院(nursing home),以及一家处理数百万患者数据记录的家访护士协会

(visiting-nurse association)。Kaleida 的传统报表工具无法处理增速惊人的数据,他们需要

一款商务智能工具有效且迅速地处理庞大的数据集,并且拥有更深入的数据分析能力。

在 Kaleida,如今许多计算都是在 Tableau 上完成的,主要是将数据从 Oracle 数据库

转到 Excel,再将数据导入 Tableau。对于许多月度分析报告来说,直接将数据从数据仓

库中提取到 Tableau 中。许多数据查询被保存起来以便重新访问,当处理上百万的数据记

录时,这种方法节省了大量时间。除了速度外,Kaleida 也为了产生摘录,使用 Tableau合并不同的表。

使用 Tableau,Kaleida 能够分析急救室数据,确定一年中住院次数超过 10 次的患者

数目。这个数据反映了那些由于胃痛、头痛和发烧而不恰当地使用了急救室和急救车服务

的患者。Kaleida 可以管理资源利用(即供应品的使用和消耗),最终使整个系统的资源管

理更加高效与标准化。

如今 Kaleida 拥有自己的商务智能部门,利用 Tableau 与国内其他医院进行比较。这

种比较是多方面的,例如患者等候时间、医院服务、市场份额以及与医生的合作关系。

问题讨论

1. 用户希望报表工具具有哪些功能?

2. 在此案例中使用报表工具带来了哪些好处?

从应用案例中可以学到什么

正确地选择报表工具十分重要,尤其是当企业希望从报表中获取价值的时候。生成的

报表和可视化展示应该易于理解,并且有助于不同领域的人们理解报告的内容,识别问题

领域,促进问题的解决。未来企业需要的报表分析工具应能在没有第三方咨询和服务供应

商的情况下,高效处理庞大数据,生成所需报表。一个真正有用的报表分析工具可以使企

业免除不必要的开销。

来源:Tableausoftware.com,“ Kaleida Health Finds Efficiencies, Stays Competitive, ” tableausoftware.com/learn/stories/user-experience-speed-thought-kaleida-heath(accessed February 2013).

1.7.2 预测性分析

预测性分析旨在确定未来可能会发生什么。这种分析技术主要是基于统计学知识以及最

近发展起来的数据挖掘技术。这些技术的目标是能够预测一个客户是否有可能转变为竞争者

(“流失”),客户将要买什么以及花多少钱买,客户会对何种促销活动做出响应,客户是否有

信用风险等。一系列技术被用于开发预测分析应用,包括各种分类算法。例如第 5 章和第 6章介绍的,我们可以使用决策树和神经网络模型等分类技术,预测某个电影的票房。我们可

以使用聚类算法将客户细分成不同的类别,再针对性地提供不同的促销活动。最后,我们可

以使用关联挖掘技术估计不同消费行为之间的联系。也就是说,如果客户购买了某件商品,

那么他还可能购买其他什么商品?诸如此类的分析可以帮助零售商推荐和促销相关产品。例

如,Amazon.com 的产品搜索结果也会推荐一些客户可能感兴趣的其他相似产品。我们将在

16 第 1 章

第 3 ~ 6 章学习这些技术及其应用。应用案例 1.4 和 1.5 强调了类似的应用。应用案例 1.4 介

绍了一部你可能听说过的电影《Moneyball》。这可能是预测分析在运动领域最好的应用案例。

应用案例 1.4《Moneyball》:体育运动与电影中的数据分析

《 Moneyball 》,2011 年上映的一部传记运动类电影,由 Bennett Miller 导演,根据

Michael Lewis 的同名小说改编。影片描述了 Oakland Athletics 棒球队的 2002 赛季,以及

Oakland 总经理为组建一支有竞争力的队伍做出的努力。

Oakland Athletics 在 2001 赛季后在对战纽约扬基队时遭遇了巨大失败,导致队伍中许

多明星球员离开,成为了一支资金前景堪忧的弱队。由于队伍的资金有限,总经理重组一

支强队的建议被拒绝。Oakland Athletics 选择队伍成员依旧遵循传统的方式,主观决定聘用

人员。之后总经理遇到了一个年轻的计算机高手,他同时还拥有耶鲁大学的经济学学位。

总经理决定聘请他为新的总经理助理。

新任总经理助理对棒球有着强烈的兴趣,并且善于处理比赛的各项数据。对比赛的

兴趣使得他研发了一个理解棒球统计数据的方法。他是 Bill James 的追随者——一个运用

理性技巧分析棒球的边缘人物。James 以不同的方式看待棒球数据,纯粹从数字入手,消

除主观性。以 James 为先驱的非传统分析方法被称为 Sabermetric 方法,这个名称来自

SABR——美国棒球研究社区。

总经理助理根据 Sabermetric 方法建立了预测模型,帮助队伍根据上垒率(On-Base Percentage,OBP)选择队员。上垒率度量击球手通过除了接防失误、外场球员判断、第三

棒失误、外场阻挡或者接球手干扰以外的任何途径的上垒频率。总经理助理不再依靠经验

和直觉,完全根据 OBP 数据选择球员。

通报(spoiler alert):新队伍击败了所有对手,赢得 20 连胜,并打破了联盟记录。

问题讨论

1. 《Moneyball》中如何应用预测分析?

2. 在决策中主观方法和客观方法有哪些差异?

从应用案例中可以学到什么

数据分析技术可以应用于很多领域,它帮助企业反思传统的问题解决能力。传统的问

题解决能力在大多数情况下是主观的,依靠旧的、一成不变的过程寻找解决方案。分析采

用理性方法,使用历史数据寻找基于事实的解决方案,这些方案甚至适用于制定未来决策。

来源:Wikipedia,“ On-Base Percentage, ”en.wikipedia.org/wiki/On_base_percentage(accessed January 2013);Wikipedia,“Sabermetrics,”en.wikipedia.org/wiki/Sabermetrics(accessed January 2013).

1.7.3 规范性分析

第三类分析方法称为规范性分析。规范性分析的目的是认识到正在发生什么,并对未来

做出可能的预测,同时制定决策获得最大收益。历史上对这些技术的研究一直属于运营研究

和管理科学领域的范畴,主要目的是优化系统绩效。此处的目的是对某个活动提供决策或建

议。这些建议的形式可能是对一个问题的是 / 否决定、具体数额(例如,某个商品的价格或

商务智能、数据分析和决策支持概述 17

机票价格)或完整的一系列产品计划。这些决策可能以报表的形式呈现给决策者,或者直接

在自动决策管理系统中使用(例如,航线定价系统)。因此,这类分析也称为决策或规范性

分析。应用案例 1.6 给出了这类规范性分析应用的例子。

应用案例 1.5分析运动损伤

任何体育运动都有可能受伤。如果没有得到妥善处理,整个体育团队都会蒙受损失。

使用分析技术理解损伤可以获得有价值的洞察,协助教练和随队医生管理队伍编排,理解

运动员的特征,最终更好地确定哪些运动员适合上场。

在一项探索性研究中,俄克拉荷马州立大学使用报表和预测性分析技术对美国足球类

的运动损伤进行了分析。该项目遵循 CRISP-DM 方法,帮助理解伤病管理问题,理解收

集的各种伤病数据,清洗数据,利用可视化产生洞察,建立预测模型用于分析伤病治愈时

间,挖掘序列规则来预测运动损伤与身体各个损伤部位的关系。

伤病数据集包含了 560 多条记录,可以分为伤病相关的数据(包括受伤部位、采取的

措施、严重程度、伤病类型、伤病发生和治愈日期等)和运动员相关数据(包括运动员 ID、

场上位置、活动、受伤和比赛地点)。每条记录的治愈时间被重新计算为不同的时间段:

0 ~ 1 月、1 ~ 2 月、2 ~ 4 月、4 ~ 6 月和 6 ~ 24 月。

创建了许多可视化展示从伤病数据中获取洞察,描述治愈时间与运动员位置、受伤严

重程度的关系、治愈时间与治疗的关系、治愈时间与主要损伤部位之间的关系等。

使用 IBM SPSS Modeler 建立神经网络模型预测各种治愈变量。预测变量包括当前伤病

状态、严重程度、受伤部位、活动、地点、采取的措施、运动员的场上位置等。预测性分

析的结果非常好:准确度达到 79.6%。根据分析结果,可以产生许多业务建议,包括聘请

更多的伤病专家在现场候诊而不是让训练室的员工无作为、教育防守位的运动员注意损伤、

每次训练都进行彻底的安全检查。

问题讨论

1. 损伤分析中使用了哪些类型的分析方法?

2. 可视化如何帮助理解数据并获得深入的洞察?

3. 案例中的分类问题是什么?

4. 序列分析可以获得什么?

从应用案例中可以学到什么

对于任何分析项目,通过深入分析唯一的资源(历史数据)来理解该业务领域和目前的

问题是非常重要的。可视化通常是一个获取初步洞察的很好工具,进而根据领域专家的意

见辨识问题相关的重要数据。对于某些模糊的问题,可视化也可以启发我们思考,通过建

立预测模型帮助企业决策。

应用案例 1.6中国工商银行使用模型调整网络分支

中国工商银行(ICBC)有 16 000 多家分行,为 2.3 亿个人用户和 360 万企业用户提

供服务。ICBC 的日交易额达 1.8 亿美元。目前在市值、存款以及利润等方面,都是世界

20

~

23

18 第 1 章

排名第一的上市银行。为了保持竞争力并提高利润,ICBC 面临迅速适应经济、城市化

以及中国人均财富快速增长等挑战。在 300 多个城市中,用户行为和金融状况波动很大,

ICBC 必须做出改变。显然,作为如此巨大的经济体,为了应对挑战,ICBC 必须开发大

规模的优化方案 , 为支行定位合适的位置,并为合适的客户提供合适的服务。

在现有的方法中,ICBC 将不同变量按照不同权重输入给评估模型,从而决定在哪里

开设新的支行。这些变量包括客户流、常驻家庭数以及该区域内竞争对手数量等。该方法

缺乏对地理区域内客户分布的分析,而且不能优化支行在分支网络中的分布。在 IBM 的

帮助下,ICBC 开发了一个分行重配置(Branch Reconfiguration,BR)工具。BR 系统的

输入包括三部分:

a. 83 种地理数据。

b. 22 种人口和经济数据。

c. 每天超过 6000 万交易记录的分行交易和绩效数据。

这些数据帮助确定每个区域准确的客户分布,从而优化银行的分行网络。BR 系统包

含市场潜力计算模型、分行网络优化模型和分行网点评估模型。市场潜力计算模型根据输

入数据和专家知识评估客户量和客户价值。例如,专家知识帮助决定个人收入的权重是否

大于国民生产总值(Gross Domestic Product,GDP)的权重。将地理区域划分成一个个小

格子,并判断不同格子的优先级。分行网络优化模型中利用混合整数规划(mixed integer programming)定位最优的格子,从而覆盖市场潜力最大的区域。分行网点评估模型确定

在特定位置建立银行分行的价值。

自 2006 年以来,通过不断迭代,BR 的开发得到了完善。自从使用 BR 后,ICBC 增

加了 212 亿美元储蓄额。这是因为银行可以使用优化工具为更多的客户提供服务。例如,

2010 年 BR 在苏州使用,储蓄额从 2007 年最初的 75.6 亿美元提高到 136.7 亿美元,增加

了 61.1 亿美元。该项目成功入选 2011 年 Edelman Competition——该比赛由 INFORMS 主

办,旨在促进管理科学 / 运筹学模型的实际应用。

问题讨论

1. 分析技术如何帮助企业维持竞争优势?

2. 描述性和预测性分析如何协助完成规范性分析?

3. 该应用案例使用了哪种规范性分析技术?

4. 规范性分析是一旦建立就永久适用吗?

从应用案例中可以学到什么

如今世界上许多企业都在使用分析技术维持竞争力和增长。许多企业通过使用规范性

分析提供商业咨询。同样重要的是,企业需要有积极的决策者意识到经济环境的变化以及

分析工具的先进性,从而使用合适的模型。该案例介绍了地理市场分割和客户行为分割技

术能够实现对每个客户获利性的独立分析,并采用优化技术定位最佳分行位置,在每个区

域产生最多的盈利。

来源:X. Wang et al.,“ Branch Reconfiguration Practice Through operations Research in Industrial and Commercial Bank of China, ” Interfaces, January/February 2012,Vol.42, No. 1,pp.33-44; DOI:10.1287/inte.1110.0614.

商务智能、数据分析和决策支持概述 19

1.7.4 应用于不同领域的数据分析

数据分析在不同行业中的应用催生了许多相关领域,至少是许多流行语。将数据分

析一词与特定产业或某种类型的数据相连接几乎是时髦的做法。除了一般类型的分析,例

如文本分析(从文本中获取价值,将在第 5 章详细介绍)和 Web 分析(分析网络数据流,

在第 5 章介绍),还出现了许多针对特定行业或特定问题的专业分析工具。例如市场分析、

零售分析、诈骗分析、运输分析、健康分析、体育分析、能力分析、行为分析等。例如,

应用案例 1.1 可以看做是航线分析,应用案例 1.2 和 1.3 则属于健康分析,应用案例 1.4 和

1.5 是运动分析,应用案例 1.6 是银行分析,应用案例 1.7 是零售分析。本章末尾的应用案

例则是保险分析。几乎所有领域中对数据的系统分析都称为“ xx 分析”。虽然这可能会造

成数据分析概念的滥用,但好处是使不同领域的人认识到分析工具的能力和潜力,也使专

家可以集中将数据分析的概念在垂直领域进行开发和应用。虽然各种开发分析应用的技术

可能很相似,但每个垂直领域都有其独特的问题,影响如何收集、处理和分析数据,以及

应用的实施。基于不同垂直领域的差异对数据分析的全面发展有很大好处。

1.7.5 数据分析还是数据科学

虽然数据分析的概念已经在产业界和学术界广为人知,然而另一个术语也已经被提

出,并逐渐流行——数据科学(data science)。因此,数据科学的从业者被称为数据科学

家,这是由 LinkedIn 的 D.J.Patil 先生发明的术语。有人尝试描述数据分析师和数据科学家

的区别(例如,emc.com/collateral/about/news/emc-data-science-study-wp/pdf)。一种观

点认为数据分析师只是商务智能从业人员的另一个称谓,从事数据编辑、清洗、报表,可

能还有可视化。他们的技能包括 Excel、一些 SQL 知识和报表。读者可以从 1.7 节发现这

其实就是描述性和报表分析。相反,数据科学家负责预测性分析、统计分析以及更高级的

分析工具和算法。他们可能对算法有深入理解,并给这些知识赋予不同的标签——数据挖

掘、知识发现或机器学习。一些专业人员可能也需要深厚的编程知识,使用面向 Web 的语

言(例如,Java 或 Python)为数据清洗 / 分析编写代码。而且,读者应该将他们划分到预

测性分析和规范性分析领域。我们的观点是数据分析师和数据科学家的主要差别不在于他

们的职能,而在于他们的知识和技能。这种差异可能在于学科上。计算机科学、统计学和

应用数学似乎更倾向于数据科学的标签,而数据分析的标签则留给了面向业务的专家。另

一个例子,应用物理学专家使用网络科学(network science)描述与人群相关的分析,例

如社交网络、供应链网络。参见 barabasilab.neu.edu/networksciencebook/downlPDF.html上关于该主题的教材。

除了技能和知识存在明确的差异外(即一方只需要描述性 / 报表分析,而另一方需要参

与全部三种分析),两者之间的差异是相对模糊的。我们发现数据分析项目的毕业生更倾向

于处理数据科学的任务,而不是简单的报表分析。本书希望介绍所有的数据分析功能(包含

数据科学),而不仅仅是报表分析。从现在开始,我们将互换使用这两个词。

1.7 节复习题

1. 定义数据分析。

2. 描述性分析是什么?描述性分析使用的工具有哪些?

3. 描述性分析与传统的报表有哪些区别?

24

~26

20 第 1 章

4. 数据仓库是什么?数据仓库技术如何协助分析?

5. 预测性分析是什么?企业如何应用预测性分析?

6. 规范性分析是什么?规范性分析可以解决哪些问题?

7. 从数据分析的角度定义建模。

8. 应用规范性分析前是否应该先进行描述性分析和预测性分析?

9. 数据分析如何有助于更加客观决策?

1.8 大数据分析简介

什么是大数据

我们的大脑运作极其迅速、高效,可以处理各种数据:图片、文字、音频、气味和视

频。我们可以相对容易地处理各种类型的数据。相反,计算机则很难应对数据生成的速

度,更不用说快速地分析了。这就是为什么产生了大数据问题。那么什么是大数据呢?简

单地说,大数据就是不能再用单个存储单元存储的数据。通常大数据以不同的形式出现:

结构化、非结构化、数据流等。这些数据的主要来源是网站的点击流、社交网络(例如,

Facebook)的帖子、交通数据、传感器、天气等。搜索引擎(例如,Google)需要查询并为

数 10 亿的页面编制索引才能在 1 秒内返回相关结果。虽然这不是实时的,但为因特网上所

有的页面编制索引可不是件容易的事。幸运的是,Google 有能力解决这个问题。除了其他

工具外,Google 还使用了大数据分析技术。

管理这种规模的数据包含两方面:存储和处理。如果我们能够购买一个非常昂贵的存储

解决方案,将所有这些数据都存放在一个地方的单个存储单元内,那么使该存储单元具有容

错能力需要花费大量成本。一种聪明的解决方法是将这些数据分块存储在不同的机器上,并

由网络相互连接,将数据块的一份(或者两份)备份在逻辑上和物理上存储在网络的不同地

方。这种方法最初由 Google 使用,称为 Google 文件系统(Google File System),后来作为

Apache 项目的 Hadoop 分布式文件系统(HDFS)开发并发布。

然而,存储这些数据只完成了一半工作。如果不能提供商业价值,数据则毫无价值。换言

之,要使数据发挥商业价值,就需要进行分析。如何分析如此庞大的数据?将所有计算交给一

台超级计算机来完成是行不通的。如此规模的数据将对超级计算机产生很大开支。另一种聪明

的方法被提出:将计算推送给数据,而不是将数据推给计算节点。这是一种新的范式,提供了

一种处理数据的新方法。这就是我们今天称为 MapReduce 的编程范式,使大数据的处理成为现

实。MapReduce 最初由 Google 提出,随后 Apache 发布了后续版本 Hadoop MapReduce。如今,当我们谈论存储、处理或分析大数据时,总要涉及 HDFS 和 MapReduce。其他

相关的标准和软件解决方案也被提出。虽然主要工具都是开源的,但一些公司也在该领域推

出了特定的分析硬件和软件服务,例如 HortonWorks、Cloudera 和 Teradata Aster。在过去的几年中,大数据逐渐变成了大数据应用。快速处理数据的需求加快了这个进程。

快速处理数据的一个例子是算法交易(algorithmic trading)。使用基于算法的电子平台在金融

市场交易股票,可以在微秒级完成处理。处理不同类型数据的需求加速了大数据应用。使用

不同类型数据的另一个例子是从社交网络收集各种数据进行情感分析,并根据客户的反应测

度其情绪。无论数据的规模、变化速度和多样性,如今大数据可以处理任何类型的数据。应

用案例 1.7 介绍了一个大数据分析的例子。我们将在第 6 章研究大数据技术和应用。

27

商务智能、数据分析和决策支持概述 21

应用案例 1.7GiltGroupe 利用大数据分析优化限时抢购

Gilt Groupe 是一家限时销售名牌衣服和饰物的电商网站,给用户提供高端衣服和饰

物的独家折扣。注册 Gilt 后,客户会收到提供许多折扣优惠的邮件,客户可以在 36 ~ 48小时内享受这些折扣价。每天都提供约 30 种不同的商品。传统商场一年内更换存货两三

次,而 Gilt 一年则更换 8 ~ 10 次。因此,他们需要很好地管理库存,不然就会造成很大

的库存成本。为了解决这个问题,Gilt 开发的分析软件追踪每一次客户点击——客户点击

了哪些品牌、什么颜色、什么样式、最终购买了什么。根据这些信息,Gilt 尝试预测客户

最可能买哪些商品并据此调整库存。分析软件也给每一位客户发送个性化的商品推荐。

然而,这还不是整个过程。分析软件同时监控客户从推荐商品里购买了什么,以便更

好地进行预测,并提高个性化推荐的效果。有些客户并不经常查收邮件。Gilt 的分析软件

可以追踪客户的响应,并在 3 天后向没有响应的客户再次发送折扣信息。Gilt 还通过分析

Twitter 上的客户评论获取客户的情感,监控客户对 Gilt 商品的整体看法。Gilt 的推荐软

件是基于 Teradata Aster 技术方案,其中包含大数据分析技术。

问题讨论

1. 什么使这个应用案例成为一个大数据分析的例子?

2. Gilt Groupe 需要进行哪些决策?

从应用案例中可以学到什么

结构化和非结构化的数据持续增加,现在许多组织都在从这些数据中发现可采取行动

的决策。如今对快速增长的海量数据的存储、处理等先进技术使大数据分析成为可能。

来源:Asterdata.com,“ Gilt Groupe Speaks on Digital Marketing Optimization, ”asterdata.com/gilt_groupe_video.php(accessed February 2013).

1.8 节复习题

1. 什么是大数据分析?

2. 大数据的来源有哪些?

3. 大数据的特征是什么?

4. 处理大数据需要应用哪些技术?

1.9 本书的安排

前面小节使你理解了决策对信息技术的需要、商务智能的发展以及数据分析。最后两节

概述了各种类型的分析及其应用。现在,我们准备学习这些主题的详细内容,以及一些技术

主题的动手实验。图 1-6 列出了本书的安排。

在第 1 章中,我们给出了决策支持系统、商务智能、数据分析以及大数据分析的介绍、

定义和概述。第 2 章将介绍数据仓库的问题、应用和技术。显然,数据是所有分析应用的基

础。第 3 章描述业务报表、可视化技术和应用,然后简要概述企业绩效管理技术和应用——

这是传统 BI 的一个重要话题。

第 4 章介绍预测性分析应用,包括许多常用的数据挖掘技术:分类、聚类和关联挖掘等。

第 5 章关注文本挖掘应用和 Web 分析,包括社交媒体分析、情感分析等相关话题。第 6 章具

22 第 1 章

体介绍了大数据分析。第 7 章将总结本书所有内容,并且介绍目前的趋势,例如随处可见的

无线网络、GPS 设备和其他传感器如何产生海量的新数据和特殊应用。出现了新型的数据挖

掘和 BI 技术,分析这些新的数据,更加深入地理解客户的行为和动向。第 7 章还介绍基于云

计算的数据分析、推荐系统,以及关于安全 / 隐私问题的简单讨论。最后总结了数据分析生态

系统,识别该行业多种类型的参与者以及不同技术和知识背景的学生可能适合的职位。

图 1-6 本书的安排

1.10 资源、链接和 Teradata 大学网络连接

使用下面描述的工具可以提高对于本书学习的效果。

1.10.1 资源和链接

我们推荐下面的主要资源和链接:

数据仓库研究院( ● tdwi.org)信息管理( ● information-management.com)

决策支持系统资源( ● dssresources.com)

微软企业联盟( ● enterprise.waltoncollege.uark.edu/mec.asp)

1.10.2 供应商、产品和演示

许多供应商提供他们产品和应用的软件演示。在 dssresources.com 中有关于产品、架构

和软件的信息。

1.10.3 期刊

我们推荐下面的期刊:

《 ● Decision Support Systems》(决策支持系统)(www.journals.elsvier.com/decision-support-systems)

《 ● CIO Insight》(信息主管视角)(cioinsight.com)

《 ● Technology Evaluation》(技术评估)(technologyevaluation.com)

《 ● Baseline Magazine》(基线杂志)(baselinemag.com)

《 ● Business Intelligence Journal》(商务智能期刊)(tdwi.org)

商务智能、数据分析和决策支持概述 23

1.10.4 Teradata 大学网络连接

本书与 Teradata 大学网络(TNN,参见 teradatauniversitynetwork.com)提供的免费资

源紧密联系。TUN 网站分为两部分:一部分供学生使用,一部分供教师使用。本书每章最

后都有一节提供与 TUN 网站相连。该节包括与特定章节相关资源的链接。此外,我们提供

动手练习,可以在 TUN 上得到相关的软件和其他资料(例如案例)。

1.10.5 本书的网站

本书网站一 是 pearsonhighered.com/sharda,包括按照本书章节组织的补充文本材料。

本章要点

商业环境日趋复杂、快速变化,使决策更加困难。 ●企业必须通过更快、更好的决策,快速响应并适应变化的环境。 ●决策的期限正在缩短,然而决策的全球化本质正在扩展,使计算机 DSS 的开发和使用成为必需。 ●提供给管理者的计算机支持对企业的生存至关重要。 ●DSS 使用数据、模型和知识管理来解决半结构化和非结构化问题。 ●BI 方法利用集中的仓库(数据仓库)进行有效的数据挖掘、OLAP、BPM 和数据可视化。 ●BI 架构包含一个数据仓库、(终端用户使用的)多个商业分析工具和一个用户界面(例如,仪表盘)。 ●许多企业使用描述性分析,采用交互式报表代替传统的平面报告,提供交易数据中的洞察、趋势和模式。 ●预测性分析使企业能够获得预测规则,从历史数据中分析客户现有的行为。 ●规范性分析基于管理科学,帮助建立涵盖预测和优化技术的模型,帮助企业更好地决策。 ●大数据分析着重于非结构化的大型数据集,有时包含大量不同类型的数据。 ●数据分析通常因为具体产业应用名称而被人们熟知,例如运动分析。数据分析也因其他相关名字所 ●熟知,例如数据科学或网络科学。

关键词

BI governance(BI 治理) Business Intelligence(BI,商务智能)

dashboard(仪表盘) data mining(数据挖掘)

descriptive(or reporting) analytics(描述性 intelligence(智能)

(或报表)分析) intelligent agents(智能代理)

Online Analytical Processing(OLAP,在线分析处理) Online Transaction Processing(OLTP,在线交易处理) predictive analytics(预测性分析) prescriptive analytics(规范性分析) Web service(Web 服务)

问题讨论

1. 调查过去 6 个月的文献,分别找出 DSS、BI 和分析的一个应用。在一页纸上总结这个应用,注明来

源并提交。

  在本书付印时,我们校验了书中所有的参考网站都是有效并可用的。然而,URL 是动态的。由于公司改变

名称、被收购或者拍卖、兼并、破产等原因,书中引用的网站可能会发生变化或不可用。有时由于维护、

修复或重新设计等原因,网站会被关闭。许多组织的网站已经不采用“ www”的设计,而一些组织仍在使

用。如果你在连接网站时遇到了上述问题,请耐心等候并使用网络搜索发现可能的新网站。大多数时候,

你能够借助流行的搜索引擎快速地发现新的网站。给你带来的不便,我们提前表示歉意。

28

~

31

24 第 1 章

2. 区分 BI 和 DSS。3. 比较预测性分析、规范性分析和描述性分析。举例说明。

4. 什么是 BI 治理?

5. 讨论实现 BI 的主要问题。

练习

Teradata 大学网络(TUN)和其他的动手练习题

1. 访问 teradatauniversitynetwork.com。利用指导老师提供的注册信息,登录并学习网站内容。你会

收到与网站有关的作业。列出 20 个在网站中你觉得对于你有用的知识清单。

2. 进入 TUN 网站选择“案例、项目和作业”(cases,project,and assignment)。然后选择案例学习:

“ Harrah 从顾客信息中得到的高回报”(Harrah's High Payoff from Customer Information)。回答关于

案例的以下问题:

a. 数据挖掘产生什么信息?

b. 在决策管理中,信息如何发挥作用?

c. 列出被挖掘的数据种类。

d. 这是 DSS 还是 BI,为什么?

3. 访问 teradatauniversitynetwork.com。找到标题为:“ Data Warehousing Supports Corporate Strategy at First American Corporation”的论文(Watson、Wixom 和 he Goodhue),阅读文章并回答下面问题:

a. 公司 DW/BI 项目的驱动力是什么?

b. 实现了什么战略优势?

c. 获得了哪些操作和战术优势?

d. 实施中的关键成功因素(Critical Success Factor,CSF)是什么?

4. 在 http://analytics-magazine.org/issues/digital-editions 找到 2012 年 1 月 /2 月版标题“ Special Issue: The Future of Healthcare.”。阅读“ Predictive Analytics-Saving Lives and Lowering Medical Bills.”的论文,回答下列问题:

a. 应用预测性分析解决了什么问题?

b. FICO Medication Adherence Score 是什么?

c. 如何训练预测模型预测 FICO Medication Adherence Score HoH ?预测模型能够对 FICO Medication Adherence Score 分类吗?

d. 放大图 4 并解释生成的结果应用了什么技术?

e. 根据预测结果列出一些可行的决策。

5. 在 http://analytics-magazine.org/issues/digital-editions 找到 2013 年 1 月 /2 月版标题“Work Social.”。阅读“Big Data, Analytics and Elections”这篇文章并回答以下问题:

a. 论文分析了哪种类型的大数据?对大数据的来源做出评价。

b. 解释集成系统(integrated system)。另一个符合集成系统的技术名词是什么?

c. 项目中使用了哪种数据分析技术?对数据分析产生的一些新提议做出评价。

d. 模型所回答的不同预测问题是什么?

e. 列出一些基于预测结果做出的可行决策。

f. 识别文中未列出的两种大数据分析应用。

6. 在网上查找经理与角色分析扮演的相关材料。你找到了哪些咨询公司、学术机构和项目?展示了哪

些主要领域?选择 5 个涵盖一个领域网站并报告你的发现。

7. 探索 dssresources.com 上的公共区域。准备主要可用资源的列表。阅读本书使你可能参考此网站

上的资料。

32

商务智能、数据分析和决策支持概述 25

8. 访问 microstrategy.com。找到 BI 五种风格的相关信息,用表格的形式总结每一种风格。

9. 访问 oracle.com 并点击 Applications 的 Hyperion 超链接。确定公司的主要产品是什么,将这些产

品与本章所提到的支持技术结合起来。

章末应用案例

Nationwide Insurance 使用商务智能完善客户服务

总部位于俄亥俄州哥伦布市的 Nationwide Mutual Insurance Company 是最大的保险和金融服务

公司之一,拥有 230 亿美元的年收入以及超过 1600 亿美元的法定资产。Nationwide Mutual Insurance Company 通过 100 多家公司为用户提供全面的产品,保险产品包括汽车、摩托车、船、健康、房产以

及农场。Nationwide Mutual Insurance Company 也提供金融产品和服务,包括年金、抵押、互惠基金、

养老金以及投资管理。

Nationwide Mutual Insurance Company 力图通过管理资金与能力提高运营效率,实现收入的增长。

他们意识到将信息战略资产与分析结合使用可以在更加复杂且难以预测的环境中,在策略和操作决策

上超过他们的竞争者。

历史上,Nationwide Mutual Insurance Company 的业务单元独立工作,拥有很高的自治性。这造

成了重复劳动、数据处理环境的巨大差异以及极大的数据冗余,增加了系统开销。这种情况在公司收

购和合并时更加严重。

Nationwide Mutual Insurance Company 使用 Teradata 企业数据仓库技术建立单一权威的环境,维

护干净、一致、完整的数据。这些数据可以被有效分析,以便在客户增长、维持、产品利润、开

销限制以及产品完善方面进行战略和战术商业决策。通过分析来自所有商业单元的干净统一数据,

Nationwide Mutual Insurance Company 将由烟道式数据环境支持的独立商业单元转化成集成单元。

Nationwide Mutual Insurance Company 的 Teradata 数据仓库也从 400GB 涨到超过 100TB,为超过 2500名用户提供企业 85% 的业务支持。

集成客户知识

全国性的客户知识存储(Customer Knowledge Store,CKS)是一个以客户为中心的数据库,将客

户、产品以及超过 48 个外部数据源集成到一个客户数据集市,提供有关客户的一个整体视图。该数

据集市与 Teradata 的客户关系管理应用结合,创建和管理有效的顾客营销活动,这些活动对客户的交

互进行行为分析以便驱动客户管理行动(Customer Management Action,CMA)。Nationwide Mutual Insurance Company 加入了更复杂的客户分析来查看客户投资组合(customer portfolio)和不同营销活

动的效果。这种数据分析帮助 Nationwide Mutual Insurance Company 在人生重要事件中与客户主动沟

通,例如结婚、生孩子和买房子等,对提高客户满意度起到重要作用。此外,通过集成客户联系历史、

产品所有权和付款信息,Nationwide Mutual Insurance Company 行为分析小组进一步建立优先级模型,

识别任何给定时间内哪种交互对一个客户最重要。这使得客户保持率提高了一个百分点,极大地改善

了客户评分。通过使用 CKS,Nationwide Mutual Insurance Company 的年收入也提高了 3%。客户数据

库还有其他用处。通过将客户电话数据从多个系统中集成到 CKS,关系经理试图在发生天气灾害(例

如,台风或洪水)之前主动与客户联系,提供主要投保人信息,并解释索赔过程。这些与其他分析洞

察使 Nationwide Mutual Insurance Company 能够提供极其个性化的客户服务。

金融运作

金融运作也通过集成信息获得了性能上的提高。Nationwide Mutual Insurance Company 分散的管

理风格造成碎片化的金融报表环境,包含超过 14 个总账、20 个账户图表、17 个分离的数据库,12 种

不同的报告工具以及成百上千张电子表格。没有对业务的统一集中视图,导致劳动密集缓慢和不准确

的报表。大约有 75% 的工作量花在了获取、清洗、整合和验证数据上,只有非常少的时间花费在对数

据进行有意义的分析。

33

26 第 1 章

金融绩效管理主动开发了一个新的操作模式,在单一的数据和技术架构上操作,遵循标准报表流

程。这使得 Nationwide Mutual Insurance Company 以世界级的计划、资源管理、风险评估以及其他决

策支持能力运营分析中心,提供准确有效的会计、报表和分析服务。

来自 200 多个业务系统的数据被传送到企业级数据仓库,然后被分配到不同的应用和分析中。这

使得每月结账时间缩短了 50%,从原来的 14 天降到了 7 天。

并购后数据集成

Nationwide Mutual Insurance Company 的目的状态评估管理项目使企业将 Allied Insurance 公司的

汽车政策系统整合到现有系统中。Nationwide Mutual Insurance Company 和 Allied 源系统都是定制的

应用,并不共享任何价值标准或者过程数据。Nationwide Mutual Insurance Company 的 IT 部门决定将

源系统中的所有数据导入一个中心数据仓库进行集成,形成标准的多维报表,帮助 Nationwide 进行假

设分析。Nationwide Mutual Insurance Company 和 Allied 的系统保险费率(premiums)的计算方式不同,

数据分析小组可以识别数据环境中以往无法获知的潜在差异。所有这些修正使公司的投保人受益,使

他们避免保险费率的显著变化。

强化报表

Nationwide Mutual Insurance Company 的遗留报表系统迎合了财产和意外险业务单元的需要,编

译并发送需要的报表给代理需要花费数周。Nationwide Mutual Insurance Company 需要一个更好的销

售和政策信息获取渠道,以到达销售对象。公司选择了单一数据仓库模式,在仔细评估销售管理和个

人代理需求后,选择商务智能平台将动态企业仪表盘集成到报表系统中,使代理和合伙人可以简单地

查看政策信息。这个新的报表系统被命名为 Revenue Connection,还可以使用户在各个层次上交互、

深入地分析信息,消除了生成传统即席报表的需要。Revenue Connection 从本质上消除了人工政策审

计的请求,给业务和技术小组节约了大量时间和金钱。报表只需 4 ~ 45 秒就可以生成,而不是几天或

几周,某些单元的产量提高了 20 ~ 30 个百分点。

章末应用案例的问题

1. 为什么 Nationwide Mutual Insurance Company 需要企业级数据仓库?

2. 集成数据如何驱动商业价值?

3. Nationwide Mutual Insurance Company 采用了哪些形式的分析?

4. 企业数据仓库中的集成数据是可用的,Nationwide Mutual Insurance Company 还可以开发其他哪些

应用?

从章末应用案例中可以学到什么

企业集成信息的合理使用可以获得更好的商业成果。许多组织依赖数据仓库技术进行数据在线分

析,以获得有价值的洞察。这些洞察被用来建立预测模型,通过更准确地分析客户需求使企业进一步

成长。越来越多的企业尝试使用实时数据仓库技术从实时分析应用中获取价值。

来源:Teradata.com, “Nationwide, Delivering an On Your Side Experience,” teradata. com/WorkArea/Iinkit.aspx?LinkIdentifi er=id&ItemID=14714M(accessed February 2013).

参考文献

34

商务智能、数据分析和决策支持概述 27

35

~

36