亚太智媒
关闭

亚太智媒APP, 全新登场!

点击下载

构建大数据服务体系

财经

2019-03-11 09:30

摘要: 要改变银行利用现有数据不充分的现状,就必须要建立统一的处理结构化数据、非结构化数据、流数据的存储和加工平台,利用数据分析挖掘技术,在客户服务、风险管理等领域开展实际应用,从而满足银行发展方式和经营机制上深层次变革的需求。

01 前言

数据创造价值,信息引领未来,一个优秀的银行首先应该是数据银行,更是数据分析、数据解读的优秀银行。目前,银行能够通过大量的支付和交易数据获得丰富且宝贵的客户信息,但这笔“财富”并未得到充分利用,BCG分析发现,在全球范围内,有将近70%的客户数据未得到使用,如下图所示。



尽管许多银行已经在培养对客户数据的采集、存储和分析能力,但仍然欠缺足够专业的数据管理团队和高效的动作流程,导致大部分数据难以被有效利用或真正创造价值。

要改变这种现状,就必须要建立统一的处理结构化数据、非结构化数据、流数据的存储和加工平台,利用数据分析挖掘技术,在客户服务、风险管理等领域开展实际应用,从而满足银行发展方式和经营机制上深层次变革的需求。

02 结构化数据处理系统

当前银行业数据处理与应用主要针对结构化数据,其过程就是数据仓库的发展过程。数据仓库平台的建设实现了银行异构数据的集成,银行按照分析主题重组数据,建立产面向全行的一致的信息视图,并在此基础上,结合数据挖掘、联机分析等技术,为实施精准化营销、有效控制银行风险、实现经营资源的优化配置等方面提供了数据基础。



在大数据时代下,要实施有效的精准营销、风险管理控和经营分析,银行不仅要知道客户“做了什么”,而且要知悉“客户为什么这么做”,“客户的真实意向是什么”。因此,数据的全面性就显得尤为重要,只有获取全面的数据,才有可能从这些数据中解读出最完整、最准确的信息,通过数据仓库中的海量数据,建立一定的数据挖掘模型,用于预测客户的产品需求和行为特征,作为后续营销、决策的依据,这将是数据仓库后续主要发展方向之一。数据仓库不仅要具备数据挖掘、分析的能力,而且需要具备将这些数据挖掘、分析结构贯穿到业务流程中实际支持决策的能力,因此,在未来的发展上,数据仓库应能够提升数据服务的时效性,可以基于对实时数据和历史数据的分析,跨越核心业务数据平台和数据库平台,形成两个平台之间的实时互动,指导业务操作。

03 非结构化数据处理系统

随着银行自助渠道和线上渠道的发展,非结构化数据也将逐步增大,据统计,非结构化数据占据互联网全部数据量的85%,如果银行可以结合利用非结构化数据,将能大大扩展银行所掌握的信息和知识,在这样的发展形势之下,对非结构化数据利用的处理需求也越来越多。

银行传统数据仓库以结构化数据为主,进行异构数据的整合、加工,进而提供服务,在大数据时代下,新兴的数据类型不断涌现,更多的呈现出非结构化状态,传统关系型的数据仓库难以满足此类数据的存储及分析需求,因此出现了Hadoop、Spark等新型分布式数据库,相应地,单纯的数据仓库服务体系架构也逐渐向大数据服务体系架构演变。为实现信息价值向经营效益的有效转化,银行需要获取除客户交易信息之外的客户购买行为、社交行为、外部资讯等信息,一方面,可以通过互联网金融等新业务形态的发展,进一步采集除物流、资金流信息以及各种客户行为信息;另一方面可以通过跨行业合作、购买外部数据等方式,引入来自互联网、物联网、电商等渠道的资讯、社交行为、物流、客户电子交易行为信息等丰富的数据资源。这些非结构化数据,可以作为对银行传统数据的补充,使得数据基础更为全面。

04 流数据处理系统

所谓流式处理技术,是针对流式数据的一种分布式、高可用、低延时、具有自身容错性的实时计算技术,它是根据一组处理规则来工作的工具,通过提取和分析来自各个系统的信息,解决银行监控和管理的各种问题。 目前,主流的流数据处理技术主要有Storm、Spark、Streaming等,它们的基本原理是类似的,均对来自各个系统高频度事件流进行分析,根据既定的一些分析规则,对每个独立事件进行处理分析,计算得出所需要的服务信息,用于时效要求的服务场景。


说明:(1)本文为笔者对银监会2018年5月21日发布的《银行业金融机构数据治理指引》(银保监发[2018]22号)的理解,以及多年银行信息化建设从业经验总结而成。(2)文中的配图大多来自互联网上授权图片提供商,并已获得免费使用授权,如果文中内容或是图片侵犯到您的权益,请及时告诉我。(3)由于时间有限,文中难免会出现各种错误,恳请您的批评和指正。