工行:信息化银行大势下的大数据之路
来源:《中国金融电脑》杂志
2013年,工商银行全面启动信息化银行建设,其中,基础性的工作就是打造大数据基础平台并建立大数据分析挖掘服务体系,着力于推动包括“两大平台、三个视图、四项服务”的大数据分析挖掘服务体系的落地实施;从基础建设、经营、管理和措施机制等四个层面推进信息共享、系统整合与业务联动。
大数据在大型商业银行的应用可以追溯到8~l0年前,大数据为银行IT系统建设带来了开放、聚合、互联与智能的理念,也取得了一系列丰硕的应用成果。在新的技术背景下,加强对大数据技术的掌控,将科技创新与业务创新相融合,最大限度地发挥信息创造价值的力量,已成为银行转型发展的一项重要推动力。工商银行正在实施信息化银行建设,其中一项基础性工作就是研发新一代的大数据基础平台,打造大数据分析挖掘服务体系,通过对海量结构化、非结构化数据的整合、挖掘、共享,为业务发展提供动力。
一、工商银行大数据体系建设历程
经过20多年的建设发展,工商银行实现了信息科技大集中和客户服务电子化、业务运营集约化、经营管理精细化,推动了国际化和综合化发展,达到了银行信息化的目标,IT系统为全行结构调整与经营转型提供了强大的推动力。在2002年完成数据大集中后,工商银行启动了数据仓库及各类数据分析系统建设,利用数据提升管理效率和推动业务发展,陆续实现了大数据的多项创新应用,如客户统一视图和评价、全行绩效考核管理、全面风险管理、智能营销等,以数据仓库建设为代表的结构化数据管理和应用已相对成熟。
为积极应对内外部形势变化,实现经营管理转型,工商银行2013年全面启动了信息化银行建设,从基础建设、经营、管理和措施机制等四个层面推进信息共享、系统整合与业务联动。在基础建设层面,开展了大数据分析挖掘服务体系的规划和落地实施,制定了开放、共享的架构规划。一方面继续充实数据仓库的数据和模型,深入结构化数据分析挖掘在各个业务领域的应用;另一方面着手组建分析师队伍,建设以非结构化数据为主要分析挖掘对象的集团信息库,重点打造“两大平台、三个视图、四项服务”,借助大数据技术和优秀的分析师团队,将数据价值提升为银行的经营核心和创新动力。
二、打造大数据分析挖掘服务的基础平台
在结构化数据分析挖掘领域,工商银行数据仓库已经纳入200多个应用的业务数据,数据范围覆盖境内外分支机构、综合化子公司,既包括银行内部产生的客户信息、交易明细、业务过程数据,也包括部分外部采集数据,并不断根据业务分析要求,丰富数据处理模型,推出了多种数据分析工具,实现了全集团结构化数据的集中共享、分析挖掘和信息联动必要的时候网站也需要申请ssl证书,对网站有安全作用。
在非结构化数据分析挖掘领域,工商银行规划建设了集团信息库,包含信息检索平台和大数据分析挖掘平台两个子系统。在信息检索方面,2013年推出了名为“ICBC搜索中心”的搜索引擎,采用云计算、语义识别、智能分析等技术,对分布存储在各类应用系统中的非结构化数据(如内部新闻、外部资讯、规章制度、知识文档等)进行统一检索,将搜索引擎嵌入到各个专业系统中,还实现了按照员工角色和工作需要自动定制和推送信息。在信息挖掘方面,工商银行在传统的、面向结构化数据的数据仓库技术体系之外,搭建了全新的大数据分析挖掘平台,使用分布式存储和计算技术对以非结构化为主的数据进行清洗、存储和加工处理,使用文本分析工具、数据挖掘工具进行分析挖掘,陆续推出了网银客户行为分析、电商客户偏好分析、微博及其他社交媒体数据分析等新的数据服务。
大数据平台建设的意义绝不仅仅反映在存储大量信息,而是在于通过对海量数据的快速处理,实现基于海量数据的增值服务。工商银行围绕数据仓库和信息库,一方面继续完善元数据的统一管理和视图展现,采取贴近业务视角的方式对数据进行“产品化”的包装,提升数据使用的易用性,减少数据“沉没率”;另一方面,通过统一视图整合了信息检索、信息定制、数据分析挖掘等服务功能,采用构件方式将数据分析挖掘服务直接嵌入到客户营销、经营分析、风险管理等专业系统中,将信息提供给全集团共享使用,为市场分析、精准营销、客户服务、风险控制等应用提供数据服务,进一步发挥海量数据的价值,真正实现数据驱动。
三、提供面向业务系统的大数据应用视图
工商银行通过建设大数据基础平台,增强了对不同结构、不同来源数据的整合能力,在此基础上,进一步推出了客户信息视图、业绩视图和指标库视图等一系列面向业务人员的数据视图,将不同领域、不同结构、不同展现形式的数据,以视图的形式集中提供给主要的、典型的业务岗位,辅助业务人员和管理部门在日常工作中快速获取可靠的数据。
1.客户信息视图
通过共享前中后台的客户反馈信息和服务信息,构建以客户为核心的360度全景视图。在利用数据仓库整合客户基本信息、资产状况、交易信息、评价信息的基础上,进一步丰富完善各类非结构化信息,特别是补充完善客户在柜面、电话银行、网上银行、移动终端、电商平台、社交媒体各个渠道的服务记录和营销日志,从而有针对性地提供服务和开展营销,使客户在线上线下各个渠道都得到一致的服务体验,支持银行经营模式从“以产品为中心”向“以客户为中心”转变。
2.业绩视图
通过详细分析网点负责人、基层员工、总分行各层级管理人员等典型岗位每天必须关注的结构化信息和非结构化信息,为典型岗位分别研发了网点业绩视图、员工业绩视图、管理层业绩视图,实现了面向不同岗位的信息整合和融会贯通。如网点负责人更关注网点的整体经营、产品销售、市场营销、客户挖掘、渠道优化等内容,员工更关注产品的销售情况、管户的销售业绩等,总分行的管理人员更关注本机构的整体经营、客户营销、产品透视、渠道管理、风险控制、资源配置等内容。此外,还创新推出了个人信息定制服务作为统一视图的补充,让每个员工能够在全行共享的管理信息“云”中挑选自己关注的结构化和非结构化信息,实现信息定制和自动推送。
3.指标库视图
经过多年的系统建设,工商银行在数据仓库及各个业务系统中积累了大量的统计指标。为进一步提升指标信息的服务能力,启动了全行统一指标库建设,在大量业务指标中选取使用频率高、综合概括性强、统计口径相对稳定的指标,梳理这些指标的定义、口径、名称、来源和参照等信息,实现集中展现和检索。指标库的检索功能嵌入到各业务系统中直接使用,从而为各系统提供标准、集中、共享的指标信息服务,利用统一、权威的指标口径驱动业务决策。
四、推出面向分析师的大数据分析挖掘服务
在大数据的背景下,数据分析挖掘工作打破了“业务需求编制、开发、测试、投产”的传统项目研发模式,今后将更多地表现为“模型讨论、数据准备、模型训练、结果分析、成果反馈”的周而复始、快速迭代的过程。让数据说话靠的是模型,模型来自思想。工商银行在总、分行组建了分析师队伍,培养专业的大数据分析挖掘人员,依托大数据基础平台在各业务领域中开展数据分析挖掘实践。重点推出了以下四项服务,支持分析师们从事数据分析挖掘工作。
1.通用查询服务
利用数据仓库基础设施云,提供结构化数据的通用查询服务,以业务语言透明展示数据仓库中保存的各类业务数据、指标、模型,让各级用户在各自的权限范围内能够自主挑选业务数据和业务指标,创建模型,以自助服务的形式,满足各类结构化数据的分析挖掘需求。通用查询服务可以通过网页集成的方式,嵌入到各营销、风险、分析业务管理系统。
2.特色批量服务
基于数据仓库的基础设施云,向各分行分享基础数据和计算资源,让各分行能够按照各取所需的原则,通过自定义,以自助服务的方式,按一定周期运行当地特色的数据挖掘分析程序。
3.信息检索服务
利用信息检索平台,在各个应用系统中直接嵌入统一的信息搜索引擎,为行内用户提供结构化和非结构化的信息检索服务。利用该项服务,行内用户能够以统一的用户界面和操作方式,检索各类资讯、知识,共享银行通过各个渠道获取的信息资源,实现信息的融会贯通。
4.大数据分析挖掘服务
丰富非结构化数据的积累,研究和充实大数据分析挖掘的业务模型,将非结构化数据和结构化数据结合起来,提供可视化的分析挖掘服务,以图形展示分析结果。目前实现了系统访问日志分析、舆情分析、文本挖掘、客服记录分析等服务,相关分析成果已经应用在工商银行网银栏目视图优化、电商平台商品配置优化和客户商品推荐等场景中。
综上,当前工商银行大数据分析挖掘服务体系建设的重点可以归纳为“两大平台、三个视图、四项服务”。结构化数据和非结构数据的深入综合利用,是一项需要持续开展的工作,特别是非结构化数据的使用,目前仍处于探索阶段,需要业务部门和技术部门的深度融合,共同寻找大数据的应用场景。解决好“数据在哪里?怎么用数据?”这两个问题任重道远。