您现在的位置:>>>首页>>>保险理论>>>保险经济学
数据挖掘技术在保险业中的应用
邹广普

  数据挖掘广泛应用

  许多企业用了很大力气去积累有关客户的信息,但是并不能有效地进行客户关系管理,因为信息只是一些原材料,经过组织、分析并理解后,才可以用来构建成有关客户的知识。而数据挖掘技术就可以完成对信息的处理。

  数据挖掘(DM),又称数据库中的知识发现(KDD),是指从存放在数据库、数据仓库或其他信息库中的大量数据中自动地发现相关模式、提取有潜在价值的信息、挖掘知识的过程。从CRM的角度来说,数据挖掘应用就是从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的知识和规则,并能够根据已有的信息对未来发生行为作出结果预测,为企业经营决策、市场策划提供依据。 

  目前,数据挖掘工具和软件已在各个行业得到很好的应用,并收到明显的效益。举例来说,在金融方面,银行的预测存/贷款趋势、优化存/贷款策略可以用数据挖掘将市场分成有意义的群组和部门,从而协助市场经理和业务执行人员更好地集中于有促进作用的活动和设计新的市场运作;在客户关系管理方面,数据挖掘能找出产品使用模式或协助了解客户行为,从而可以改进通道管理,如银行分支和ATM等,又如正确时间销售就是基于顾客生活周期模型来实施的;在零售业/市场营销方面,是数据挖掘技术应用最早,也是最重要的领域,可以用于顾客购货篮的分析,了解货架如何布置,选择较好的促销活动时间以及促销商品组合等。通过对一种厂家商品在各连锁店的市场共享分析,客户统计以及历史状况的分析,可以确定销售和广告业务的有效性。可见,数据挖掘在各行各业都有很多相应的例子,不再此一一列举了。总之,数据挖掘可广泛应用于银行金融、零售与批发、制造、保险、公共设施、政府、教育、远程通讯、软件开发、运输等各个企事业单位及国防科研上。据有关报道,数据挖掘的投资回报率有达400%,甚至10倍的事例。

  保险业需要数据挖掘

  随着国内经济的快速发展,保险业也进入了激烈竞争的时代。面对大量产生的保单业务,许多业内公司没有对大量的数据进行深层次的分析和挖掘,让海量数据发挥巨大的增值作用。其业务仓库中的数据组织方式是满足范式理论的,反映了业务上的组织方式,但与业务系统有本质不同。首先,它是为将来分析应用而设计,以信息的表示、提取为主导;其次,业务数据仓库中的数据是经过清洗的,且保存了所有的业务历史信息,最大限度地保证了数据不失真。

  例如:从车辆险的历史保单数据库中,按照车辆种类、销售渠道、地区、职业、年龄、性别、学历、业务性质等条件分析出承保和理赔的数据。根据客户的盈利性分布,通常呈现出价值倾斜:20%的客户往往产生200%的客户利润,而另外20%的客户产生的是损失价值,剩余处于中间的客户对公司不产生任何的利润。因此从业务数据挖掘的目标就是分析导致客户价值分布差异的原因。

  初期分析的主要用户为项目相关的技术用户和操作用户。其中,决策管理层用户约5至15名,分析型用户15至30名。一般来说,保险公司有较高的数据分析要求,原始数据的规模已经较庞大,超过几百GB,可考虑根据实际需求情况和应用的目标,采用集中式实施的方案。即在总公司建立一套的数据仓库系统,为产寿险总公司和各分公司的用户提供服务,但用户的权限要进行限定,分公司的用户只能浏览本公司的数据,主要是基本信息的获取,而总公司利用全部数据来做高层次的综合分析,包括对所有分公司数据的操作权限。

  如何在保险业应用数据挖掘技术

  明确商业目标。应用数据挖掘的首要任务就是明确需要达到什么样的商业目标,并描述出需要解决的问题。目标的描述应该细化、清楚,以便于选择合适的挖掘方法,也方便检测数据挖掘效果,判断建立的模型有效性。

  数据准备。基于数据挖掘的商业目标,提取所需要的数据。为了保证数据的质量,除了对数据进行必要地检查和修正外,还需要考虑不同的数据源之间数据的一致性问题。

  建立模型。建立模型是一个反复的过程。首先需要选择适合解决当前问题的模型。对模型的选择过程可能会启发对数据的理解并加以修改,甚至改变最初对问题的定义。

  输出结果的评价和解释。模型建立好之后,必须评价其结果,解释其价值。在实际应用中,模型的准确率会随着应用数据的不同而发生变化。但准确度自身并不一定是选择模型的正确评价方法。对输出结果的理解需要进一步了解错误的类型和由此带来的相关费用的多少。如果模型每个不同的预测错误所需付出的代价(费用)也不同的话,代价最小的模型(而不一定是错误率最小的模型)将是较好的选择。

  直接在现实世界中测试模型很重要。先在小范围内应用,取得测试数据,觉得满意后再向大范围推广。

  实施。模型在建立并经验证之后,可以有两种主要的使用方法。一种是提供给分析人员做参考,由他通过查看和分析这个模型输出,并作出解释和方案建议;另一种是把模型应用到不同的数据集上。模型可以用来标示一个事例的类别,给一类客户打分等,还可以用模型在数据库中选择符合特定要求的记录,以用其他工具作进一步分析。

  保险市场的激烈竞争导致了面向市场营销和客户服务的数据仓库的建设以及数据挖掘技术的应用,本文在介绍了数据挖掘技术的基础上,重点阐述了保险公司针对车辆险的数据挖掘,以及基于车辆险分析平台展开数据挖掘的过程和数据挖掘的主题分析。我们对各种技术应用的最终目的是实施以客户服务为中心的客户关系管理和以销售为导向的产品推广及营销战略。在目前应用的情况下,继续在数据仓库的基础上,为多个重点地区和主要险种的业务数据实施多主题数据挖掘,揭示出对业务发展具有指导意义的经验和内在规律。

  数据挖掘(DataMining)是一个应用统计学和人工智能等算法进行知识发现的过程。本文在车辆险的基础上重点探讨了保险行业如何利用数据挖掘的技术,包括数据仓库的建立、数据挖掘主题的定义和数据挖掘的过程。

  随着数据库技术的成熟和数据应用的普及,人类积累的数据量正在以指数速度迅速增长,而数据挖掘技术就是从数据中发现知识。数据密集型行业,如保险、银行、电信等经过多年运营沉淀了大量的数据。挖掘、开发和利用这些数据可以使企业作出最适合的定位,将企业长期积累的数据得以充分发挥,从而让企业在竞争中取得优势。

  

(原载中国保险报)
 
更新日期:2010/3/11
阅读次数:1513
 
上一条:陈天翔  通胀预期对保险业的负面影响明显
下一条:蔡秋杰  企业保险需求的功能视角
 
 【我想发表评论】   【将文本推荐给好友】    【关闭窗口】
 
 
邹广普  数据挖掘技术在保险业中的应用
 
关于我们 网站声明 联系我们

建议使用IE4.0以上800*600浏览器访问本站 
版权所有©2000:国发中心金融保险网
本网站所有内容,未经国发中心金融保险网书面授权,不得转载、摘编,违者必究。
网站管理chinagfc@chinagfc.com
【Top】