ZETA评分模型的构建数理方法
作者: 来源: 文字大小:[大][中][小]
ZETA评分模型的构建中的数理方法,综合以来,主要有以下几种:
1.判别分析法(discriminant analysis)
判别分析法(discriminant analysis,简称da ) 是根据观察到的一些统计数字特征,对客观事物进行分类,以确定事物的类别。它的特点是已经掌握了历史上每个类别的若干样本,总结出分类的规律性,建立判别公式。当遇到新的事物时,只要根据总结出来的判别公式,就能判别事物所属的类别。
da的关键就在于建立判别函数。目前,统计学建立判别函数常用方法有:一是未知总体分布情况下,根据个体到各个总体的距离进行判别的距离判别函数;二是已知总体分布的前提下求得平均误判概率最小的分类判别函数,也称距离判别函数,通常称为贝叶斯(bayes)判别函数;三是未知总体分布或未知总体分布函数前提下的根据费歇(fisher) 准则得到的最优线性判别函数。
2.多元判别分析法(multivariate discriminant analysis)
多元判别分析法(mda)是除美国外的其他国家使用最多的统计方法。多元线性判别分析法,可以具体为一般判别分析(不考虑变量筛选)和定量资料的逐步判别分析(考虑变量筛选)。但应用多元判别分析(mda)有三个主要假设:变量数据是正态分布的;各组的协方差是相同的;每组的均值向量、协方差矩阵、先验概率和误判代价是已知的。
该种方法的不足之处是必须建立在大量的、可靠的历史统计数据的基础之上,这在发展中国家如中国是难以具备的前提条件。
3.logit 分析判别方法
logit 分析与判别分析法的本质差异在于前者不要求满足正态分布或等方差, 从而消除了mda 模型的正态分布假定的局限性。其模型主要采用了logistic 函数。
该模型的问题在于当样本点存在完全分离时,模型参数的最大似然估计可能不存在,模型的有效性值得怀疑,因此在正态的情况下不满足其判别正确率高于判别分析法的结果。另外该方法对中间区域的判别敏感性较强,导致判别结果的不稳定。
4.神经网络分析法(artificial neural network,简称ann)
神经网络分析法是从神经
心理学和认知科学研究成果出发,应用数学方法发展起来的一种具有高度并行计算能力、自学能力和容错能力的处理方法。它能有效解决非正态分布、非线性的信用评估问题,其结果介于0与1之间,在信用风险的衡量下,即为违约概率。神经网络分析方法应用于信用风险评估的优点在于其无严格的假设限制且具有处理非线性问题的能力。altman、marco和varetto(1994)在对意大利公司财务危机预测中应用了神经网络分析法;coats及fant(1993)trippi采用神经网络分析法分别对美国公司和银行财务危机进行预测,取得较好效果。然而,要得到一个较好的神经网络结构,需要人为随机调试,需要耗费大量人力和时间,加之该方法结论没有统计理论基础,解释性不强,所以应用受到很大限制。
5.聚类分析法(cluster analysis)
聚类分析(cluster analysis)属于非参数统计方法。信用风险分析中它根据由借款人的指标计算出的在样本空间的距离,将其分类。这种方法一个主要优点是不要求总体的具体分布;可对变量采用名义尺度,次序尺度,因此该方法可用于定量研究,也可对现实中的无法用数值精确表述的属性进行分析。这很适用于信用风险分析中按照定量指标(盈利比、速动比等) 和定性指标(管理水平、信用等级等) 对并不服从一定分布特性的数据信息分类的要求。例如,lundy运用该方法对消费贷款申请者的典型信用申请数据及年龄、职业、婚否、居住条件进行处理分成 6类并对每类回归评分,它不仅将借款人进行有效的分类而且帮助商业银行确定贷款方式策略。
6.k近邻判别法(k nearest neighbor)
k近邻判别法在一定距离概念下按照若干定量变量从样本中选取与确定向量距离最短k个样本为一组,适用于初始分布和数据采集范围限制较少时,减小了以函数形式表达内容的要求。另外,knn 通过将变量在样本整体范围内分为任意多决策区间,而近似样本分布。tametal将之用于信用风险分析,取马氏距离,从流动性、盈利性、资本质量角度选出的19 个变量指标,对样本分类,经比较其分类结果的准确性不如lda、lg以及神经网络。原因在于在同样的样本容量下,若对具体问题的确存在特定的参数模型并可能找出时,非参数方法不及参数模型效率高。
7.层次分析法(ahp)
该方法强调人的思维判断在决策过程中的作用,通过一定模式使决策思维过程规范化,它适用于定性与定量因素相结合、特别是定性因素起主导作用的问题,企业信用等级综合评价就是这种定性因素起主导作用的问题。ahp法的基本步骤是:建立递阶层次结构,构造判断矩阵,求此矩阵的最大特征根及其对应的特征向量,确定权重,并进行一致性检验。
8.其他方法
此外还存在着其他众多的方法:probit法、因子(logistic)法、模糊数学方法、混沌法及突变级数法、灰关联熵、主成分分析综合打分法、主成分分析与理想点的结合方法、原蚁群算法、数据包络判别法等等。关于这些方法的应用,将在后面的实证部分进行探讨。