分类与回归数方法:  序言

 

伯克利加州大学 Leo Breiman

斯坦福大学 Jerome H. Friedman

圣地亚哥加州大学 Richard A. Olshen

伯克利加州大学 Charles J. Stone

 

本书所讨论的树型方法论是计算机时代的产物。许多统计方法都是从纸笔来完成计算开始,然後发展到应用计算器完成,再到应用计算机完成。唯有树型方法,不使用计算机,则它的计算几乎是超过想像的。

 

对於许多分类和回归问题,二元树提供了有趣而又形象化的方式来研究数据。但它不应该用来排斥其它的方法。我们也不认为树型方法总是比其它方法好。它们只是为数据分析的弹药库增加了一种灵活的非叁数统计工具。

 

我们对树型方法的理论和实践两方面均作了研究。本书对这两方面均作了概括。前8章大多是探索性的,它概括了树型方法作为统计工具的应用。除第6章是由 Richard Olson写作外,其余均由 Leo Breiman 完成。Jerome Friedman 开发了软件并计算了一些例子。

 

9章至第12章,我们把树型方法放在更数学化的环境下来发展,并证明了一些基本性质。这里的前3章由 Charles Stone完成,最後一章由 Stone Olshen合作完成。

 

像其它的有效数据分析方法如 factor analysis nonmetric scaling 一样,树型方法也是由社会科学家在分析实际数据时发明的。应用树型方法来分析回归问题可追溯到  Morgan Sonquist60年代早期在密西根大学社会研究所开发的AID -互动关系自动探测程序。本书所介绍的研究开发成果在於扩展和加强这些原始的方法。

 

我们的工作开始於 1973 年。 当时,Breiman Friedman 相互独立地作了重复发明,并开始将树型方法应用於分类问题。後来,两人开始合作,并有了Stone 的加入,Stone 在方法论上作了特别贡献。

 

我们对树型方法的不断扩张的热爱及不断产生的新想法在我们之间传来传去,最後由综合成 CART – 分类方法和回归数,并很快形成了写作本书的计划。成书的计划和工作始於1980年。虽然本书的孕育期很长,我们希望这个婴儿在统计社区有健康的表现。

 

本书的结构如下:第15章:用於分类问题研究的树型结构方法论

67章:用於分类问题研究的树型结构方法例子

8章:用於回归问题研究的树型结构方法论

9 12 章: 数型结构方法的理论框架