《武汉工程大学学报》  2013年11 77-80,86   出版日期:2013-11-30   ISSN:1674-2869   CN:42-1779/TQ
建设需求量预测分析中的人工神经网络和多元回归方法


0引言  建设需求量的增加会带来社会的发展,然而,污染问题也会随之而来,深入探讨建设需求量对经济增长以及环境保护具有十分重要的意义.一方面,建设需求量的预测可以为开发商、招标企业和政府的规划发展提供建议.另一方面,建筑业是世界上废弃物产生量最多的行业之一.在中国,城市建筑及拆卸废物(CDW)已达到垃圾产生量的30%~40 %,城市化进程的加快和城市重建产生的大规模建设和拆迁活动是城市废弃物产生的主要原因[1].因此,建设需求量的预测可以为相关部门提供未来的建设需求信息,从而有助于提前制定相关的环保策略.  根据建设经济学,建设需求与消费者投资密切相关,社会总的建筑需求主要取决于投资者投资建设市场的意愿和能力.因此,在预测建设总需求时,可以以建筑安装工程总投资作为预测目标[2].理论分析和统计经验显示,建设安装工程项目投资与国民收入,国民整体消费,商品零售价格指数以及人口数量相关联[3].  在预测模型建立的过程中,适当的经济指标以及预测技术的选取对预测结果的准确性具有重要的影响.人工神经网络是一种非线性数据统计的建模工具,通常被用来建立具有复杂关系的输入数据和输出数据之间的关系模型[3].尽管多元回归分析方法比神经网络更加传统,但是在适当的条件下选用该方法也可以产生相同精度的结果.  欧阳红祥等[4]借助BP神经网络建立了预测材料价格的模型,从而为建筑企业投标报价时正确预测材料价格走势提供了建议.李丽,张海涛[5]利用BP人工神经网络方法对小城镇生态环境质量进行了预测.喻伟[6]等应用人工神经网络来预测建筑能耗和室内热舒适状况,建立了基于GA\|BP网络的建筑能耗和室内热舒适状况的预测模型,为建筑师在设计阶段简单准确地获得设计建筑的能耗和室内舒适状况提供了理论依据.王蓉等[7]以康乐县为研究对象应用多元回归分析对城乡用地面积进行了预测.Victor Kipnis 和Douglas Midthune等[8]对回归分析进行了矫正,并对不同数据结构中的回归方法和两阶段法进行了讨论.杜家龙[9]对我国2012年国内生产总值回归预测进行了实证分析,研究了国内生产总值的主要影响因素及回归预测的新方法,对完善回归预测理论和方法,拓展预测研究思路,增强预测方法的选择性和应用性提出了建议.1研究的目标  本文的目的在于为中国香港和中国内地建设需求量的预测选取合适的变量及预测方法,并分析了这两个地区近年来建筑需求量的发展趋势.研究方法如下:第一,为两地的建设需求量预测分别选择适当的经济变量;第二,利用回归分析的方法确定适合的回归预测模型;第三,运用人工神经网络建立模型.最后,对两种预测方法产生的中国香港和内地的4组预测模型分别进行比较.2数据选择2.1 数据选择——中国香港  由于建设需求和社会经济指标有密切的关联,因此住宅和非住宅建筑的需求可以通过相关的社会经济指标来反映.  对于中国香港而言,与建筑需求量有关的经济指标可以从香港有关部门的网站(如香港房屋署)得到.其中可以用来描述建设需求的经济指标包括人口规模(POP),人均国民收入(NPCI),相对价格指数(PI),它等于居民消费价格指数除以建造成本指数,家庭构成率(HF),工业生产指数(MPI),出口值(EXI),国内生产总值(GDP),政府收入与建设成本指数的比率(GRI),政府开支(GEI),国民生产总值(GNP),个人开支(PEI),国内固定资本形成总额(GFCF),建筑成本指数(CCI),居民消费价格指数(CPI),政府财政收入(GR)和政府总支出(GTS).除了人口规模以外,其他经济指标的单位为百万港币.第11期王颖林,等:建设需求量预测分析中的人工神经网络和多元回归方法武汉工程大学学报第35卷2.2数据选择——中国内地  对于不同地区而言数据收集的方式有所区别,中国内地的建设经济指标来源于中国统计年鉴.根据统计经验和理论分析可知,建设工程安装投资与宏观经济系统有关,其中包括企业,银行和个人的社会行为.因此,一些经济数据,如国民收入,国民整体消费,商品零售价格指数,以及人口等数据可以作为因变量来分析建设需求量[3].  对内地而言,有13种初始变量可供选择,其中包括人口规模(POP),国内贷款(DL),外国投资(FI),自筹资金(SF),人均国民收入(NPCI),相对价格指数(PI),等于居民消费价格指数与建设成本指数的比值,利率(INT),工业生产指数(MPI),出口值(EXI),国内生产总值(GDP),政府收入与建筑成本指数的比值(GRI),政府开支(GEI),国民生产总值(GNP).除了人口规模以外,其他经济指标的单位为亿元.3多元回归分析方法3.1应用多元回归法对香港建设需求的预测  如第二部分所述,在进行多元回归模型(MR)建立时对中国香港而言有15种经济变量可供选择,但需要通过逐步回归模型对其中与预测模型关联度较小的变量进行剔除.确定变量的R2是为了使得该值足够大从而保证该变量能够准确描述模型的发展趋势.T检验则是用于判断该变量是否与模型具有足够的相关性,从而准确地描述预测模型.对于不能准确描述模型走势以及相关性不强的变量应予以剔除.  首先,用SPSS软件对上述15个变量进行相关性分析,从而可以剔除8个相关性较差的经济指标,它们分别是MPI, GNP, PEI, GFCF, CCI, CPI, GR, GTS.  在剩余的7个经济指标中,首先应用POP,NCPI,PI和GRI来构建第一个模型,其中Y是建筑总需求的预测值.在这个模型中,可以得到R2=0.858,这意味着85.8%的总变异可以在这个回归模型中得到解释.当国内生产总值和政府总支出加入模型一之后可以得到第二个模型的R2=0.968,显然这里的R2大于第一个模型.  HF和GEI加入第二个模型后,不仅使得R2增加,T检验的显著性也有所提高,这意味着该模型更适合描述预测数据的走势.因此,POP,GDP,NCPI,GEI,PI,GRI以及HF作为预测模型的经济变量.  数据选择的过程就是将不同的变量分别加入模型,并进行准确性分析,从而得出可选择的适当的变量.对不同变量组合的模型比较后,图1模型对于描述预测值而言具有相对较高的准确度:  Y=66.13XPOP-0.52XGDP+0.66XNCPI+0.95XGEI+1.07XGTS+0.25XPI-0.52XGRI-72.22XHF图1中国香港MR预测模型Fig.1MR forecasting model for HK3.2应用多元回归法对内地建设需求的预测  与对中国香港地区进行建模时所采用的方法一样,第一步是选择与预测值有较强相关性的影响因子.通过SPSS软件对13个经济变量进行分析后,3个关联性较弱的指标(FI,GDP和GNP)被剔除.  在第一阶段中,选择5个经济指标(POP,NCPI,PI,INT和GRI)进行建模,并得到R2=0.859 4,这一数值不具有较强的模型解释力度.将剩余的经济指数进行代入,将建模过程重复3次,并对这些模型进行比较,得到的相对最合适的预测模型如图2.  Y=-397.24+33.84XPOP-0.188XDL-0.014XNCPI+4.759XPI+0.92XINT-3.4XMPI+1.1XEXI-2XGRI+0.87XGEI图2中国内地MR预测模型Fig.2MR forecasting model for Mainland China4人工神经网络分析法4.1利用ANN在中国香港的建设需求预测  确定隐藏层节点的数量是人工神经网络预测模型建立过程中的难点之一[4].如果隐藏节点太少,那么模型的准确性会受到影响,如果节点过多,则会导致网络训练过度并影响模型的特性.  在运用ANN对中国香港的数据进行预测的过程中发现,设置5个输入变量,每个隐藏层建立4个节点的模型可以达到预测目标的准确度.通过训练可知,对于香港地区的数据而言,最佳的网络结构是5\|4\|1,即网络的输入节点数目是5,隐藏节点的数量是4,同时只有一个输出值.  可得R2= 0.99,因此可以明显看出人工神经网络对数据的训练与实际数据的贴合度较高,能够很好地解释数据的发展趋势,见图3.图3中国香港ANN预测模型Fig.3ANN forecasting model for HK4.2利用ANN在中国内地的建设需求预测  对于中国内地的数据而言,有9个输入指标,因此输入层具有9个节点.经过反复训练可知,一个隐藏层中设计6个节点得出的计算结果具有较高的准确性.因此,内地预测数据的最佳网络结构是9\|6\|1,表示输入节点的数目为9,隐藏节点的数目是6,且只有一个输出.  经过网络训练可得判定系数R2= 0.96,这意味着ANN建立的模型可以解释预测数据96%的总变异.虽然这里的R2=0.96与回归模型计算的R2=0.958几乎相同,但ANN模型所产生的数据趋势图大大优于回归绘制的结果,见图4.图4中国大陆ANN预测模型Fig.4ANN forecasting model for Mainland China5模型比较  首先,通过多元回归模式,将中国香港和中国内地两者之间的预测结果进行比较.正如上述步骤计算出的结果,中国香港和中国内地的R2分别为0.97和0.958,相差仅为0.012.这表明通过回归模式,在发达地区和发展中地区得出的结果几乎是一样精确的.  第二,使用人工神经网络比较中国香港和中国内地的预测结果.通过人工神经网络模型得出两个地区具有不同的R2,中国香港和中国内地分别是0.99和0.96.我们可以看出,虽然对香港预测时采用的数据量少于内地,但是模型偏差比内地更小.  第三,在多元回归模式和人工神经网络模型基础上对香港的预测结果进行比较.对于中国香港来说,很明显可以看出由人工神经网络的拟合模型远远优于回归方法.这两个模型的预测准确度可以通过偏差值反映出来.人工神经网络和回归模式的R2分别为0.99和0.97.虽然这两种模式都能够产生准确的预测结果,由于中国香港地区的房地产市场处于不稳定波动状态,人工神经网络模式在描述具有非线性关系的数据时具有明显优势,因此ANN产生的预测数据走势比回归分析模型具有更好的拟合度.  最后,将多元回归模式和人工神经网络预测对中国内地的预测结果进行比较.对于中国内地而言,无论是通过回归分析模型或人工神经网络方法,所产生的偏差几乎是一样的.由于中国的房地产市场相对稳定,呈现出了逐渐上升的趋势.因而,两种方法在预测时都可以得出较准确的结论.6结语  在预测的过程中,合适的经济指标的选择对于预测结果的准确度具有至关重要的影响.例如,对于中国香港而言,约有15个与建设需求相关的经济指标可供选择,然而,根据回归分析法和人工神经网络的特性,一些关联性不高的变量要予以适当剔除.  本文用两种不同的预测方法对中国香港和中国内地的建筑需求量进行分析,产生了4个不同的模型.从理论上讲,由于神经网络模型内在特性,输入和输出变量之间的非线性关系可以自动获得,因此,神经网络模型与回归模型相比可能产生更加精确的结果.中国香港的数据分析的例子便可证明这一判断.但对于中国内地而言,两种方法产生了精确度几乎相同的结果.从中国香港及中国内地的预测结果中可以看出,在未来几年里,建设需求量呈增长趋势.这意味着虽然未来的经济发展趋势良好,但也将会有更多的建筑垃圾产生.因此,有关当局应采取一些有效的措施来处理和回收不断增长的建筑垃圾,从而保护环境、节约能源.致谢  感谢国家社会科学基金委员会的资金支持.