船舶推荐
租船推荐

多维关联规则数据挖掘在船舶价格 影响因素分析中的应用

2023-03-03 17:04:57  点击:

引言

研究船舶价格的影响因素、掌握船价波动规律对航运企业的船队更新和船舶投资有重要的理论和现实意义.对船舶价格的研究,国外起步较早[1-5] , 我国近年来也取得一些可喜的研究成果[6-9] .BEENSTOCK[1 ] 首次提出利用传统的供需理论对船舶市场进行分析并不适用,并基于资本组合理论构造相应的模型.随后BEENSTOCK等[2] 扩展上述研究,提出运价市场与船舶市场相互关联的理论模型,对世界干散货市场与油船市场分别进行预测.KAVUSSANOS[3 ] 和TSOLAKIS等[4] 分别对干散货市场和油船市场的动态性和二手散货船价格采用时间序列模型、非理论自回归条件异变模型及计量经济模型进行研究.LUN[5]针对贸易、航运与船舶市场建立经验模型,指出船价与运价有直接相关性,而与船队规模和贸易没有直接相关性.李升江[6] 认为影响新造船价格的因素主要括:船用钢板价格、手持订单量、成交量、完工量、拆解量、航运指数、海运量、世界宏观环境、国家宏观政策等,研究结果显示:综合考虑影响供需变化的手持订单和影响造船成本的船用钢板价格能够较好地反映船价的变化.蔡立明[7] 基于计量经济学理论对新造油船和散货船价格进行研究,指出影响新造船价格的主要因有:与资产定价法相关的变量,即二手船价格、期租费率;与基于成本法相关的.变量,即造船成本、汇率;与供应-需求法相关的变量,即供应量占船队的比例、造船生产量.王建华等[8] 研究巴拿马型船舶航运市场的期租水平与其他相关市场的相互影响.朱墨等[9] 则运用双对数回归模型研究新造好望角型散货船价格的响因素,结果表明:二手船价格、新造船成本以及手持订单量与船队规模的比值对新造船价格影响显著.以上文献对船价影响因素的研究,从单一的新造船市场、航运市场入手分析的较多,从综合新造船市场、二手船市场及拆船市场入手研究船价之间相互联系的较少.

数据挖掘中的多维关联规则相对于数理统计方法更适用于船价诱因的分析.关联规则的概念首先由AGRAWAL等[10] 提出.BHANDARI[11] 采用数据挖掘技术对NBA数据进行处理,成功挖掘出有价值的商业情报.寇宇[12] 利用关联规则数据挖掘对电信客户数据进行分析.王宏雁等[13] 将多层多维关联规则应用在交通事故的研究中.郑滨等[14] 、宓为建等[15] 及甘辉兵等[16] 分别将数据挖掘技术应用于海事人为失误致因分析、港口机械结构应力分析及船舶机舱监控系统中.本文尝试运用多维关联规则的数据挖掘技术,对1980—2011年的二手船价格、新造船价格、拆船价格等数据进行深度挖掘,分析3种市场下船舶价格影响因素间的内在联系.

1多维关联规则数据挖掘理论

1.1关联规则的含义

关联规则[10] 的实质是分析数据项集在事务集

合中出现的频度关系,一般定义如下:设I={i1,i2 , …,im}是一项目集,D是一事务数据库,其中每个事务TI.每个事务都有一个标志符,称之为TID.若A是一项目集,当且仅当AT时,称事务T包含A.一条关联规则就是形如AB的蕴含关系,其中AI,BI且A∩B=.简单地说,数据挖掘中的关联规则技术能推导出一种AB的模式,即当A事件发生时,B事件会伴随发生,称为一种A与B的关联关系.

1.2多维关联规则

单维关联规则只涉及数据的一个维度(蕴含式中的每个不同的谓词都称作维).如对某商场的事务数据库,buys(X,“IBM desktop computer”)buys(X,“Sony printer”),表示客户购买IBM笔记本电脑与购买Sony打印机之间的关系,只涉及客户X的一个维度,若引进新的谓词age和occupation,并使用age(X,“20,…,29”)^occupation(X,“student”) buys(X,“laptop”)(其中X是变量,其后跟的引号部分内容为其值,含义为年龄在20至29岁的学生倾向于买笔记本电脑),则涉及客户的多个维度,即为多维关联规则.

1.3支持度和置信度

关联规则设定两项约束,最小支持度(Minsup)和最小可信度(Minconf).

对于AI,如果D中包含A的事务数为s,则称s为A的支持度.若用S(A)表示A的支持度,则S(A)=s.

关联规则AB在D中具有大小为s的支持度,定义为事物集中包含A和B的事物数与所有事物数之比,记为S(AB),S(AB)=S(A∪B)=P(A∪B).

关联规则AB在事物集中的置信度(Confidence)指包含A和B的事物数与包含A的事物数之比.如果D中支持项集A的事务中有C%的事务同时也支持项集B,则称关联规则AB在事务数据库D中具有大小为C的置信度,记为C(AB),C(AB)=P(B|A)=S(A∪B)/S(A).

关联规则的挖掘就是发现数据库中支持度和可信度大于最小支持度和最小可信度的全部规则.

2船舶价格多维数据模型的建立

以Clarksons发布的1980—2011年数据为基础,分别建立新造船价格、二手船价格、拆船价格及船舶市场综合价格多维数据模型.

2.1船舶价格综合数据属性的定义

价格属性指一条船舶价格记录所包含的基本信息以及影响价格的主要因素,这些属性可以通过定性和定量分析得出.2.1.1新造船价格属性

考虑到新造船市场、二手船市场和拆船市场数据的可得性及一致性,选择世界GDP、海运贸易量、运价(或期租费率)、主要造船国汇率、世界钢材价格、船型、载质量和船舶价格因素,对1980—2011年的上述属性数据进行相关性检验,结果显示:在上述影响因素中,世界GDP与新造船价格的相关性最弱,海运贸易量、钢材价格和运价与新造船价格有强相关性,说明世界GDP的变化对新造船价格的影响不如海运贸易量明显;汇率与新造船价格呈负相关性,说明汇率对船价有反作用.因此,新造船价格属性定义为:世界海运贸易量、运价(或期租费率)、钢材价格、船型、载质量、新造船价格和汇率.

2.1.2二手船价格属性

影响二手船价格的主要因素:从船舶自身看有船龄、船舶设备、技术性能;从二手船市场看主要有GDP、世界海运贸易量、运价、新造船价格等.选取GDP、世界海运贸易量、运价、船型、船龄、载质量、新造船价格、二手船价格等8种可量化因素,对1980—2011年数据进行相关性检验,结果显示:GDP与二手船价格弱相关,应剔除;世界海运贸易量、运价和新造船价格与二手船价格有强相关性.因此,二手船价格属性可定义为:船型、船龄、载质量、世界海运贸易量、运价、新造船价格和二手船价格.

2.1.3拆船价格属性

与二手船一样,拆船价格主要受船舶自身状况及外部市场两大因素影响.船舶自身状况包括船舶种类及其老旧程度、船舶技术状态等;外部市场包括船舶市场拆船数量、钢铁行业对拆船钢铁的需求、航运市场需求状况(如运价)等因素.因此,从定性角度分析选取GDP、世界海运贸易量、运价、船型、船龄、拆船价格和钢材价格因素作为拆船价格属性,对1980—2011年数据进行相关性检验,结果显示:GDP与拆船价格呈弱相关性,其他属性均与拆船价格呈强相关性.因此,建模时拆船价格属性选为:船型、船龄、运价、钢材价格、世界海运贸易量和拆船价格.

2.1.4船舶价格综合数据属性

将船舶市场看成一个包含二手船市场、新造船市场以及拆船市场的综合船舶价格系统.船舶价格综合数据模型的属性选取主要考虑3种船舶价格影响因素的共性.从宏观市场看,运价和世界海运贸易

量这2个属性对3种船舶市场的船价都有影响,钢材价格属性对新造船价格和拆船价格都有一定的影响.从船舶自身情况看,3种船舶市场的船舶价格都受船型属性影响,载货量属性对新造船价格和二手船价格都有影响,船龄属性也与二手船价格和拆船价格息息相关.因此,船舶价格综合数据模型的属性选取为:船型、船龄、载质量、世界海运贸易量、运价、钢材价格、拆船价格、新造船价格和二手船价格.2.2新造船、二手船、拆船及船舶综合市场价格

多维数据模型的建立2.2.1概念分层

多维模型中的概念分层定义一个映射序列,将低层概念映射到高层概念上,这样,数据挖掘系统在多个抽象层挖掘关联规则,且容易在不同的抽象空间转换.

概念分层通常采用概念层次树方法.概念层次树是数据库中各属性值及其概念依据抽象程度不同而构成的层次结构.新造船价格属性PONB(Property Of NewBuilding Ship Price)、二手船价格属性POSH(Property Of SecondHand Ship Price)、拆船价格属性POSC(Property Of SCrap Ship Price)及船舶价格综合数据属性POSP(Property Of Ship Price)的概念层次树分别见图1~4.

图1新造船价格属性概念层次树

图2二手船价格属性概念层次树

图3拆船价格属性概念层次树

图4船舶价格综合数据属性概念层次树图1~4中概念层次树分两层.第一层中:

ShipType为船型属性、Load Capacity为载质量属性、FreightRate为运价属性、Seaborne Trade为世界海运贸易量属性、SteelPrice为钢材价格属性、ExRate为主要造船国汇率属性、NBPrice为新造船价格属性、ShipAge为船龄属性、SHPrice为二手船价格属性、SCPrice为拆船价格属性.第二层中:船舶类型属性分为TK(油船),BK(散货船),CT(集装箱船);载质量属性,其中油船分为T1,T2,T3,T4,散货船分为B1,B2,B3,B4,集装箱船分为C1,C2,…,C6;运价属性,其中油船分为TFR1,TFR2,…,TFR9,散货船分为BFR1,BFR2,…,BFR9,集装箱船分为CFR1,CFR2,…,CFR8;世界海运贸易量属性,其中石油贸易分为OSBT1,OSBT2,…,OSBT9,干散货贸易分为DSBT1,DSBT2,…,DSBT9,集装箱贸易分为CSBT1,CSBT2,…,CSBT9;钢材价格属性分为ST1,ST2,…,ST8;主要造船国汇率属性分为ER1,ER2,…,ER6;新造船价格属性分为NBP1,NBP2,…,NBP9;船龄属性分为AG1,AG2,…,AG6;二手船价格属性分为SHP1,SHP2,…,SHP9;拆船价格属性分为SCP1,SCP2,…,SCP9.

2.2.2多维数据模型

采用大多数数据仓库都采用的“星型模型”进行建模,它由事实表和维表组成.事实表中存放大量关于事务的事实数据,维度表是围绕事实表建立的存放描述性数据的表.基于对新造船、二手船、拆船价格属性数据的分析,建立全星型连接结构的数据模型见图

船舶


客服热线
客服热线:021-59117806
24小时手机:13585948634
Copyright © 2022 www.cbtwz.com 上海聿洽实业有限公司版权所有 版权所有 | 沪ICP备2020034403号-1
'); })();