经济统计工作中数据挖掘技术的应用分析

引言:斗转星移,历史变迁。经济不断进步中,我国经济统计数据中一些问题凸显,如果沿用旧的的经济统计数据方式,对经济发展探索和决策极为不利。不能深层次开展统计数据的分,使得经济数据中的潜在关系,没有办法发掘。所以,在传统的统计数据中下使得处理方式不断更新,实现经济的决策促进,有着重要意义。本文主要对数据挖掘技术概念和产生进行了阐述,并且对在经济统计方面的应用展开了详细的分析。

经济统计工作虽然一直在进行,但是其中存在着多反面的问题。在经济统计分析方面有着数字汇总简单罗列的问题,非常不利于统计部门依照统计结果做出科学的决策。这就要求新形势下的经济统计工作进行深度的数据挖掘,不断适应新的经济统计分析需要。

一、数据挖掘技术内涵

经济社会的发展,使得经济工作中,需要分析的经济数据增多。在对经济分析需求增大的条件下,数据挖掘技术营运而生。经济统计工作中的数据挖掘技术,是一种在不全面的、

模糊的、随机经济数据中,分析得到潜在信息,接着对获取的数据展开分析和转换。这些数据在经过专门处理之后,应用于企业和者政府相关的决策。这种经济统计扥西方法,适应了社会中采集的数据量变大,处理信息量变大的现实。数据挖掘,实质是研究交叉的、比较复杂的学科。数据挖掘包括:知识获取、统计学、知识库系统、数据库技术、模式识别等。数据挖掘技术在发展方面经过了一个长时间的过程::数理统计阶段、人工智能阶段、机器学习阶段。

在社会发展过程中,经济统计数据规模越来越大,人们、企业以及政府由于对经济发展的需要,所以对其质量要求比较高。但是传统的经济分析方法存在着明显的弊端。由于传统的数据统计方法里,数据之间之间的潜在关系没有涉及分析,所以无法为企业和政府经济决策实现关键有效决策提供关键信息。因为传统的统计分析方法中,使用的是效率比较低的计算方法,无法满足社会发展中的需要,并且分析的质量也没有办法得到保证。现实中存在的问题,也没有办法得到有效解决,数据挖掘的方式通过信息技术的分析,可以发现数据中的潜在关系,分析出人们无法单凭感官不能实现的数据和信息之间的关系。实现了传统数据分析中的问题解决,数字挖掘技术正是为了克服上述问题而产生并发展的,利于政府和企业进行经济的决策。并且在信息技术不断发展的今天,数据挖掘技术水平也在不断提高和发展。

二、数据挖掘技术的应用

1、预处理

实际工作中,数据可能在收集的过程中有缺漏,关键信息不完整。所以在进行挖掘分析之前,对数据进行有效地预处理,对于减少分析的偏差有着重要作用。总的来说,数据的预处理有四个部分。

1.1数据的完善

数据的完善,主要是把数据中存在不一致、缺损和噪声清除掉,目的是提升数据在整体有效性方面的质量。通常使用的方法是——预测法、平滑法、均值法等统计法,主要根据实际情况中的差异,来抉择使用的方法。预测法,使用在推断噪声的数据和空值中,能够得到最有效的统计数据,目的是处理数据缺损。平滑法讲究将n个数据,在经过加权平均后得到的数值,作为替换数据。均值法是将n个不为空的数据,在经过数值的平均计算后的平均值,作为最终数据。平滑法和均值法也作为数据的降噪使用[1]。

1.2数据集合

数据的集合就是数据集成过程。一般的数据在收集的时候,主要是由地方统计局收集通过各种途径收集,在收集之后要对这些多重多样的数据进行集成。因为这些数据挖掘的范围不同,需要通过一定的手段,使其成为一个有效地整体。在数据集合的过程中,会产生一些问题。例如,不同数据源数据中的互相匹配问题,也就是数据的模式集成问题。除此之外,不同数据之间还会产生一些差异导致的互相排斥,这些数据中的冲突需要消除。还有数据的

冗余问题,也就是假使一部分的属性可以被其他数据库中数据属性推断的得到,数据集成中就出现了冗余的问题。

1.3数据的变换

数据的变化,主要是采用一定方式,把数据变换成和其相当,并且将适合信息挖掘出来的形式。具体变换有两种,一种是规范化,一种是泛化[2]。规范化,主要构成是零均值的规范化、最大最小情况的规范。泛化,就是把数据层和层次使用较高层次概念将其替代。

1.4数据的概念分层

现实中的数据有着一些明显的特点,连续性就是其一。但是在爱实际已经应用的算法中,能后对连续性数据处理的还较少数据的离散化,也就是采用区间的划分,来代替某一些实际数据,得到真实的连续数据。概念分层的意思主要是使用有效的高层概念来代替一些收集量较少的数据[3]。

2、关联规则和决策

2.1关联规则

在实际的数据挖掘领域中,整个过程采用对集合里的关联、频繁模式和因果结构开展查找,目的是找到那些不被注意,或与人们日常认知习惯背离的事件。在经济统计中,数据关联的挖掘,可以分析出一个大概的范围(例如,国家范围、省范围、市范围)关系比较密切一些行业。在进行数据分析的过程中,不少的属性之间实际的关系被人们所知晓。这些属性被称作平凡规则。例如,工业总产值的提升,带来了生产总值的提升。利用关联性原则,可以使不同属性的数据,通过分析之后,得到相关联系属性。

2.2决策

数据分类构成是两个步骤:第一,决策树模型的形成,也就是采用训练集来得到一棵决策树,来实现经济统计数据决策的构建和精化。第二,把输入的数据在决策树的指导下,开展分类的处理。在数据输入决策树的时候,数据会由根节点,在属性值依次开展测试。最后到达叶子终端的节点,来达到寻找记录所在类的类别[4]。总的来书,决策树算法基本是递归过程的一种,数据的分类一直可以延续到终止条件结束。

结语

经济的快速发展,使得经济统计工作各部分之间关系密切,使得经济统计分析的难度加大,数据挖掘能够分析出事物内部之间的联系,并且揭示出隐含的、未知信息。数据挖掘统计分析在使得经济统计工作更加科学和有效,获得不断的进步,为我国社会经济发展,以及国家财富积累发挥积极作用。技术就是通过发觉而使得经济统计工作能够得以有效运行。

参考文献

[1]崔丹.数据挖掘技术在经济统计中的应用探索[J].财经界,2014,(5).

[2]毕春杰.数据挖掘技术在经济统计中的应用探究[J].经济视野,2013,(24).

[3]韩秀荣.试论数据挖掘技术在经济统计中的应用[J].商品与质量·学术观察,2013,(12).

[4]王康.关于数据挖掘技术在经济统计中的应用[J].财经界,2011,(10).

(作者单位:河北唐山市燃气集团有限公司)

推荐访问:统计工作 数据挖掘 分析 经济 技术