您的当前位置:首页正文

数据挖掘技术在现代审计中的运用

2023-06-26 来源:钮旅网
龙源期刊网 http://www.qikan.com.cn

数据挖掘技术在现代审计中的运用

作者:万红倩

来源:《经营管理者·中旬刊》2017年第03期

摘 要:由于现代信息技术的发展使得审计工作的难度加大,在无纸化交易的过程中难以掌握审计线索。审计人员要从大量的数据中获取有用的审计数据,为了提高工作效率,使用数据挖掘技术对海量的数据进行审查和分析,从而找出可疑数据,降低审计的风险。本文先介绍现代审计过程中使用的数据挖掘技术,然后阐述数据挖掘技术在审计中的运用过程。 关键词:数据挖掘技术 现代审计 运用过程

数据挖掘技术在审计中的功能是传统审计方法无法取代的,它从大型数据库中挖掘先前未知的、有效的信息,并利用这些信息为审计人员提供决策依据。数据挖掘审计是适合现代信息技术的一种新型的审计方法,在实践过程中表现出巨大的优势,保证了审计质量。下面介绍现代审计中使用的数据挖掘技术。 一、审计中使用的数据挖掘技术

1.关联规则分析。数据挖掘中的关联规则分析法用于发现大量数据集合间有意义的关联,且侧重于不同领域中数据间的联系。审计信息系统可以使用关联规则分析法提取数据间的关联特征,从而分析事件间的相关性。审计人员在审计成本数据时,面对大量的人工、材料、机械等方面的数据,无从下手,就可以使用关联规则分析法来分析各成本项目与生产数量间的关联性,然后根据仓库的出入库记录确定生产数量,继而分析被审计成本是否合理。审计人员也可以从已有的审计案例中找出有价值的信息和关联规则,为今后的审计工作提供数据帮助。 2.聚类分析。聚类是把类似的对象组成多个类的过程,聚类的方法有多种:系统聚类法、分解法、动态聚类法、模糊聚类法、运筹法、统计法等,审计人员可以根据被审计单位及业务的不同而采用不同的聚类法分析。聚类分析法可以把无标识数据对象自动分为不同的类,而且可以不受人的先验知识的约束和干扰,获取属于数据集合中原本存在的数据信息。聚类分析是把一批样品或变量按照它们的亲疏程度分类,在审计中可以把特定交易记录群分为不同的特征群,然后找出各个群的特征,对其重点分析,发现审计线索及确定审计风险。比如审计人员对单位的采购业务进行分析,可以依照采购业务的类别进行聚类分析,然后找出审计线索,大大提高了审计效率。聚类分析法摆脱了审计人员的知识局限性,科学合理的把有相似行为的对象聚为一类,对于公司的存货业务及经营费用的审计都有良好的应用效果。

3.离群点检测。离群数据是数据库中与一般数据模型不符合的一些数据对象,可能是由于测量误差、输入错误、运行错误,或数据内在原因造成的。离群点检测就是从大量数据中发现少量的有明显差异的数据,审计人员通过离群点的分析可以发现异常事物的机理,从而确定审

龙源期刊网 http://www.qikan.com.cn

计线索。审计人员在审查销售收入时,可以先根据以往的经验分析销售的基本规律,然后利用离群点技术分析本年度的销售数据,仔细审核偏离正常范围的销售数据,从中获取关键信息和线索。孤立点检测和异常点检测技术与离群点检测技术有异曲同工之妙,都是在大量数据中发现不同于其它数据的对象,然后对其重点分析。

4.序列模式法。序列模式法就是从审计数据中挖掘出被审计单位正常行为和异常行为的频繁序列模式,发现审计数据间的因果关系。审计人员在审计生产领料业务时就可以使用序列模式,先确定生产领料数据中经常以某种规律出现的时间序列模式,这些频繁发生的时间序列模式可以帮助审计人员在构建异常模型时选择有效的统计特征,然后利用这一特征发现异常的生产领料数据,从而确认账目的合理性和真实性,实现审计工作的目标。

5.决策树。使用决策树方法要先从实例集中构造决策树,如果此决策树不能把所有对象进行正确分类,就另外选择一些数据加入到训练集数据中,再重复此过程形成正确的决策集。使用决策树分类的过程就是利用若干个变量来判断所属的类别,代表性的算法有CLS、ID3等。决策树能生成可理解的规则,计算量较小,且输出包含属性的排序,在审计过程中被用于梳理审计记录的特征,使得审计人员非常容易的对所有数据做出一个结论,然后快速准确的确定审计的疑点,解决审计问题。 二、审计数据挖掘的运用过程

1.问题定义。先是定义审计业务问题,确定挖掘对象,明确数据挖掘技术要发现什么问题,解决什么问题。确定审计业务问题是整个过程的基础,是检验最后审计结果的依据。在问题定义时,还需要了解一些先验知识,比如某企业去年的销售数量与销售额之间的关联,某一领域的相关数据间的特征联系等。数据挖掘审计是一个过程,可能出现不同的问题,所以也要尝试使用不同的方法来检验数据以寻求异常数据,发现问题所在。如果挖掘对象是已经被理解的数据,那么挖掘目标就是验证假设的正确性或查看数据规律是否发生了变化,如果发生了变化,就要进行更深层次的挖掘。

2.数据预处理。数据预处理包含三个步骤,分别是数据的选择、数据的清理、数据的集成变换。(1)数据的选择就是在确定挖掘对象后,在与业务对象有关的大量数据中选择适用于数据挖掘的数据。如果数据是从数据库中选择就比较简单,直接选择可用的数据;如果是从分散的数据源中选择数据,就要先把多个数据源中的数据整合到统一的数据库中,协调不同数据间的差异,然后再进行选择。选择数据时要尽可能的采集与审计业务直接相关的数据,当业务关联较多部门时,也要采集相关部门的业务数据从而进行统一的分析。(2)数据的清理程序:填补遗漏的数据、平滑有噪声的数据、识别或除去异常数据、解决不一致问题。现实中的数据经常受噪音数据、遗漏数据、冗余数据的干扰,从而影响数据挖掘的分析结果,所以在数据挖掘前要对数据进行简单的处理,解决数据缺值、定义不一致、数量级不一致等问题。先根据数据的问题情况进行分组,然后采用不同的方法处理,最好是建立一个数据挖掘库,把用到的数据按照类别存放,方便以后数据的使用和处理。在数据挖掘的过程中数据选择和清理的工

龙源期刊网 http://www.qikan.com.cn

作可能要重复好几次,而且工作量较大,审计人员一定要认真对待,切不可马虎行事,以确保后续工作的正确进行。(3)数据的集成变换就是把来自多个不同数据源的数据使用一些方法合并到一起,主要是为了处理因范式分解引起的信息分裂、因数据使用木的不同而引起的数据冗余、因数据结构变换引起的审计模型难以复用、因外部关联数据引起的信息整合问题等。在数据集成变换的过程中需要考虑许多问题,业务范围、经济含义、审计知识等,且随着审计分析的深入而做相应的调整。

3.构建挖掘模型。构建挖掘模型首先要选择模型变量,在全部变量中删掉不重要的变量,缩短构建模型的时间,然后从提前处理好的数据中选择一个子集或样本来建立模型。随机选择的数据可能会引起信息的不足,我们要建立以多个数据样本为基础的挖掘模型。在模型建立后要从准确性、可理解性、性能方面来考察模型实际解决问题的能力。模型的准确性要通过时间来检查,经过一定时间内的大量数据验证才能判断出此模型是否符合实际情况。模型的可理解性要从多方面来考察:数据挖掘人员清楚此模型不同的输入会对结果产生什么影响、模型对复杂数据能产生预测结果,模型对预测结果进行检测。模型的性能通过模型的构建速度和从模型中获取预测结果的速度来考察。

4.结果分析。在数据挖掘结束后要用图形或易于理解的方式对分析结果进行解释和评估,从而为审计人员提供帮助。分析挖掘结果时要考虑以下问题:模型的结果是否比其它模型更为准确、此结果是否优于用不同数据集在模型上的处理结果、能不能达到审计工作的要求等。如果挖掘结果要优于其他模型结果,且达到了审计工作的要求,就说明此模型的建立是有效的,从模型得出的规则关系、风险数据、可疑数据等都是可用的,能为审计人员寻找线索提供帮助。 三、结语

本文先分析了审计中使用的数据挖掘技术:关联规则分析、聚类分析、离群点检测、序列模式法、决策树,然后阐述了审计数据挖掘的具体运用过程:问题定义、数据预处理、构建挖掘模型及结果分析。 参考文献:

[1]梁秀根,黄邓秋,蔡赟等.持续审计结合数据挖掘技术在内部审计中的应用[J].中国内部审计,2015,(12):66-72.

[2]沈虞挺.浅析基于数据挖掘的审计数据质量控制[J].商场现代化,2016,(12):251. [3]刘莎,杨会朴.数据挖掘技术在金融审计中的应用[J].合作经济与科技,2013,(6):83-84.

因篇幅问题不能全部显示,请点此查看更多更全内容