您好,欢迎来到化拓教育网。
搜索
您的当前位置:首页数据挖掘技术分析及其在高等学校教务管理中的应用

数据挖掘技术分析及其在高等学校教务管理中的应用

来源:化拓教育网
维普资讯 http://www.cqvip.com 《经济师}2008年第7期 摘要:“信息孤岛”和“数据爆炸但信息贫 乏”的事实已经开始影响人类的进步和发展,难 道没有什么办法让我们从几乎爆炸的数据中找 到我们需要的信息吗?神奇的“啤酒搭着尿布 卖”的事件就提醒我们要对数据进行挖掘。文章 通过对数据仓库、数据挖掘技术和决策支持系 统的研究,提出了基于数据挖掘的高等学校教 务管理决策支持系统。该系统能为高等学校教 务管理提供科学的依据并指导其发展方向。 关键词:数据挖掘决策支持系统数据仓库中图分类号:G640 文献标识码:A 文章编号:1004—4914(2008)07—103—02 ●高校园地 数 术分析及其在高等 镪帕应用 ●张决策树 乾 存等;(3)前端服务:面向用户的数据需求,完成数据提取和计算分析等 功能。 随着我国高等教育事业的迅速发展,高等学校的办学规模在不断地 扩大,招生人数也在突飞猛进,教务管理的人员技术和质量却仍然没有 很大的改善。同时,教务管理人员的事务相对以前有增无减,加上教育方 式更加灵活多样等,这样高等学校教务管理的问题越显突出,学生人数 的急剧增加、教学资源日趋紧张、教务管理手段落后的现象在全国随处 可见,很多高等学校在教务管理方面不断地尝试改革,给高等学校的教 务管理既带来了前所未有的发展的同时也带来了新挑战。根据经济原 则,高等学校如何以最小的代价获得最好的管理效果成为了新的研究课 题。 高等学校要从管理的最高角度出发,总体把握目前的、将来的、宏观 的形势,解决目前存在的问题,预见潜在的问题,优化资源配置,提高管 理效率。在信息时代的今天,构建一个有效的高等学校教务管理决策支 持系统(Decision Supporting System,简称DSS)的重要意思就不言而喻 了。一个良好的系统除了能支持日常简单的查询、统计、协调学校各项工 作顺利开展外,还应该为高等学校决策提供有关教育形势的变化、发展 趋势以及通过高科技手段来对历史数据进行挖掘,提取出隐含在数据背 后的人的行为,预见未知的、潜在的、深层次的、有价值的趋势,为学校的 教务管理和教育决策提供有利的信息。 建立DSS时,一般都要用到数据库DB(Database)技术,但这种传统 的DB技术目前不能很好地进行数据的合成、分类等,其它更高的要求 就更显得困难了。同时,为进行高效的数据分析,信息就必须与决策密切 相关的主题组织起来,这时传统的DB就显得力不能及了。在专家学者 的研究下,数据仓库技术的出现给这类决策支持系统带来新的希望,这 种技术把人们需要的信息从原始的数据中挖掘出来,把零散的、分散的、 难以访问的原始数据进行数据转化为集中统一、随时可访问的信息,同 时对数据进行清洗,即数据仓库对信息实现合理、全面而高效的管理。因 此,数据仓库和它的相关技术并应用于高等学校教务管理决策支持系统 中是举足轻重的。 2、开发数据仓库的流程。开发数据仓库的流程包括以下几步:(1)建 立开发数据仓库工程的目标及制定工程计划;(2)建立技术环境,选择实 现数据仓库的软硬件资源;(3)根据决策需求确定主题,进行数据建模, 选择数据源,对数据仓库的数据进行逻辑结构设计:(4)设计数据仓库中 的数据库,基于用户的需求,着重于某个主题,开发数据仓库中数据的物 理存储结构,即设计数据结构的事实表和维表;(5)数据转换程序实 现从源系统中抽取数据、清理数据、一致性格式化数据、装载数据等过程 的设计和编码;(6)定义元数据,即表示、定义数据的意义及系统各组成 部件之间的关系。元数据包括关键字、属性、数据描述、物理数据结构、源 数据结构、映射及转换规则、综合算法、代码、缺省值、安全要求、变化及 数据时限等;(7)开发用户决策的数据分析工具,建立结构化的决策支持 查询,实现和使用数据仓库的数据分析工具,包括优化查询工具、统计分 析工具、客户机/ 务器工具、联机分析处理工具及数据开采工具等, 通过分析工具实现决策支持需求;(8)管理数据仓库环境,包括质量检 测、管理决策支持工具及应用程序。并定期进行数据更新,使数据仓库正 常运行。 本文提出的解决方案是基于数据仓库(Data Warehouse,简称DW) 技术、采取数据挖掘(Data Mining,简称DM)手段的高等学校教务管理 决策支持系统。在其中,DW用来存储和组织基础数据,而DM用来对 DW中的基础数据进行一系列挖掘后,提取出具有价值的知识信息,验 证和预测高等学校的管理对象、资源、目标,辅助学校决策,使得高等学 校在前进的过程中随时把握自己的发展方向。 数据仓库和数据挖掘技术分析 (一)数据仓库技术分析 1.数据仓库的概念。数据仓库(DW)作为一切决策支持系统的基础, 一、3.高等学校教务管理数据仓库建立。我们知道,DW不光是各种数据 的简单堆积或者相加,而且还要从大量的事务型数据库中抽取数据,并 将其清理、转化为新的存储格式,即为决策目标把数据聚合成一种特殊 的格式。随着此过程的进行和完善,这种支持决策的、特殊的数据存储即 被称为DW。对高等学校教务管理来说,DSS建立数据仓库的数据可能 来自如人事处、学生处、教务处、财务处、设备处、后勤管理等职能部门和 二级学院、系,还有学生等,所有这些数据从结构上看,是相对的,是 不利于高等学校教务管理决策者进行全面分析和做决策的。根据高等学 校教务管理的DSS需求,就要求数据仓库从较高层次上把分散的、难以 访问的数据从不同信息系统中分离出来,经过抽取、清洗、净化、转换、迁 移为统一、随时可用的信息,通过深层次加工把信息转换成大小不一、各 式各样的数据集市(DataMart)以满足各个职能管理部门和院系做专题分 析和辅助领导层决策,辅助学生做出自己的学业规划和职业规划。系统 必须定期自动完成分散数据源的采集、入库和刷新工作,充分预测今后 的扩展性与外部数据的接口。总之,DW把高等学校教务管理分散的、难 以访问的日常营运数据转化为集中统一、随时可用的信息。一般来说,完 整的DW具备建立、管理和使用全部成分。由此也可知,建立数据仓库是 个长期复杂的过程,也是工作的重点。 数据仓库主要应用于对事物的总体分析,从全局把握信息。它的真 正价值在于帮助决策者制定出能够改进过程的决策,而不仅光停留在工 作流程的自动化方面。凭借良好的数据仓库,高等学校教学管理领导层 决策时就可以从历史数据出发,有事实作为依据,而不再是只依赖直觉。 一(二)数据挖掘技术分析 同时也是高等学校教务管理决策支持系统的基础,然而对于它的定义不 同的专家学者有不同的定义。最典型的就是数据仓库之父W.H_ Immon将其定义为:“数据仓库是支持管理决策过程的、面向主题的、集 成的、随时间变化的、持久的数据集合。” 我们把数据仓库中存贮的数据分为四级:远期基本数据、近期基本 数据、轻度综合数据和高度综合数据。还有一部分重要的关于数据的数 据,我们称之为元数据。数据仓库中用来与终端用户的模型与前端 工具间建立映射的元数据,称为决策支持系统的元数据。 数据仓库系统必须具备建立、管理和使用等功能。w.H.1mmon认 为,数据仓库系统可以分为三个组成部分:(1)数据源:提供源数据;(2) 后端加工处理:包括来自数据源数据的接受、析取、汇总、变换、打包和储 1.高等学校教务管理需要数据挖掘。根据目前高等学校教务管理系 统的特点,首先需要在不同的层次上将不同信息系统中的数据综合、清 洗、归类、统一,并进行分析利用的抽象,即建立数据仓库,在数据仓库的 基础上进行联机分析处理和数据挖掘,为科学管理决策提供依据支持。 数据挖掘(DM)就是从大量的、不完全的、有噪声的、模糊的、随机的 实际应用数据中,抽取隐含在其中的、人们事先不知道、但又是潜在有用 的信息和知识的过程。从更广义角度来讲,DM就是在一些事实或观察 数据的集合中寻求模式的决策支持过程。因此,它除了处理传统数据库 中的数值型的结构化数据外,还可以对文本、图形、图像、web信息资源 等半结构、非结构数据进行挖掘。 DM就是在一些事实或观察数据的集合中寻找模式的决策支持过 一l03— 维普资讯 http://www.cqvip.com ●高校园地 程,DM的对象不仅是数据库,也可以是文件系统、数据集合或DW。基于 DW的DM技术,其任务是发现DW中尚未被发现的知识,预见的、潜在 的具有价值信息。决策者明确的信息,直接用查询等其它工具直接获取, 那些隐藏在大量数据中的关系、趋势等信息就需要DM技术。DM技术 可从DW中智能挖掘出大量真正有价值的信息和知识,根据高等学校的 发展历程,对未来趋势做出科学的定量分析和预测。高等学校教务管理 决策者提供更科学的决策基础,从而有效地提高管理质量,有针对性地 加强教学管理。 《经济 ̄))2oo8年第7期 断,为正确决策提供必要的支持。决策支持系统作为一种新型的信息技 术,能够为高等学校教务管理提供各种决策信息以及许多问题的解决方 案,减轻了教务管理者从事低层次信息处理和分析的负担,使得他们专 注于最需要决策智慧和经验的工作,提高了管理的质量和效率。一般地, 我们认为是决策支持系统由数据库系统、模型库系统、知识库系统及人 机会话系统等部分组成的。 2.DSS的分析方法。DSS以满足决策支持系统的要求和达到DSS的 性能指标为主要的性能指标,由于DSS的特殊性,对DSS的系统分析通 常采用一种称之为ROMC的方法。所谓的ROMC就是一种基于决策过 程基本活动的方法,是决策者进行表达(R)、操作(O)、存储辅助(M)和控 制(c)的方法,其基本思路是建立起DSS的要求与性能之间的关系,并 2.数据挖掘的任务。DM的首要任务是发现知识,具体包括:广义型 的知识,反映同类事务共性的知识;特征型知识,反映事物各方面特征的 知识;差异性知识,反映不同事物之间属性差别的知识:关联型知识,反 映事物之间依赖或关联的知识;预测性知识,根据历史和当前的数据推 测未来的数据;偏离型知识,揭示事物偏离常规现象等。 3.数据挖掘的流程。。DM就是利用数据挖掘技术,从基础的数据库、 数据仓库及其其它信息库的大量数据中挖掘有价值的知识的过程。其主 要分为四个步骤:(1)业务对象:首先应熟悉应用领域的数据、背景知识, 清晰地定义出业务问题,明确所要完成的数据挖掘的任务,完成数据定 义工作。(2)数据准备:包括数据抽取和预处理工作。对数据质量进行分 析,完成消除数据噪声,清除不一致数据,进行多个数据库的集成、组合 工作。然后从数据库中选择挖掘的对象,将数据转换成数据挖掘系统要 求的统一格式。(3)数据挖掘:是知识发现的核心步骤。包括选择合适的 算法和技术、执行挖掘算法、搜寻提取数据模式等。(4)结果分析:依据要 解决的问题,对挖掘的模式进行确认、翻译和解释,将发现的知识以最简 单、最易理解的方式提供给用户。 4.数据挖掘的方法。DM的结果体现在知识,而知识的发现是一个复 杂的过程。面对高等学校教务管理的数据挖掘这个领域,怎么样从众多 的挖掘技术中挑选出有效的技术、方法和工具,是研究和开发高等学校 教务管理数据挖掘系统的首要问题。常用的数据挖掘方法有:(1)遗传算 法:主要用于分类和关联规则的挖掘。遗传算法是基于达尔文进化论中 基因重组、突变、自然选择和适者生存等概念,试图通过组合或“繁殖”现 存的最好的解法来产生更好的解法。(2)决策树方法:主要用予数据分 类。它利用信息论中的信息增益寻找数据库中具有最大信息量的字段, 建立决策树的一个节点,再根据字段的不同取值建立树的分支;在每个 分支子集中重复建立树的下层节点和分支的过程,即可建立决策树。接 着进行剪枝处理,然后把决策树转化为规则,利用这些规则对新事物进 行分析。(3)粗糙集理论:用于数据简化、数据意义评估、对象相似性或差 异性分析、因果关系及泛化式挖掘等。主要思想是:把对象的属性分为条 件属性和决策属性,按各属性值相同分等价类。条件属性上的等价类E 与决策属性上的等价类Y分三种情况,分别为:下近似,Y包含E;上近 似,Y和E交集非空;无关,Y和E的交集为空。对下近似建立确定性规 则,对上近似建立不确定性关系,对无关情况则不存在规则。(4)人工神 经网络:用于分类、聚类、特征挖掘、预测和模式识别。人工神经网络从结 构上模仿生物神经网络,通过简化、归纳、提炼总结出来的一类并行处理 网络。以模拟和学习规则为基础,建立三类多种神经网络模型:前馈式网 络、反馈式网络、自组织网络。(5)关联规则方法:用于对大型关系数据库 发现有价值的关联模式,也可对半结构化数据(in文档数据)进行关联规 则挖掘。它通过统计方法对数据中的if-一then规则进行寻找、归纳和提 取。 高等学校的教务管理信息系统大都具有分类特性.因此,高等学校 教务管理DSS的数据挖掘方法主要采用能实现分类模式分析的方法, 以分类模式分析为主线,关联模式分析为辅线结合其他分析方法进行。 二、决策支持系统技术分析 1.基本概念。决策是管理的核心。高等教育的发展,高等学校面l 着 空前未有的复杂生存环境,更难以形成自己的优势,并且维持好自己的 竞争优势,竞争的压力对高等学校制定教务管理决策的质量、速度、效率 都提出了更高的要求。 决策支持系统(DeClslonSuppoaingSystem,简称DSS)是一种针对半 结构化的决策问题,支持决策活动的具有智能作用的人机系统。这种系 统能够为决策者提供决策所需的有效数据、信息和背景材料,帮助明确 决策目标和进行问题识别,建立或修改决策模型,提供各种备选方案,并 且对各种方案进行评价和优选,通过人机交互功能进行分析、比较和判 一l04一 尽量减少它们之间的差异。 三、基于数据挖掘的决策支持系统的建立 从以上的内容,我们可以建立一种基于数据挖掘的决策支持系统基 本结构框架。它由数据库、数据仓库、数据仓库管理模块、数据挖掘工具、 知识库、知识发现模块、人机交互模块组成。系统的数据主要来源于其他 的信息系统,我们需要输入是源于数据库的数据以及存储在知识库中的 知识和经验;人机交互模块通过自然语言处理和语义查询在用户和系统 之间提供相互联系的集成界面;数据仓库管理模块完成数据仓库的创建 以及数据仓库中数据的清洗、综合、提取、统一等各种操作,负责管理整 个系统的运转;数据挖掘工具用于完成实际决策问题所需的各种查询检 索工具、数据的OLAP分析工具和数据开采DM工具等,以实现决 策支持系统的各种要求;知识发现模块控制并管理知识发现过程,它将 数据的输入和知识库中的信息用于驱动数据选择过程、知识发现引擎过 程和发现的评价过程。 决策支持同数据库管理是密切相关的,当有命令从用户发出后,数 据挖掘工具就自动触发数据仓库管理模块,从数据仓库中获取出相关的 数据。 该决策支持系统的建立过程可大致描述如下:(1)对需求进行分析 也称系统分析.描述和表示问题;(2)确定数据来源,建立数据仓库;(3) 对要发现的任务进行分类别,如归类、回归分析、聚类、发现关联规则等, 设计或选择有效的数据挖掘算法并加以实现;(4)数据挖掘,逐层综合。 调用数据挖掘功能,从平凡的历史数据中提出综合数据,并且存储 为库文件,作为更高一层数据挖掘对象;(5)测试发现的知识,对知识进 行一致性、效用性、适应性进行处理;(6)应用开发,根据高等学校教务管 理发展的要求,建立适用于决策支持的数据仓库的集成界面和应用程 序,使教务管理者能在决策支持中运用所发现的知识。 以上过程不是简单的线性流程,而是一个综合的学习、发现和修改 过程,步骤之间包含了循环和反复,这样可以对发现的知识不断求精、深 化,并使其易于理解、使用。 四、结束语 数据挖掘--t'l是方兴未艾的前沿科学,数据挖掘技术为决策支持系 统地研制与开发提供了一种有效、可行的体系化解决方案。决策支持系 统应集成数据仓库、数据挖掘技术。随着数据仓库和数据挖掘技术在各 个领域的广泛采用,决策支持系统的研究与开发工作将被推向一个更高 的层次。 教务管理的领域,随着高等学校教务管理信息系统的数据信息的不 断增长,把DM技术应用该系统中,以建立高等学校教务管理决策支持 系统,必将为高等学校教务管理提供切实可行的提高教学质量、优化教 学资源、规范教学管理的依据,为高等学校在激烈的竞争中掌握主动,在 未来的发展中提供更广阔的空间,发挥重要的作用.为高等学校的跨越 式发展起到一个科学导向作用。 参考文献: 1张友升系统分析师技术指南清华大学出版社,2007 2,康晓东,基于数据仓库的数据挖掘技术,机械工业出版社.2004 3.萨师煊,王珊.数据库系统概论,高等教育出版社.2000 4,陈京民等.数据仓库与数据挖掘技术吨子工业出版社.2002 5嘭木根.数据仓库技术与实现电子工业出版社.2002 (作者单位:贵州民族学院教务处贵州贵阳5500251 (责编:若佳) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务