网络教育信息系统中的信息关联定位挖掘方法研究
中图分类号: TN711?34; TP391.9 文献标识码: A 文章编号: 1004?373X(2017)10?0058?04
Abstract: Since real?time performance and accuracy of the information retrieval in the network education information system is not high enough, a information relevance positioning mining method based on the shortest path scheduling of educational information resources is proposed. The distributed storage structure model of information resources in the network education information system is built. The candidate concept lattice node distribution strategy in the relevance rules is adopted to make the pheromone guide of information relevance positioning, so as to extract frequent item?set features of all objects in the network education information system and realize information relevance positioning mining. The simulation results show that the proposed method is of high accuracy and low time cost for information relevance positioning mining, and has good application reliability.
Keywords: network education information system; information retrieval; mining method; relevance positioning
0 引 言
网络教育信息系统是处理网络教育中的学生学籍信息、课程信息、教师信息、学科科研信息以及后勤管理信息等方面的大规模数据管理信息系统。网络教育信息系统处理的数据信息规模庞大,对信息管理的集成度较高,更新速度较快,信息集成的复杂度较高,需要对网络教育信息系统进行信息关联定位,提高网络教育信息系统的信息检索和资源调度的效率[1]。研究网络教育的信息管理系统优化设计及信息定位挖掘方法,在正规网络教育的运行秩序、提高网络教育的工作质量方面具有重要意义[2?3]。本文提出基于教育信息资源最短路径调度的信息关联定位挖掘方法,通过对定位挖掘方法的优化算法设计,提高网络教育信息系统的信息定位挖掘性能,展示了本文方法的优越性。
1 信息资源的分布式存储结构模型
为了实现网络教育信息系统中的信息关联定位挖掘,需要构建网络教育信息系统的信息资源分布式存储结构模型,其总体结构模型如图1所示。
结合图1所示网络教育信息系统的信息关联定位挖掘总体结构模型,进行数据存储结构模型构建。在网络教育信息关联数据库模型中,教育信息系统虚拟机的负载量为[Mh],信息关联定位挖掘的负载开销表示为:
定义1 设给定网络教育信息系统中的信息关联定位的频繁项集为三元组[T=(D,I,R)],其中[D]为事务项集t中泊松分布集合,[I]为属性集合,[R]为最小支持数概率,[R?D×I],若直接挖掘到频繁项集的序贯采样关系与事务项集中的本体模型对应,则此数据集中每项事务项集压缩到存储系统的概念格为一个概念分布子空间,概念格的图形表示为Hasse图[4]。由此构建信息资源的分布式存储结构模型,通过对信息关联数据的头表和AT?Tree的创建[5],得到网络教育信息系统中不确定事务数据集D,频繁项集X的对结点的关联强度为expSN(X), 定义为:
3 信息关联定位挖掘实现
3.1 教育信息资源最短路径调度
在上述进行了网络教育资源的信息关联定位关联规则设计的基础上,进行信息关联定位挖掘方法的改进设计。本文提出一种基于教育信息资源最短路径调度的信息关联定位挖掘方法,教育信息资源最短路径调度采用的是约束概念格区间调度模型,得到教育信息资源最短路径关系约束集为:
输入:提取的约束关联规则数据库D;频繁1项集D的支持度阈值minsup;网络教育资源最短路径调度的约束条件P;
输出:网络教育信息关联定位的约束概念格Hasse图,时间复杂度为[Ni×O(Ni)]。
3.2 信息关联定位挖掘实现算法描述
根据教育信息资源最短路径调度结果,提取网络教育信息系统中的所有对象信息的频繁项集特征,在最小期望支持数约束下,网络教育信息系统样本数据库的关联规则优先级属性列表见表1。 在频繁模式树中提取网络教育信息系统中的所有对象信息的频繁项集特征,设网络教育信息系统概念格结点可表示为[C(A,B),P]。其中:[P]为事务项集中非频繁项,且满足[P(A,B)=.T.](逻辑值为真),[A∈ρ(G)]称为最小期望支持数,[B∈ρ(M)]称为事务项集处理后的关联定位内涵,在上述构建的约束条件下进行信息关联定位挖掘,实现算法描述为:
算法:网络教育信息系统信息关联定位挖掘算法
输入:初始化参量值,新建的头表,以及数据挖掘的约束指标参量集
输出:信息关联定位挖掘的期望支持数二维表
根据新建的头表在全局树上挖掘频繁模式,结果是一个0,1值的二维表形式,其中0表示挖掘的信息数据不满足最小期望支持集,1表示挖掘定位信息结果满足最小期望支持集。
4 实验测试分析
为了测试本文设计的信息关联度行为挖掘方法在实现网络教育信息系统的数据检索挖掘在时间性能和精确度方面的优越性,进行实验测试分析。实验中选择5个算法进行性能测试比较,分别为文献[2]中的BP神经网络挖掘IMBP?Mine算法、文献[3]的决策树挖掘方法DT?mine、文献[4]的粒子群挖掘方法PSO?Mine、以及文献[5]的近似挖掘策略MBP和文献[6]的冗余关联IMBP;测试中采用网络教育信息系统中学生管理信息、课程管理信息和教师管理信息3个数据集进行了测试,Student,Course和Teacher,得到挖掘的准确度对比和时间开销对比如图3和图4所示。
分析上述仿真结果得知,采用本文方法进行网络教育信息系统信息关联定位挖掘的时间开销较小,挖掘的准确度较高,随着最小期望支持度阈值的增大,各种算法进行挖掘的运行时间随之增大,但本文方法的运行时间总体小于传统方法,研究结果展示了本文方法的优越性。
5 结 语
针对传统方法一直存在挖掘精度低的问题,提出基于教育信息资源最短路径调度的信息关联定位挖掘方法,并进行了实验分析。结果表明,采用该方法进行网络教育信息系统中的信息关联定位挖掘的准确度较高、时间开销较小,具有较好的应用可靠性,展示了本文方法较好的适用价值。