• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于WEB数据库的智能组卷系统设计与实现

温俊芹 王伟民 王修晖
  
教育科研
2007年8期

  摘要 智能组卷是计算机辅助教学中的一个重要研究课题,试题提取的智能性和生成试卷的完整性是评价一个组卷系统好坏的关键指标。本文采用基于案例和规则的混合推理机制确定组卷控制参数,设计并实现了一个基于ASP平台和SQL Server数据库技术的智能组卷系统(NeroTPCS)。NeroTPCS系统使用ADO实现对WEB数据库中的试题集进行操作,根据知识点的学时确定知识点的分值,并由知识点的教学要求进一步推理确定知识点的题型分布和难度系数;然后,根据知识点的分值、题型分布和难度系数进行试题分析和提取;最后,对生成的试卷进行完整性评估并将通过测试的试题子集导入到Word文档中形成最终试卷。测试结果表明,在形式化的输入知识点信息引导下,NeroTPCS系统能够高度智能化地实现试题提取,并通过对初选试题集的评估与校对,保证最终试卷的内容完整性。
  关键词 Web数据库;智能组卷;SQL Server;ASP
  
  Design and Implementation of Intelligent Test Paper Composition System Based on WEB Database
  Wen Junqin1) Wang Xiuhui2)
  1) (Zhejiang Technology Institute of Economy, Department of Economic Information, Hangzhou, Zhejiang, 310018)
  2) (China Jiliang University, Institute of Information Technology, Hangzhou, Zhejiang, 310018)
  Abstract:Intelligent test paper composition is an important research topic in Computer Aided Instruction (CAI), the intelligence of test questions selection and the integrality of test papers generation are the key criterions to evaluate a system for test paper composition. This paper uses cases and rules based mechanisms to determinate the control parameters, designs and implements an intelligent test paper composition system(NeroTPCS) with ASP and SQL Server database techniques. NeroTPCS operates test questions set by ADO strategy, and computes the scores of knowledge points by its period, then infers the type distributions and difficulty coefficients by its teaching requirements. And then analyzes and selects some test questions according to the score, type distributions and difficulty coefficients of the knowledge points. Finally, evaluates the integrality and imports the rational test questions set to a Word document and builds a test paper. Test results show that NeroTPCS can high intelligently select test questions with formal input of knowledge points, and assure the integrality of the final test paper.
  KeyWords:Web Database; Intelligent Test Paper Composition; SQL Server; ASP
  
  引言
  
  随着计算机技术的发展和教学改革的深入,试题库系统对于推进教考分离,提高教学质量,减少主观因素对出卷的影响,实现考试的公正性、公平性和客观性有着越来越重要的作用。试题库系统的设计与实现主要涉及到3个方面:系统的总体框架、系统的数据组织结构和组卷算法[1]。其中系统的数据组织结构是整个系统的基石,它一方面是课程体系结构的合理体现,另一方面对组卷的质量和组卷的效率有重要的影响。可见,合理、有效地对试题库系统进行组织,对整个系统的开发、维护和应用有着基础性的作用。
  如何设计一个算法从题库中既快又好地抽出一组最佳解(如果存在最佳解)或是抽出一组非常接近最佳解的试题,涉及到一个全局寻优和收敛速度快慢的问题[2],比如用遗传算法的全局寻优来寻找最佳解;基于学生模型bosm的智能组卷算法[3];基于自适应的智能组卷方案研究[4];回溯法自动组卷,也即有条件的深度优先算法;同时在用户图形化界面上有了很大的提高[5]等。在国外,很多高校也在致力于通用题库的创建和优化,特别是在算法上有很大的提高[6][7]。逐渐在并行式分布题库系统的设计上使用了知识点题型分布和分值的智能组卷系统,提高试题卷的质量。
  通过对其它组卷算法的调查研究,发现其存在试题抽取稳定性和试卷质量上的不足,所以有必要建立一个通用的优化组卷题库系统。本文介绍了一个基于WEB数据库的智能组卷系统NeroTPCS,该系统采用蒙特卡罗算法进行试卷抽取优化,为使用者提供了一个更加方便灵活的决策支持环境。
  
  2系统总体结构
  
  NeroTPCS智能组卷系统包括六个功能模块:用户登陆、管理首页、用户管理、题库管理、试卷管理和系统设置,如图1所示。其中题库管理和试卷管理模块实现了试题的智能提取和试卷的完整性测试,是不同组卷系统的根本区别,也是NeroTPCS的核心内容。
  库管理模块:负责完成对指定学科试题的题目添加、题型管理、题目查找和列表等工作。同时提供管理人员维护题库的可视化工具,实现试题增加、修改、删除,试题浏览,试题查询及试卷打印输出等。
  试卷管理模块:实现试题的智能提取和试卷的自动生成工作。在试题库的基础上,建立试卷库,包括自动抽题、智能组卷、试卷浏览、试卷查询及打印输出。此外,试卷分析也是该模块的一个重要组成部分,其功能包括成绩录入、成绩修改、成绩打印及成绩分析。成绩分析作为组卷系统的一个反馈支路,用来分析考试及格率、总分分布情况、各难度试题得分率、各知识点得分率、各章节试题得分率等指标,这些指标主要用于反映试卷的知识点覆盖情况和难度分布情况,并将反馈结果作为下载组卷的约束条件,以优化组卷性能。
  
  系统设置模块:对NeroTPCS系统进行整体配置,并实现题库和试卷库的备份与恢复。
  用户登陆、管理首页和用户管理模块:负责NeroTPCS系统的安全管理,为了管理方便,NeroTPCS系统分了6级网络办公权限,父级权限继承到下级权限。
   (1)系统管理员(最高权限):由于该权限的用户能够在系统中不受任何约束,建议一个系统只设置一个系统管理员,并且该管理员应具有一定的网站维护经验和数据库操作经验。作为超级用户,系统管理员可以对已有用户进行删除操作以取消某个用户的使用权利;进行试题的录入、编辑、删除操作;查看所有的用户反馈意见,有利于系统的维护和改进。
   (2)管理员(4级权限):管理员权限拥有了系统的大部分的权限,但不能对系统进行维护,也不能查看到加密了的试卷。管理员可以进行用户管理,如用户的增加、删除、修改等。
   (3)教师用户(3级权限):不仅不能访问到系统维护,而且不能对用户管理模块进行操作。
   (4)题库管理员(2级权限):可以访问题库模块和教材模块。
   (5)教材用户(1级权限):仅仅能访问到教材模块。
   (6)印刷组(0级权限):只能执行试卷的印刷操作
  
  
  3 WEB数据库设计
  
  数据库设计在管理信息系统开发中是至关重要的一个方面,其设计的好坏直接影响系统的执行效率以及日后的维护,此外还需要具备一定的可扩展性。NeroTPC系统在SQL Server2000中建立一个数据库,其中包含试题表(每个科目一张试题表)、题目类型表、试题难度表、教材表、用户表和印刷表,每张表的记录以表相应主要内容的编号为唯一标识,在添加记录过程中是自动增加的,这就省去了录入信息时填写编号的麻烦工作。
  
  智能组卷系统由于牵涉科目、题目比较多,且试题存储容量大,题目分布的比较散,严重影响了试题抽取的速度,所以数据库的性能优化设计成为一个非常突出的问题。数据库设计的主要挑战是“高速处理大容量的数据”, 如何优化数据库的性能是设计人员经常面临的问题。数据库性能优化主要有两种途径:优化表结构本身和优化数据库的环境参数。本文使用改进的第三范式设计表结构来解决性能优化问题,以试题表为例(如表1所示):
  (1)题号(唯一标识),数据库自动生成;
  (2)题型,在此填写的值是题型表中的题型代码,如:题型代码1对应于页面上显示的具体信息——“填空题”,中间的映射由题型表完成,这样可以加快查找试题的速度;
   (3)难度,与题型类似;在此填写的值是难度表中的难度代码,如:难度代码1对应于页面上显示的具体信息——“容易”, 中间的映射由难度表完成;
  (4)分值;
  (5)教材,某一本教材的名称;
  (6)章节,某一本教材的某个章节;
  (7)知识点,用于查询试题时的模糊匹配查询,以找到题干与知识点匹配的试题;
  (8)题干,即试题的题目;
  (9)答案,在组卷后,系统应根据所选择的题目给出相应的试题答案。
  
  
  4 组卷算法
  
  抽题组卷设计思想是在计算机随机函数生成的算法基础上,结合类似于多适应度遗传算法的智能思想得来的。该算法的思路是:首先,由用户输入试题参数,即卷面总分、试题难度及各题型的数量、各小题分值,NeroTPCS系统则调用计算机随机函数生成的随机值,根据题型内容从题库中随机抽取各种类型的指定数量的题,并分析这些试题组合的难度值是否符合试卷总的难度范围。在这里,系统将试题的难度值的和除以总题数即得到试卷的难度系数。如果所得难度系数符合用户要求,则将同类型小题合并为一道大题,打印时再将各类型的大题汇总成一份试卷,在数据库中建立一个Paper 表,把合并后的所选试题放到一个字符串中,然后存入Paper 表中的唯一的一条记录中去。如果所得难度系数不符合用户要求,则系统将分析结果反馈到组卷模块中,根据相差难度大小更新试题。这样,就可以将试题难度有效控制,以符合用户要求的难度范围。如果出现题库中所有的试题组合都无法满足用户要求的难度范围的情况,则系统将尽量选取最接近目标难度的组合生成一份试卷。最后,组卷成功之后进入打印模块。用户可以预览或直接打印。系统将在生成试卷的同时随附答案。通过这样的算法、思路,调用蒙特卡罗算法的随机函数可以使系统继承这一算法的简单、稳定和快捷的优点,而对智能算法思路的引入则避免了随机函数生成不易控制难度这一瓶颈,使得组卷效率更高、库结构冗余更小。这样,NeroTPCS系统的算法就兼顾了教学实际和效率原则, 更符合CAI 智能化、高效化的发展方向。
  
  5 系统实现
  
  5.1 开发平台的选用
  Visual C#集成开发环境提供了优秀的多种编程语言的编辑和编译统一开发平台,它是快速开发企业级Web应用程序以及高性能桌面应用的工具。NeroTPCS系统采用B/S(浏览器/服务器)体系结构,以Visual C#为主要开发平台,数据库采用SQL Server 2005,动态网页的开发使用ASP技术。
  5. 2 系统功能实现
  试卷自动生成系统分为试卷管理和系统维护两大模块。在试卷管理模块之下又细分为试题管理和试卷试卷管理模块之下又细分为试题管理和试卷生成两个子模块。其中,试题管理子模块中,可以实现试题录入、增加、查询、修改、删除、退出功能;而试卷生成子模块中,用户只需输入卷面总分、试卷难度、各题型数量及各小题分值四个参数,当所选题分值添加到卷面总分值时,点击“生成”按钮系统就将自动抽题组卷。
  在系统维护模块之下又细分为用户管理、修改密码、题型设定和难度设定四个子模块。其中,用户管理子模块中,可以实现对用户权限的增加、删除功能,但本模块只面向0级也就是最高一级用户来管理,其他用户无法进入这一模块;修改密码子模块中,可以实现对用户密码的更换;题型设定子模块中,可以实现对题型的增加、查询、修改和删除功能,在这一模块中类型代码与类型名称是一一对应的;难度设定子模块中,可以实现对难度的增加、查询、修改和删除功能,在这一模块中难度代码和难度值也是一一对应的。
  
  6总结与展望
  
  目前,该系统已成功的应用于“网页设计”和“VB程序设计”课程,为教师和学生提供了良好的教学结果评估工具,收到了良好的效果和评价。
  然而,试卷生成系统的设计是一个复杂、严密的过程,在NeroTPCS的设计与实现过程中尚存在一些有待改进之处,如没有设置选择科目的功能模块、打印好的样题其可信度还正在测试中等,这些将是下一步研究的重点方向。
  
  参考文献
  [1] 董敏, 霍剑青, 王晓蒲;基于IRT智能组卷的模型管理系统;中国科学技术大学学报;2004,34 (5):612-617.
  [2] 郭志鑫, 金海, 陈汉华. SemreX中基于语义的文档参考文献元数据信息提取.计算机研究与发展, 2006,43 (8) : 1368~1374.
  [3] 冯志新等.基于学生模型Bosm的智能组卷算法[J].陈宁江广西科学院学报,2002,18(4):260
  [4] 王晓荣等.基于自适应的智能组卷方案研究[J].荆州师范学院学报(自然科学版),2002,25(5).
  [5] 阳小华, 周龙骧. WEB用户的视图.软件学报,1999,10(7) : 690-694.
  [6] Martha L Stocking, Len Swanson Mari Pearlman. Application of an automated item selection method to real data. Applied Psychological Measurement, 1993,17(2) : 167-176.
  [7] LIU Jian, L IANG Yun-rong, YANGJun. Accessing Web Heterogeneous Databases Based on CORBA. Journal of Beijing Institute of Technology , 2002 , 11(1) : 81-84.
  [8] 漆书青, 文剑冰, 戴海崎等. 题库智能化组卷的心理计量理论与方法. 心理学探新, 1999, 19 (2) : 40-47.
  [9] 段海新, 杨家海, 吴建平. 基于Web和数据库的网络管理系统的设计与实现. 软件学报2000, 11 (4) : 468-472.
  [10] 范国闯, 钟华, 黄涛, 冯玉琳. Web应用服务器研究综述. 软件学报,2003, 14(10) : 1728-1739.
  [11] 唐常杰,于中华,游志胜,张天庆,杨璐. 基于时态数据库的Web数据周期规律的采掘. 计算机学报,2000,23(1) : 52-59.
  [12] 李木金, 王光兴. 一种基于Web 的网络管理模型及实现. 计算机研究与发展,1999,36(10):1232-1239.
  [13] 苏中, 马少平, 杨强, 张宏江. 基于Web-Log Mining 的Web 文档聚类. 软件学报,13(1):99-104.
  [14] 王晓路, 卢建军, 马莉. 基于JAVA 的连接池优化WEB数据库连接. 西安电子科技大学学报, 2005,25(2): 228-231.
  
  附1:作者简介
  温俊芹(1977-),女,硕士,讲师,浙江经济职业技术学院经济信息系,主要研究方向:计算机教学、软件工程、数据库系统、人机交互、面向对象技术等。
  
*本文暂不支持打印功能

monitor