• 收藏
  • 加入书签
添加成功
收藏成功
分享

数据挖掘与分析课程教学改革方法探讨

王媛媛 张承明
  
教学实践媒体号
2024年22期
山东农业大学 信息科学与工程学院

摘要:数据挖掘与分析技术是计算机应用的核心技术,随着社会对该技术需求的增长,高校对这门课程的教学也提出了更高的要求。本文针对传统数据挖掘与分析教学过程中存在的问题,进行了教学改革方法的探讨,提出引入项目式教学、翻转课堂、对分课堂等方法提高教学质量,通过招聘需求分析、行业案例介绍、分组课题研究等方法提高学生对课程学习的兴趣和学习效率。

关键字:数据挖掘与分析;教学改革;课程建设

自古以来,人们就在天文、地理、军事、政治等各个领域进行着数据挖掘,人们通过各种手段汇集多方面的数据资料,对其进行记录、管理和分析,希望从中能够获得关键的有用信息,进而指导人们的行为。‌随着21世纪的到来,‌人类进入了大数据时代,‌数据的产生速度和数量都达到了前所未有的水平。‌传统的数据处理方法已经无法应对这种大规模、‌高复杂度的数据,‌因此人们需要更加智能、自动、高效的数据处理方法,各行业对掌握数据挖掘与分析技术的人才需求也与日剧增,各大专院校计算机、大数据等专业基于行业需要都开设了相关课程,并提出了对人才培养的更高要求。为保证人才培养质量,对数据挖掘与分析课程的教学改革迫在眉睫。

1、数据挖掘与分析的教学任务

数据挖掘技术是利用计算机从数据中发现信息的主要技术,是目前应用最广的技术之一。数据挖掘技术是计算机科学的重要分支,已经成为计算机应用的核心技术和重要基础。数据挖掘与分析课程是大数据、人工智能等计算机相关专业的重要课程。本课程的教学任务是使学生掌握数据挖掘的理论基础和系统方法,包括数据挖掘的基本概念、常用算法、常用工具、用途和应用场景等,使学生从理论和实践上掌握数据挖掘知识,掌握将基本理论应用于解决实际问题的方法。

2、数据挖掘与分析的教学现状

2.1、受学时限制,教学内容不够全面

数据挖掘与分析的发展历史虽然比较短,但受大数据技术和人工智能技术突破的影响,出现了大量新的技术分类和算法,使得数据挖掘与分析课程的教学内容得到极大丰富,其理论内容复杂繁琐、算法实现变化多样,受课程学时限制,在教学过程中不能面面俱到,必须有所取舍,有所侧重。这样局限了学生的学习内容,使得学生对数据挖掘与分析技术的掌握不够全面。

2.2、教学顺序不够合理,易造成知识割裂

在数据挖掘与分析的教学过程中,通常会按照数据预处理方法、关联规则挖掘、聚类分析、分类等数据挖掘与分析的算法应用类型进行讲解,重点讲解各类型算法,这样容易造成知识的割裂,使得学生在学完数据挖掘与分析课程后,还是不能够系统地进行数据分析过程。对于问题定义、数据收集、数据预处理、模型构建、模型评估、模型部署这一系列步骤之间的关系和如何选择调整的方法没有清晰的认识。这使得学生只能掌握老师讲解的例题,遇到新的问题则无法完成数据挖掘与分析工作,得不到好的分析结果。

2.3、实验内容简单,不利于提高学生的实践能力

数据挖掘与分析课程的实验教学受限于实验学时和大部分学生的接受能力,通常会降低实验内容的难度,一般以复现老师教学中讲解的例题和类似例题的算法应用题目为主要实验内容,这样不利于学生对于数据挖掘与分析技术的理解和掌握,也不利于提高学生的实践能力和创新能力。

2.4、学生对课程的重视程度不够,学习积极性不高

数据挖掘与分析是提供决策支持的有效工具,能够为决策者提供有价值的信息,帮助决策者做出正确的选择,也能够帮助各单位分析历史数据,发现问题进行改进,优化工作流程,提高业务效率,还能进行产品数据和用户数据的分析,为产品和服务的改进提供数据支持。数据挖掘与分析是各行各业都需要的技术。数据挖掘与分析课程本身是一门比较有难度的课程,理论内容多,算法难度大,实践步骤复杂,这些都使得学生学习这门课程需要付出更多的精力,才能更好地掌握理论知识提高实践能力。没有足够的重视,没有付出足够的精力,是无法学好这门课程的。但是大部分学生对这门课程的重要性认识不足,学习积极性不够,没有投入足够的精力进行学习。甚至出现不按时完成作业任务的情况。

2.5考核评价方法单一

数据挖掘与分析课程的考核方式通常为上机考试,内容通常分为理论知识和算法实现两部分。这种考核方法在一定程度上能够检测学生对于基础理论的掌握情况和学生的实践操作能力,但是还是无法避免部分学生考前死记硬背、事后全部忘光的情况出现,不能够全面真实的反映学生的实际掌握程度。

3、数据挖掘与分析的教学改革

3.1、教学自学相结合

由于受到课程学时的限制,在教学过程中无法涉及数据挖掘与分析理论中的所有知识点和算法,尤其是近些年新出现的各类算法,因此,教学内容必须有所取舍,将课程教学内容分为讲授、自学、练习三部分。在理论课上可以重点讲解一部分关键的理论知识点和经典算法,最好在一个技术类型中讲解多个算法,并且对于各个算法进行优缺点分析和对比,使得学生能够针对不同数据进行有针对性的算法选择;自学部分由学生利用课余时间自行学习,这部分内容老师应该为其指定具体的学习内容,最好能够提供学习材料、整理出思考题目,并确定哪些内容需要掌握哪些内容可以只做了解,这些内容可以通过雨课堂等线上教学平台发布学习任务、进行互动,通过课堂讨论、问答等形式了解学习情况;练习部分包括作业和实验内容,是针对课上讲解的理论知识布置练习题目,按照题目难度分为两类,一类题目照顾大部分学生的理解和学习程度,适当降低难度,以老师课上讲解的案例为蓝本设计类似的题目,使大部分同学通过理解老师的案例都能自行作答,一类题目是提高类型的题目,可以在数据内容、算法选择等方面设置小陷阱,让学生以提高数据分析结果为目的,不断发现问题,优化模型,这部分题目有一定的难度,学生们可以合作完成。

3.2、以项目为基础进行教学组织

在理论课上可以按照项目过程组织教学内容,要按照数据挖掘与分析项目步骤,在各类算法的课堂案例讲解过程中涉及数据准备、模型构建、模型分析、知识表示等几个方面的内容,注重项目过程的完整性和各步骤之间的连贯。学生的最终课程练习题目中应该有一个小型项目任务,该任务可以分组完成,根据项目任务要求结合所学进行数据挖掘与分析,步骤应该包括数据获取、数据预处理、模型构建、数据挖掘、模型分析、知识表示等一系列内容,根据每章所学内容分段完成数据挖掘各步骤任务。并且要求同一项目任务选择多种不同类型的模型完成,通过对模型评价进行对比分析,确定最优模型,并理解模型的优缺点。

3.3、参加比赛,以赛促学

在教学进行到一定阶段后,组织学生了解一些数据挖掘与分析相关的比赛,帮助学生组织参赛队伍。通过对比赛内容和参赛题目的了解,让学生有目的地进行学习和交流,提高学习积极性和学习效率,做到教、赛、学相长。就本科生而言,刚接触数据挖掘与分析,所掌握的知识和技能非常有限,比赛内容对于同学们很有难度,因此在教学阶段组织学生参与比赛的目的主要是为了提高学生对课程的关注、让学生关注各行业对数据挖掘与分析的实际需求,以及提高学生的学习积极性,通过查阅资料、观看各大比赛作品的专家讲评视频等方法,学习数据挖掘与分析过程,了解常用方法、软件和技术,激发学习兴趣,能够在课堂之外主动了解数据挖掘与分析的前沿技术,做到以赛促学。

3.4、提高学生重视程度

针对学生对课程重视程度不够、学习积极性不高的问题,在开学初,就为学生进行数据挖掘与分析招聘现状分析,基于Boss直聘、智联招聘等较权威的招聘网站,搜集招聘信息,分析用人单位、岗位数量、学历要求、技能要求、薪资水平等数据,让学生对现阶段各行业对数据挖掘与分析人才需求有比较直观的了解,提高学生对这门课程的重视程度,让学生们更积极地投入到学习中去,并以招聘信息中提到的技能要求为目标积极学习。学生们也可以利用课上学习到的技术,自己完成这个分析过程,不断关注数据挖掘与分析相关岗位需求的变化。并且介绍各行业中数据挖掘与分析的应用案例,例如在教育领域,通过对学生学习行为数据和能力数据的分析,提供个性化的学习资料和特色辅导,在交通领域,通过对长时间序列路况数据的分析,自动调整交通指示灯,让交通更加通畅,在医疗领域,通过对病例数据的分析,构建模型帮助医生进行疾病诊断,提高诊断准确率并制定更有效的治疗方案,在金融领域,通过数据挖掘与分析,预测市场趋势和风险,为投资者的决策提供更准确建议。通过这些案例让学生意识到这门课程的重要作用,提高学习兴趣,将更多的精力投入到这门课程的学习中来。

3.5、分组研究,翻转课堂

受近年来计算机软硬件技术的长足进步,在数据存储、大数据处理、人工智能、深度学习等方面的技术都有了迅速的发展,这使得数据挖掘与分析在计算机视觉、语音识别、负责文本分析等方面出现了大量新的技术理论和算法模型,课堂上教学时间有限,因此只能讲解数据挖掘与分析常用技术分类中的经典算法,并说明数据挖掘与分析的发展趋势和主要应用场景,无法将最新的技术全面展开,因此需要大家进行文献学习,了解更为详细的内容。学生分组研究的主要内容可以分为两个方面,一是数据挖掘与分析某一应用场景现阶段的技术发展综述,二是进一步研究目前性能较好的算法模型。这个研究过程中,同学们可以通过学校电子图书馆的免费资源,查询各种文献资料,了解数据挖掘与分析在指定应用场景中的发展现状,包括了基础理论和算法模型,并对比算法模型的优缺点,确定要进一步研究的模型,通过网络资源进行学习,研究算法理论,实现算法模型,给出研究实例,完成一个该算法模型的小型应用,并进行试验验证自己的研究。在反转课堂上,各小组通过对自己研究内容的讲解和与老师同学们的讨论,发现自己学习研究过程中的问题,并提出进一步改进的方案。

3.6、引入对分课堂,提高学习效率

可以引入对分课堂教学模式,提高学生对知识点的掌握。对分课堂是复旦大学心理系张学新老师提出的一种课堂教学改革新模式,将课程分为三个过程,分别为讲授、内化吸收和讨论。在数据挖掘与分析课程中可以选择数据预处理、分类等细节内容多且在理解上容易出现问题的章节,引入对分课堂,在首次课上讲解重点和难点,在讲解过程中不涉及过多的细节,然后让学生们课下对教材进行详细解读进行内化,在下次课上首先进行分组讨论,在组内对自己自己的学习过程和内容进行充分讨论,阐述自己的理解,提出自己的疑问,互相启发,在组内寻求解答,然后在班级范围内与老师进行讨论,通过老师的答疑解惑进一步巩固理论知识,提高学习效率。

3.7、修改课程学习评价方法

传统教学方法中课程结束时的考核方法比较单一,通常为闭卷考试,由于数据挖掘与分析课程的实践性,通常为闭卷的上机考试,该形式无法避免学生通过死记硬背的方式达到获取高分的目的。因此需要对考试方式进行修改。由于在教学改革中已经引入多种师生互动的教学方式,因此可以将互动效果纳入评价体系。这里面包括自学内容的抽检、分组研究报告和翻转课堂表现的评分、各项练习完成情况评价以及参加比赛的额外加分等。通过这些内容和期末考试成绩的综合评定,可以比较客观地评价学生在这门课程中的学习表现,给出合理的课程成绩。

4、总结

数据挖掘与分析课程是计算机相关专业的一门重要的基础课程,在现代社会中各行业对数据挖掘与分析技术都有实际的应用需求,因此每年都会有大量大数据分析师、大数据工程师、数据治理专员、数据科学家、数据安全专员等岗位的人才招聘信息。随着社会对数据挖掘与分析需求的增加,对人才能力要求的提高,学校在数据挖掘与分析课程的教学中也要提高教学要求,提高学生的技术能力,以符合社会的要求。本文对传统数据挖掘与分析教学过程中存在的问题进行了刨析,并有针对性地进行了教学改革方法的探讨。针对教学学时有限教学内容无法全面覆盖的问题,提出了将课程教学内容分为讲授、自学、练习三部分,通过教学与自学相结合的方法,让学生掌握更多的知识。针对章节教学不够连贯,存在知识割裂的问题,提出以项目为基础进行教学组织的方式,让学生掌握数据获取、数据预处理、模型构建、模型分析、知识表示等完整的数据挖掘与分析过程。针对实验题目过于简单,不利于提高学生创新能力的问题,提出练习题目分等级的方法,通过具有一定难度的提高题目,让学生创新方法解决问题。针对学生对课程的重要性认识不足,学习积极性不够的问题,提出通过对招聘现状分析和各行业应用场景的案例介绍,让学生了解数据挖掘与分析技术在各行业的应用,提高学生对课程的重视程度,通过参加比赛,提高学生学习的积极性。针对教学效果,提出引入翻转课堂和对分课堂的教学模式,提高课堂教学效果和学生的学习效率。最后针对课程学习效果评价方法,提出了综合评定法,在课程考试之外增加教学过程中教学互动内容的评价,以便综合评定学生的学习过程和效果。这些方法在我们的教学过程中取得了比较好的效果,在今后的教学过程中还会继续总结改进。

参考文献:

[1]吕琼帅,杨雨,巩跃洪,等.基于“教赛协同”的数据挖掘课程教学改革研究[J].高教学刊,2024,10(10):136-139.

[2]王琪.数据挖掘技术及应用课程的项目式教学实践[J].集成电路应用,2024,41(01):329-331.

[3]金亮,王善勤,苗孟君.数据挖掘在“岗课赛证”融合课程中的应用研究[J].信息与电脑(理论版),2023,35(23):168-170.

[4]韩开山,刘宝芳.案例驱动的教学改革对数据挖掘课程教学效果的影响[J].大学教育,2024,(04):37-40.

[5]任丽媛.应用型人才培养与大数据课程教学改革[J].百科知识,2024,(15):71-73.

[6]刘东江,李雷孝.面向本科教学的数据挖掘教学方法研究[J].电脑知识与技术,2023,19(36):146-148.

作者介绍:王媛媛(1981-),女,山东农业大学信息科学与工程学院,副教授,研究方向:遥感信息提取

项目支持:教育部产学合作协同育人项目(202102245018)

*本文暂不支持打印功能

monitor