• 收藏
  • 加入书签
添加成功
收藏成功
分享

决策树基本原理教学:以学生为中心的课堂设计

蒋金洋 杨蕊瑜 李万琪
  
应急媒体号
2023年31期
广安职业技术学院 四川省广安市 638000

打开文本图片集

摘  要:随着教育技术的不断发展,越来越多的教育者开始探索将各种算法和模型引入到教学设计中。其中,决策树作为一种重要的机器学习方法,具有很高的实用价值。本文旨在探讨决策树的基本原理,并设计一套有效的教学计划,使学生能够深入理解决策树算法的内涵和应用。通过课前学情分析、重难点的预判,课中理论与实践相结合的教学方式,课后设置分层作业,提高学生对决策树的掌握程度,培养学生的专业素养和综合素质,为未来实际问题的解决提供坚实的理论基础。

关键词:决策树;教学设计;以学生为中心

引言

决策树是一种重要的机器学习方法,具有直观、易理解的特点。近年来,随着教育技术的蓬勃发展,决策树作为一种常见的机器学习算法,在数据分析、模式识别等领域得到了广泛应用,越来越多的教育者开始探索将决策树等机器学习算法和模型引入到教学设计中。然而,对于学习者而言,理解决策树的基本原理并掌握其应用仍然是一项挑战。因此,本文将深入探讨决策树的基本原理,并阐述如何将其应用到教学设计中,以促进教育质量的提升本文将通过详细的教学设计[10],旨在帮助学生深入学习决策树算法。

一、决策树的基本原理

决策树是一种基于树状结构的模型,可用于分类和回归问题。决策树学习是以实例为基础的归纳型学习算法,从一组无规则、无次序的事例中推导出决策树的表示形式的分类规则[1]。决策树包括树结构、根节点、中间结点、树叶等基本要素,采用自上向下的算法,对内部节点的属性值进行比较,利用不同属性值判断不同节点下的分支,并在叶结点得出结论。

根结点为决策树的起始节点,它代表整个数据集,通常选择一个特征,根据该特征的属性值将数据集划分为不同的子集。比如判断动物是否为哺乳动物时,先判断体温,如果体温是恒温的可能是哺乳动物,如果冷血的就不是哺乳动物,体温这一特征属性就是根节点。中间结点是根节点之后的节点,也称为内部节点。它们进一步划分数据集,并根据不同的特征和属性值将数据分配到下一个节点。在上述案例中基于体温判别后继续向下判别,基于胎生特征判断动物是否是胎生,胎生这一特征属性是中间结点。树叶也称为终端节点或叶子节点,是决策树的最底层节点。它们不再进行数据集的划分,而是代表数据集中的一个具体类别或输出值。树叶节点是决策树的最终结果,用于做出预测或分类。比如在这个举例中目的是判断动物是否为胎生动物,那么判断结果为树叶,只能是哺乳动物和非哺乳动物。所以从根到叶结点的一条路径对应一条分类规则,整棵决策树对应一组分类规则[2]。

二、决策树教学实施方法

(一)学生学情分析。通过微课视频、MOOC等网络资源掌握学生的整体情况,学生通过资源自学决策树的基本原理,82%以上的同学能看懂决策树的简单分类。基于学情将学生分为三个层次分别代表优秀学生、中等水平学生和基础稍弱的学生。同时,分析高职学生的特点:1.学生的抽象总结能力有待进一步提高;2.喜欢讨论,对手机或电脑的视频资源感兴趣;3.传统机械化记忆公式,但效果不佳;喜欢新型可视化记忆方式。通过学情分析后,设置教学目标、教学重点,基于课前任务预判教学难点。

(二)实际问题情景导入。从实际问题入手,让学生想象自己正在面临选礼物问题:长辈家的孩子要过生日了,你打算送一份礼物祝贺,根据你的预算,有四份礼物在你的备选清单里面,分别是口红,包包,Xbox和限量版球鞋。你会考虑哪些因素,然后决定送这四份礼物中的哪一份礼物呢?然后课上做出分析,引出决策树算法,介绍其基本原理和应用场景。

(三)决策树的建立与剪枝[5-6]。阐述决策树的建立过程,包括递归地选择最佳分裂属性、生成子节点等步骤。介绍剪枝技术,防止决策树过拟合,提高模型的泛化能力。如图1所示,采用联想法介绍决策树的组成:决策树倒过来就是一棵树,树由树根,树枝,树根组成。决策树由树叶,根结点和中间结点。我们会通过图像化的方式来展示决策树的结构和分类过程,让学生更加直观地理解决策树的算法。

(四)理论讲解与案例分析。在理论课程中,首先进行决策树基本原理的讲解,包括概念、信息熵、信息增益等。通过完成礼物分类的动画分析,演示决策树的构建过程,让学生理解决策树在实际问题中的应用。如图2所示是决策树完成礼物分类案例的过程分析,其算法流程为:1)创建数据集2)训练决策树算法3)测试新样本。再将这棵树包含的数据信息整理成我们容易理解的数据集的框图形式。

接着,通过图3的数据分类小游戏,检测同学们对特征和标签的掌握,闯关训练在提升学生的学习兴趣和专注度,并制作出数据集,如图4所示。

(五)实践操作与编程实现[8]。在实践环节,将学生分成小组,每个小组选择一个实际问题,应用决策树算法进行分析和解决。首先,加载数据集(包括创建数据集,分别提取标签和特征);其次,通过训练模型(包括选择算法,训练算法),掌握决策树算法的定义函数和训练函数意思以及参数;最后,预测新样本的礼物类别(自行设置特征值,查看预测结果),掌握predict函数意思以及参数。通过小组项目,学生能够更好地理解决策树在不同领域的应用,并锻炼团队协作能力。引导学生使用Python或其他编程语言实现简单的决策树算法。通过手动编写代码,加深学生对算法原理的理解,培养其动手能力。

(六)课程思政的融入[4][9]。决策树的原理讲解可以融入课程思政的内容。决策树的思想可以总结为将一个问题分解成多个相关的子问题,通过逐步解决相对容易的子问题从而解决最终的问题。从而教育同学们在生活中亦可以如此,在遇到困难和挫折时,不要轻易退缩和放弃,我们可以根据现有的能力将复杂的问题不断的分解成相对简单独立的问题,再去逐个解决,各个击破。不能首先想着解决复杂问题,这样往往会无从下手。

(七)总结和评价:教师对本堂课的学习内容进行总结。包括决策树的原理、决策树的实战流程,并让学生分析本堂课的收获,不仅限于知识层面的收获。评价包括教师评价和学生互评。教师通过出勤率、课堂表现、小组完成的任务对学生的本堂课进行评价。出勤率和课堂表现可以分别借助人脸识别技术和表情识别技术进行分析学生的课堂状态,帮助教师改进教学方法和调整教学进度。同时借助信息化手段,让学生对本堂课自己或者其他学生的表现进行打分评价,实现生生互评。

(八)课后拓展。布置课后分层作业,基本任务是要求学生独立自己寻找一个合适的数据集,并使用决策树算法进行分类。进阶任务是优化决策树算法,并使用该方法预测是否患有乳腺癌,对已经生成的决策树模型进行优化和调整,提高其准确率和鲁棒性。增值任务是查阅资料,决策树算法应用在哪些案例中。要求小组项目报告,学生需展示他们在实际问题中应用决策树算法的过程和结果。通过展示,检验学生对决策树应用的实际能力。

三、教学效果评估

(一)基本数据分析。基于课程平台全过程采集的数据,采用多维度评价模型,对学生在本次课的表现进行知识和能力评价,结果显示AB层次不达标的有多少人,C层次不达标的同学有多少人,主要是决策树的哪个知识点不合格。对于C层次不达标的同学继续重点引导和关注,提供个性化指导,安排如下:1.教师对C层次不达标的同学开展一对一线下指导,分析原因,给出对策;2.各小组组长小组内部对这些同学给予一对一帮扶。

(二)增值数据分析。本小节从学生出勤、随堂练习、信息检索、软件使用、团队意识、课堂表现、自评互评、课后作业八个方面来分析每位同学增值成长,并进行记录,实现对学生的全程跟踪,形成学生个人成长画像,分析学生较上一学习模块的学习情况,关注个体差异,实施精准帮扶。

(三)教学特色。1.直观性:决策树的原理可以通过实际的案例和数据可视化来展示,使学生能够直观地理解算法的工作原理。通过这种方式,学生可以更好地理解决策树如何从数据中学习和做出决策,将建模思想贯穿全课堂,逐步提升学生提出问题、分析问题和解决问题的能力,突破教学难点;2.实践性:决策树算法的教学不应仅停留在理论层面。通过设计实际的项目或实验,应用jupyter notebook软件检验,让学生亲自动手实践决策树算法,可以加深他们对算法的理解和实际操作能力,提升职业素养;3.团队合作性[7]:以学生为中心的课堂设计强调学生的参与和互动。实践采取团队项目式完成,培养学生的团队合作和协调能力,通过小组讨论、案例分析和实际问题解决等方式,鼓励学生积极参与,提高他们的学习兴趣和动力;4.师生互评:充分利用信息化手段进行师生互评,建立有效的反馈机制,及时了解学生的学习情况,对学生的学习问题进行指导和解答。同时,评价学生的表现,给予积极的反馈和建设性的建议,促进学生的学习进步。

(四)课堂不足。1.学生基础差异:由于学生的背景和经验不同,对于决策树的理解和接受程度也会有所差异。一些基础较差的学生可能会在互动和实践中感到吃力,而一些基础较好的学生可能会觉得课程内容过于简单;2.时间管理问题:决策树原理虽然不难,但是很多同学在实操的过程中不熟悉机器学习建模流程导致这个环节的时间比预计时间长。

(五)教学改进。后续教学过程中,教师可以提前把建模流程作为资料推送给学生,先自学,在课中也可以比对建模流程进行机器学习算法的建模。对于课上对问题仍不熟悉的同学,可以增加课后沟通引导,并推送优秀作业给予奖励。

四、结论与展望

决策树是一种强大的机器学习算法,广泛应用于分类和回归问题。在本文中,我们详细介绍了决策树的基本原理,包括其工作机制、优点、缺点以及如何解决其缺点。为了更有效地教授这些知识,我们提出了一种以学生为中心的课堂设计。通过这种方式,我们发现学生能够更好地理解和应用决策树,从而提高他们的机器学习技能。通过决策树的基本原理教学设计,学生能够全面理解决策树算法,并通过实践应用提高对该算法的掌握程度。教学效果评估显示,学生在知识方面和综合素质方面都取得了显著的进步。

尽管决策树是一种强大的工具,但它并不是万能的。未来研究可以探索如何结合其他算法,如集成学习,以改进决策树的性能。此外,随着大数据和云计算的发展,决策树算法的并行化和分布式实现也值得进一步研究。最后,教育工作者可以进一步拓展教学内容,引入更多的机器学习算法,培养学生的综合数据科学能力。

参考文献:

[1]陈芳.基于决策树的个性化网络教学系统的设计与实现[D]:[硕士学位论文].南京:东南大学,2015.

[2]张理强.决策树生成系统[D]:[硕士学位论文].太原:太原理工大学,2003.

[3]田苗.试论人工智能技术对职业教育教材出版的影响[J].出版参考,2023(7):26-29.

[4]张博.新时代高校“课程思政”建设研究[D].吉林大学,2023.

[5]肖睿.机器学习基础[D].北京:人民邮电出版社,2021.

[6]周志华.机器学习[D].北京:清华大学出版社,2018.

[7]万通明.基于《机器学习》中决策树学习的思政教育[J].Industrial & Science Tribune,2021(20)17.

[8]丁智斌等.数据挖掘在高校成绩中的分析应用[J].计算机工程与设计.2006.2(590-592)

[9]何亚非.在高职院校中加强社会主义荣辱观教育[J].教育与职业理论版.1004-3985(2007)32-0116-02

[10]廖宁,陈怡然,杨倩,等.以"三平台,三结合"行业实践为引领的教学创新研究——以机器学习课程为例[J].科教导刊,2023(14):22-24..

本文章系基于人工智能何大数据技术的院(系)教学质量评价实践教改项目(GAZYJG2023-25);面向智慧消防的室内火灾监测与报警系统研究(GAZYKY-2023A08);基于数字化转型的高职教师队伍发展研究(GAZYKY-2023B08)结题成果。

*本文暂不支持打印功能

monitor