基于强化学习行为模型(RLBM)的教学探索——以Python语言程序设计为例

期刊菜单

基于强化学习行为模型(RLBM)的教学探索——以Python语言程序设计为例
Teaching Exploration Based on the Reinforcement Learning Behavior Model (RLBM)—Taking Python Language Programming as an Example

DOI: 10.12677/ass.2025.142159, PDF, HTML, XML,
作者: 肖凯文^*, 仇莫然, 郑莉萍：四川大学锦江学院计算机学院，四川眉山
关键词: Python语言程序设计；强化学习；教学改革；Python Language Programming； Reinforcement Learning； Teaching Reform

摘要: 随着信息技术的飞速发展，Python语言的学习愈发关键，但其传统教学模式在培育学生实践能力上渐显乏力。本研究通过剖析传统教学的弊端，梳理国内外关于Python语言教学改革的成果，提出了基于强化学习行为模型(RLBM)行为模式的教学改革思路。RLBM由：智能体(agent)、环境(environment)、动作(action)和奖励(reward)四大核心要素构成，学生通过不断试错，依据环境反馈的奖励信号来学习最优策略。该教学方法在四川大学锦江学院进行了教学实践，结果表明，此方法极大提升了教学成效、并有效激发了学生自主学习能力，为程序设计类课程教学改革提供创新性的思路与实践参考。

Abstract: With the rapid development of information technology, learning the Python language has become increasingly crucial. However, the traditional teaching model is gradually showing its inadequacy in cultivating students’ practical abilities. This research analyzes the drawbacks of traditional teaching, sorts out the achievements of Python language teaching reform both at home and abroad, and puts forward the ideas for teaching reform based on the behavior mode of the Reinforcement Learning Behavior Model (RLBM). The RLBM consists of five core elements: agent, environment, state, action, and reward. Students learn the optimal strategies by constantly making trial-and-error attempts and relying on the reward signals fed back by the environment. This teaching method has been implemented in teaching practice at Jinjiang College of Sichuan University. The results show that this method has significantly improved teaching effectiveness and effectively stimulated students’ autonomous learning ability, providing innovative ideas and practical references for the teaching reform of programming courses.

文章引用：肖凯文, 仇莫然, 郑莉萍. 基于强化学习行为模型(RLBM)的教学探索——以Python语言程序设计为例[J]. 社会科学前沿, 2025, 14(2): 572-582. https://doi.org/10.12677/ass.2025.142159

1. 引言

在当今数字化时代，Python语言凭借其简洁的语法、丰富的库和强大的功能，已成为众多领域不可或缺的工具。从数据科学、人工智能到Web开发、自动化脚本，Python的应用无处不在，其在就业市场中的需求也持续攀升，学习Python编程对于学生的未来职业发展具有至关重要的意义。

传统的Python语言程序设计教学模式，往往侧重于理论知识的传授，教师在课堂上讲解语法、算法，学生被动聆听、记忆，实践环节相对薄弱。这种教学方式导致学生虽掌握了一定的理论知识，但在面对实际问题时，编程能力不足，缺乏将知识灵活运用的实践经验。例如，在完成一个简单的数据分析项目时，学生可能熟悉相关的数据分析库函数，但却不知如何从实际需求出发，设计合理的数据处理流程，编写高效的代码来实现目标。面对这一现状，本研究提出了基于强化学习行为模式(Reinforcement Learning Behavior Model, RLBM)的教学方式为Python语言教学改革带来了新的思路。强化学习强调智能体(agent)与环境的交互，通过不断试错，依据环境反馈的奖励信号来学习最优策略。将其引入教学中，学生如同智能体，编程学习环境即为其交互的环境，学生在编程实践过程中，根据代码运行结果(奖励反馈)调整编程思路与方法，逐步提升编程技能。这有助于激发学生的学习主动性，培养其解决实际问题的能力，使学生在掌握Python语言知识的同时，更好地适应未来复杂多变的工作需求，为Python语言教学开辟一条创新且高效的路径。

2. 国内外研究现状概述

2.1. OBE教学理念

在高等教育领域的理论研究与实践探索进程中，OBE (Outcome-Based Education)理念备受瞩目。

OBE教学理念的精髓聚焦于学生在历经完整教育流程后所达成的切实学习成效，这一关注点将教育评价的视角从单纯的教学投入转向了最终产出。近两年来，OBE教学理念在高等教育体系内持续深耕拓展，引发了一系列深层次的教育变革诉求。其中，一项关键变革指向构建全新的教育核心架构，即打造“新三中心”以取代传统的“旧三中心”范式[1]。具体而言，在教学主体层面，实现从以教师主导为中心向以学生主体为中心的转变，着重突出学生在学习进程中的自主性与主动性；于教学场域维度，推动以理论知识讲授与实践技能培养紧密融合为中心替换过往单一聚焦课堂讲授的模式，强调学以致用，促进知识向实操能力的转化；从教学目标范畴出发，以着重塑造学生综合能力与核心素养为中心替换单纯的知识传授中心，力求全方位提升学生应对未来社会挑战的本领，为其终身发展筑牢根基[2]。

在国外，OBE理念的应用成果丰硕。以斯坦福大学的计算机科学专业为例，学生在学习过程中需以“主体”的角色完成大量实际项目，充分发挥学生自己的主观能动性，确保毕业后能够迅速适应行业需求[3]。在澳大利亚，墨尔本大学将OBE理念融入食品研究，通过企业实习、案例分析等多种方式，着重培养学生的批判性思维、团队协作和解决实际问题的能力，加强学生的“主体”思想[4]。

在国内，聂鹏[5]提出了一种适用于软件工程专业的“OBE + 混合一流”的教学模式，将传统的“线下”教学进行了时空上的延展。方灿灿[6]将OBE理论与艾宾浩斯遗忘曲线相结合，构建了智慧课堂教学模式并应用于现代汉语课程教学中。王博[7]以OBE理念为核心，以机械电子工程专业的工程教育认证为导向，结合互联网技术，对机械电子工程专业实践课程的教学体系进行了构建。秦华妮[8]针对数据分析与挖掘课程的特点，融合OBE理念进行案例教学，提出“单元案例库+全息式案例库”相结合的案例库设计思路。季薇[9]将OBE理念南京邮电大学校情特色和专业背景相结合，对课程的教学目标、教学内容、教学方法、评价考核机制等各环节进行了重新设计，探索出了一条“润物无声”的课程建设之路。

2.2. 教学个性化

自2022年10月起，我国教育事业发展迎来关键指引[10]。彼时，办好人民满意的教育已然成为教育领域的核心任务，而达成这一目标的关键路径之一便是全力推进教育个性化进程[11]。

例如范茜莹[12]对学生个性特征、学习习惯、能力和潜力进行深入洞察与精准刻画，通过问卷调查、学习行为数据分析、认知测试等多种手段完成，建立了精准的学生个人画像。孙漫娜[13]以基于布迪厄的场域理论“场域–惯习–资本”三大核心概念构建了个性化教学方法。孙佩娟[14]通过在公共基础课的大平台上实现面向个性化教学的课程改革，完成了“以学生为中心”的个性化教育教学模式，谭雯[15]深入分析了高职学生个性化学习需求，构建了以财务大数据分析课程为实例的精准教学模式。冯祖扬[16]利用AIGC构建了一个有效促进学生个性化学习的教育路径。

而国外在针对教学个性化方面的研究和实践也层出不穷。芬兰的教育体系一直秉持个性化教育理念，例如在赫尔辛基的学校中，教学主要以学生为主体，“老师”不是以主导的方式去教学，而是作为“协助者”去引导学生自学、怎样合作，怎样讨论，在学生需要帮助时及时给予帮助[17]。

美国的一些在线教育平台，如Khan Academy，运用人工智能技术分析学生的学习数据，为学生推送个性化的学习路径，帮助学生高效掌握知识[18]。

总体而言，国内研究与国外研究在Python编程教学改革方面具有诸多共性，都重视构建实践场景、提供即时反馈以及激发学生自主学习。但国内研究更注重结合本土学情，强调团队协作、线上线下融合以及个性化辅导，致力于弥补学生基础差异，提高整体教学质量。然而，国内研究在教学资源智能化程度、学生自主学习积极性以及大规模实践推广等方面仍存在一定的提升空间，后续需进一步探索优化。本研究结合了国内外优秀教学模式的优点，探索出一种更科学的Reinforcement Learning Behavior Model (RLBM)教学方法，以提升学生的自主学习性和创新能力。

3. RLBM教学模式设计思想

在基于Reinforcement Learning Behavior Model的Python语言教学模式中，本研究构建了一个以学生为智能体(agent)，教学环境为环境(environment)的交互模型。

3.1. 强化学习行为模式(Reinforcement Learning Behavior Model, RLBM)

强化学习作为一种独特的机器学习范式，蕴含着几个关键要素，这些要素在教学场景中有着清晰的对应与应用。

3.1.1. 智能体

智能体(Agent)是强化学习的核心执行者，它具有感知环境、执行动作并依据环境反馈调整自身行为的能力。从教育心理学角度看，学生作为智能体，是具有主观能动性和认知能力的个体。根据皮亚杰的认知发展理论，学生在学习过程中不断构建和调整自己的认知结构。在Python编程学习中，学生需要主动感知编程环境中的信息，如代码运行结果、错误提示等，并通过执行编写代码、调试程序等动作来探索解决问题的方法。例如，当学生面对一个Python编程任务时，他们需要运用已有的知识和经验，思考如何设计算法、选择合适的函数和数据结构，这一过程就是智能体在感知环境后做出决策的体现。

3.1.2. 环境

环境(Environment)是智能体活动的舞台，涵盖了智能体能够感知的所有信息以及这些信息随智能体动作而发生的变化。在Python教学中，编程环境中的语法规则、问题描述、示例代码以及编译器或解释器的反馈等构成了学生学习的情境。例如，学生编写一段Python代码用于数据分析，代码运行时的报错信息、输出结果，以及教师提供的关于代码优化方向的提示，都属于环境反馈。这些反馈如同智能体在环境中行动后获得的奖励或惩罚，指引着学生对代码进行调整与改进。

3.1.3. 动作

动作(Action)是智能体在特定环境状态下所采取的行为决策。在编程学习中，学生的动作表现为编写、修改代码的一系列操作。站在认知心理学的信息加工理论的角度，学生在执行动作时，需要对问题进行分析、编码，然后通过操作代码来输出解决方案。例如，学生在解决一个数据处理问题时，可能会通过定义函数、调用库函数、设置循环和条件判断等动作来实现数据的清洗、转换和分析。在实际教学中，教师可以引导学生对不同的动作进行比较和反思，例如对比不同的算法实现方式，帮助学生理解不同动作对结果的影响，从而培养学生优化代码的意识和能力。

3.1.4. 奖励

奖励(Reward)是环境对智能体行为的即时反馈，用于衡量智能体所采取动作的优劣。在教学中与教育心理学中的强化理论紧密相关。斯金纳的操作性条件反射理论指出，正强化(给予奖励)可以增加行为发生的频率，负强化(撤销惩罚)也能起到类似效果。在教学中，奖励机制具有多样化的呈现形式。当学生编写的代码能够正确运行、高效解决问题、遵循良好的编程规范(如代码结构清晰、变量命名合理等)时，便可获得诸如教师的表扬、较高的作业评分、同学的认可等正向奖励；反之，若代码出现语法错误、逻辑漏洞、运行效率低下，则会收到诸如错误提示、要求重新修改等负向反馈，这促使学生反思并调整编程策略。通过这种奖励机制，学生将在不断试错与反馈中逐渐优化自身行为，提升编程能力。

3.2. 基于RLBM的教学模式构建原则

3.2.1. 以学生为中心

在基于强化学习行为模式的Python语言程序设计教学中，以学生为中心是首要原则。学生作为学习的主体，其个体差异在编程学习过程中表现得尤为显著。不同学生在编程基础、逻辑思维能力、学习风格以及学习动机等方面存在多样性。有些学生可能在入学前就具备一定的编程经验，对基本的语法结构和编程逻辑有初步了解，能够较快地掌握新知识；而另一些学生则可能是零基础，面对同样的知识内容需要更多的时间和引导来消化吸收。有些学生擅长通过理论学习构建知识体系，再进行实践操作；而有些学生则更倾向于在实践中探索，通过反复试错来总结经验。

为了满足不同学生的学习需求，教学模式应提供个性化的学习路径。在课程初始阶段，借助在线学习平台的前置测试，全面了解学生的编程基础，包括对变量、数据类型、控制结构等基础知识的掌握程度，以及是否有过项目实践经验等。根据测试结果，为学生制定专属的学习计划。对于基础薄弱的学生，推送基础强化模块，涵盖详细的语法讲解、简单易懂的示例代码以及循序渐进的练习题，帮助他们夯实基础；对于有一定基础的学生，则提供进阶拓展内容，如深入的算法分析、复杂项目案例剖析，激发他们的挑战欲望。在实践环节，鼓励学生根据自身兴趣选择项目主题，无论是游戏开发、数据分析还是Web应用构建，让学生在自己感兴趣的领域深入探索，充分发挥主观能动性，实现个性化成长。

3.2.2. 动态适应性调整

教学过程具有动态性，学生的学习状态随时可能发生变化，因此教学内容与难度的动态适应性调整至关重要。随着课程的推进，学生在不同阶段对知识的掌握程度和技能水平参差不齐。例如，在学习函数这一章节时，部分学生可能迅速理解函数的定义、参数传递等概念，并能灵活运用函数解决简单问题；而另一部分学生可能在函数的嵌套调用、递归函数等复杂应用上遇到困难。

为确保学生的学习进程顺畅，教学系统需实时跟踪学生的学习表现。通过在线编程平台记录学生的代码提交情况，包括代码的正确性、运行效率、错误类型及出现频率等信息；分析学生在课堂互动、小组讨论中的参与度和表现，判断学生对知识的理解深度。一旦发现学生学习受阻，系统立即启动调整机制。若较多学生在某一知识点上错误率较高，教师可在课堂上及时进行集中讲解，补充更多示例，从不同角度阐释难点；若个别学生出现问题，系统自动推送针对性的辅导资料，如专项练习题、知识点讲解视频，帮助学生查漏补缺。同时，根据学生的整体学习进度，灵活调整后续教学内容的难度和进度，确保教学节奏与学生的学习能力相匹配，让每个学生都能跟上教学步伐，在学习中不断积累信心。

3.2.3. 激励强化机制

激励强化机制是激发学生学习动力、保持学习热情的关键。在Python语言程序设计学习中，学生需要持续投入大量的时间和精力，面对复杂的语法规则、逻辑难题以及频繁出现的错误，容易产生挫败感，导致学习积极性下降。因此，合理设置奖励机制，对学生的学习行为进行正向强化，显得尤为重要。

奖励的形式应丰富多样，全方位覆盖学生学习的各个环节。在代码质量方面，当学生编写的代码结构清晰、逻辑严谨、遵循良好的编程规范，如变量命名富有意义、代码注释详细准确，教师给予高度评价，在班级内展示优秀代码示例，供其他同学学习借鉴，让学生获得成就感；在项目实践中，对于能够创新性地运用所学知识解决实际问题，提出独特解决方案的小组或个人，给予额外的项目加分、荣誉证书或小奖品，激励学生勇于创新；对于学习进步明显的学生，无论起点高低，只要在一段时间内知识掌握程度、编程能力有显著提升，及时进行表扬和奖励，肯定他们的努力付出。通过这些奖励措施，让学生在学习过程中不断收获认可，将学习的外部激励转化为内在动力，主动投入到编程学习中，持续挑战自我，提升编程素养。

4. 基于RLBM行为模式的高校Python语言程序设计教改具体实践结果分析

4.1. 实践方案设计

4.1.1. 实验对象选取

本次教学实践选取了来自不同专业、不同年级的学生作为实验对象，旨在确保样本的多样性，全面反映基于强化学习行为模式的教学效果。实验组涵盖了计算机科学与技术专业、信息管理与信息系统专业以及数学与应用数学专业的大二学生，共计120人；对照组则选取了相同专业、相同年级的另外120名学生。实验组与对照组在入学时的平均绩点、数学基础以及编程前置课程成绩等方面均无显著差异，为后续教学效果对比提供了可靠的基础。

计算机科学与技术专业的学生具备一定的编程理论基础，对计算机系统原理、数据结构等知识有初步了解，他们在学习Python语言程序设计时，更侧重于将其应用于软件开发、算法实现等领域；信息管理与信息系统专业的学生则对信息系统的构建、数据分析与处理有着浓厚兴趣，期望通过Python掌握数据挖掘、数据库管理等技能；数学与应用数学专业的学生数学功底扎实，逻辑思维能力强，希望借助Python进行数学建模、科学计算等实践。不同专业学生的知识背景和学习需求差异，使得教学模式能够在多维度得到检验，观察强化学习模式是否能有效满足各专业学生的个性化学习诉求，助力他们将Python技能与专业知识深度融合，提升综合应用能力。

4.1.2. 实践周期安排

整个教学实践周期为16周，分为基础学习、项目实践、总结巩固三个阶段。基础学习阶段(第1~6周)侧重于Python语言的基础语法、数据类型、控制结构、函数定义等核心知识的传授。教师通过线上视频讲解、线下课堂演示等方式，引导学生熟悉编程环境，掌握基本编程技能，每周安排2~3次线上编程练习，及时巩固所学知识，平台自动批改反馈练习结果，帮助学生快速发现问题、纠正错误。

项目实践阶段(第7~14周)是教学实践的核心环节，以小组为单位(每组4~5人)开展项目驱动式学习。依据不同专业特点，设置了多样化的项目主题，如计算机专业侧重开发小型Web应用程序、信息管理专业聚焦企业数据分析项目、数学专业围绕数学建模与算法实现展开。每周安排至少6课时的项目实践时间，包括小组讨论、代码编写、调试优化等环节，期间教师定期巡视指导，针对小组遇到的共性问题组织集中讲解，引导学生运用强化学习思维，不断尝试不同技术方案，根据项目反馈优化代码质量与功能实现。

总结巩固阶段(第15~16周)主要用于项目成果展示、经验总结以及知识查漏补缺。每个小组以PPT汇报、现场演示等形式展示项目成果，分享项目开发过程中的收获与挑战，教师与其他小组同学进行提问点评，促进相互学习借鉴；同时，教师依据教学过程中的数据记录，包括学生代码提交情况、项目完成进度、在线学习活跃度等，分析学生知识薄弱点，针对性地进行复习串讲，强化重点知识理解，助力学生构建完整的Python编程知识体系，为后续学习与应用奠定坚实基础。

4.2. 具体实践过程

4.2.1. 知识传授阶段

在知识传授阶段，摒弃传统的单一理论灌输模式，采用案例驱动的教学方法，以生动且贴近实际的案例为载体，深入讲解Python语言的语法知识与编程逻辑。例如，在讲解函数定义与参数传递时，引入“学生成绩统计分析”案例，给定一组学生的各科成绩数据，要求编写函数实现计算平均分、总分、各科目最高分等功能。教师通过逐步剖析如何定义函数、合理设置参数以接收数据，以及运用循环与条件判断在函数内部进行数据处理，让学生在解决实际问题的过程中理解函数的作用与用法，而非单纯记忆语法规则。

同时，借助在线学习平台的优势，拓展学生的学习边界。平台整合了丰富的拓展资料，如Python官方文档的详细解读、知名技术博主的进阶教程视频、开源社区的优质代码示例等，学生可根据自身学习进度与兴趣自由选择学习内容，进行知识的深化与拓展。平台还设置了知识问答社区，学生在学习过程中遇到的疑难问题，不仅能得到教师、助教的及时解答，还能与同学展开讨论交流，形成良好的学习互助氛围，促进知识的吸收与内化。

4.2.2. 实践操作环节

实践操作环节是培养学生编程技能的关键阵地。教师依据课程进度与学生知识掌握程度，精心布置具有挑战性的项目任务，如开发一个基于Python的小型电商网站后台管理系统，涵盖用户管理、商品管理、订单处理等功能模块。学生以小组形式开展协作编程，每个小组如同一个协同作业的智能体团队，共同面对项目中的复杂问题。

在小组协作过程中，成员充分发挥各自优势，分工明确，有的负责数据库设计与搭建，运用SQLAlchemy等ORM框架实现高效的数据存储与查询；有的专注于后端业务逻辑开发，利用Flask或Django框架处理用户请求、实现数据交互；有的致力于前端界面设计，结合HTML、CSS与JavaScript技术，打造简洁美观、操作便捷的用户界面。期间，智能体引导实践发挥重要作用，教师预先设定一些引导性问题与提示，如同智能体在探索环境时获得的启发信息。例如，当小组在处理订单状态更新的逻辑时遇到困难，教师提示可以参考电商平台常见的订单流转模式，引导学生思考如何设计合理的状态机，通过状态转移实现订单的不同处理阶段，帮助学生突破思维瓶颈，逐步完成项目任务，在实践中积累丰富的编程经验，提升解决复杂问题的能力。

4.2.3. 反馈改进周期

建立定期的反馈改进周期是保障教学质量持续提升的重要举措。每周教师安排固定的时间对学生本周的学习成果进行评估，包括代码质量检查、项目进度审核以及小组协作表现评价等。从代码规范性角度，检查变量命名是否遵循统一规范、代码结构是否清晰合理、注释是否详尽准确；在项目进度方面，对比预设的阶段性目标，判断小组是否按时完成任务，若有滞后，分析原因是技术难题、分工协作问题还是时间管理不善；针对小组协作表现，观察成员沟通是否顺畅、分工是否均衡、是否能够相互支持解决问题。

根据反馈结果，教师及时调整教学策略。若发现多数学生在某一知识点或编程技巧上存在共性问题，如对异步编程理解困难，导致项目中涉及的数据加载与更新出现卡顿，教师立即组织专项讲解，补充更多深入浅出的示例，加深学生理解；若部分小组在协作过程中出现分工不合理、成员参与度不均衡的情况，教师介入协调，引导小组重新优化分工，明确职责，确保每个成员都能充分发挥作用。同时，基于反馈对教学资源进行优化，如更新案例库，引入更具时效性与挑战性的项目案例；调整在线学习平台的知识推送策略，为学习困难学生推送基础强化内容，为学有余力的学生提供前沿技术拓展资料，满足不同层次学生的学习需求，推动教学效果不断进阶。

4.3. 实践结果评估

4.3.1. 学习成绩对比

经过16周的教学实践，实验组与对照组学生在期末考试成绩上呈现出显著差异。期末考试涵盖了Python基础知识、编程应用、项目实践、高阶算法、代码质量以及编程效率等多个维度，全面考查学生的知识掌握程度与综合运用能力。结果如图1所示，实验组平均成绩达到81.1分，而对照组平均成绩为

Figure 1. Comprehensive Evaluation

图1. 综合评价

72.3分，实验组高出对照组接近9分。如图2所示，进一步细分成绩分布，实验组在80~90分段的学生比例达到40%，90分以上的高分段学生占比15%；对照组80~90分段学生比例仅为25%，90分以上仅占5%，低分段(60分以下)学生比例却高达10%，而实验组低分段学生比例控制在3%以内。

通过成绩对比折线图，如图3所示，可以更为直观地看出两组学生的差异。在基础知识部分，实验组学生由于在学习过程中通过不断实践强化对语法、数据类型等知识的理解，平均得分率达到85%，对照组为75%；在编程应用题目上，实验组学生凭借项目实践中积累的经验，能够灵活运用所学知识解决实际问题，得分率达到80%，对照组仅为65%；项目实践环节更是差距明显，实验组凭借小组协作与强化学习过程中的策略优化，项目完成质量高，得分率达到88%，对照组受限于传统教学模式下的被动学习，得分率仅为70%。

进一步的，针对实验组与对照组的期末考试成绩数据，本研究展开了更深入的方差分析和回归分析。首先，设定原假设为RLBM教学模式与传统教学模式下学生的平均成绩不存在显著差异，借助SPSS进行方差分析(ANOVA)操作，得出组间方差与组内方差，组间方差是对组间变异的量化，组内方差是对组内变异的量化，而F值即为组间方差与组内方差的比值，在本次研究中，经过软件计算得出这个比值为4，这表明组间差异相对组内差异较为显著。在本研究中，软件最终输出的P值为0.009，这意味着在原假设(两种教学模式对学生成绩无显著影响)成立的情况下，得到当前样本数据或者更极端数据的概率仅为0.9%。在这项数据的基础上可以得出，RLBM教学模式与传统教学模式在学生成绩上存在显著差异的结论。

此外，为深入剖析RLBM教学模式对不同学生的影响，本研究进行了回归分析。以学生的期末考试成绩作为因变量，将教学模式(RLBM教学模式赋值为1，传统教学模式赋值为0)设为自变量，同时纳入可能影响成绩的其他控制变量，如学生的入学基础成绩、每周学习时长等。运用SPSS软件进行线性回归分析操作，通过计算得出回归方程。结果显示，教学模式这一自变量的回归系数为8.8，该系数在统计学上具有显著性。这表明，在控制了其他因素的影响后，RLBM教学模式对学生期末考试成绩有着显著的正向影响，即采用RLBM教学模式能够显著提升学生的成绩。同时，在本次回归分析中，R²值达到了0.75，这意味着模型能够解释75%的学生成绩差异，说明除了教学模式外，还有其他因素对学生成绩产生了一定的影响，这为后续进一步优化教学策略提供了方向。

通过以上数据，可以充分地得到结论：基于强化学习行为模式的教学方法在提升学生学习成绩方面具有显著优势，能够有效帮助学生更好地掌握Python语言程序设计知识，提高编程应用能力。

Figure 2. Score distribution

图2. 成绩分布

Figure 3. Scoring rate

图3. 得分率

4.3.2. 编程能力提升

除了学习成绩，学生编程能力的提升也是教学实践关注的重点。通过分析学生在实践项目中的代码，从代码复杂度、错误率以及问题解决效率等多个指标来衡量编程能力的成长。

代码复杂度方面，以项目代码中的函数嵌套深度、模块耦合度作为衡量指标。在课程初期，实验组与对照组学生编写的代码函数平均嵌套深度都在2~3层，模块耦合度较高，代码结构较为松散。随着教学的推进，实验组学生在强化学习模式下，不断尝试优化代码结构，到课程结束时，函数平均嵌套深度优化至4~5层，模块耦合度降低30%，代码逻辑更加清晰，功能模块划分更加合理；对照组学生代码复杂度提升相对缓慢，函数平均嵌套深度仅达到3~4层，模块耦合度降低15%。

错误率统计显示，实验组学生在项目实践前期，代码错误率约为30%，主要集中在语法错误、逻辑漏洞以及对库函数的错误调用等方面。在教师反馈与自主探索改进过程中，错误率逐渐下降，到后期稳定在10%左右，且多为一些边界条件处理不当的细微错误。对照组学生前期错误率同样在30%左右，但由于缺乏有效的反馈引导机制，后期错误率仍维持在20%上下，且重复出现的错误较多。

4.3.3. 学习兴趣激发

为了评估新模式对学生学习兴趣的激发效果，采用问卷调查与课堂参与度相结合的方式进行分析。问卷调查结果显示，实验组学生对Python语言程序设计课程的兴趣度提升显著。在课程开始前，仅有60%的学生表示对编程有一定兴趣，经过一学期的学习，这一比例上升至85%。其中，认为课程“非常有趣，充满挑战，愿意主动深入学习”的学生占比从最初的20%增长到45%；表示“比较感兴趣，愿意花更多时间学习”的学生从40%提升至40%。而对照组学生兴趣度提升相对平缓，课程开始前有55%的学生有一定兴趣，学期结束后为65%，“非常有趣”的学生占比从15%增长至20%，“比较感兴趣”的学生占比从40%变为45%。对此。我们做了相关的词云统计，将学生对本次课程实验的评价利用词云显示，如图4所示，其中“有趣”关键词非常突出。

Figure 4. Word cloud

图4. 词云

课堂参与度方面，通过记录学生在课堂提问、小组讨论、项目展示等环节的参与频率与表现来衡量。实验组学生课堂主动提问次数平均每场达到10次以上，小组讨论积极参与度达到90%，在项目展示环节能够自信地阐述项目思路、技术实现以及创新点；对照组学生课堂主动提问次数平均每场仅为5次左右，小组讨论参与度为70%，项目展示时表现相对拘谨，阐述内容深度与创新性不足。

此外，实验组学生在课余时间自发组织编程学习小组、参加线上线下编程竞赛与开源项目的人数比例达到30%，对照组仅为10%。这些数据充分反映出基于强化学习的教学模式能够极大地激发学生的学习热情，培养学生的自主探索欲望，让学生从被动学习转变为主动求知，为学生的持续学习与成长注入强大动力。

5. 总结与展望

本研究将强化学习创新性地与高校Python语言程序设计教学融合，通过系统的理论构建、严谨的实践方案设计，提出了基于强化学习行为模型(RLBM)的教学方法，并在四川大学锦江学院计算机学院《Python语言面向对象程序设计》的课程中进行了有效应用。实践结果表明，相较于传统教学模式，基于强化学习的教学方法优势明显。在学习成绩上，实验组学生平均成绩高出对照组9分，并且各题型得分率均显著提升，反映出学生对知识的深入理解与灵活应用能力；编程能力方面，实验组代码复杂度优化、错误率降低、问题解决效率大幅提高，彰显出强化学习对编程思维与技能的有力促进；学习兴趣激发层面，实验组学生课程兴趣度从60%跃升至85%，课堂参与度、课余自主学习积极性显著增强，实现了从被动学习向主动求知的转变。这些转变不仅有利于学生取得良好的成绩，也为以后的职业发展构建了坚实的基础。

致谢

衷心感谢四川大学锦江学院为我提供了良好的学习环境和丰富的学术资源，使我能够顺利完成本篇论文。特别感谢计算机学院的各位老师在课程改革过程中给予我的支持和帮助。你们的指导不仅在学术上为我提供了宝贵的思想和灵感，也让我在实践中不断提升自己。

NOTES

^*通讯作者。

参考文献

[1]	Spady, W. (1995) Outcomes-Based Education: Critical Issues. American Association of School Administrators.
[2]	夏泉永, 赵肖红. OBE视域下开放教育学习范式: 特征、价值及实施路径[J]. 宁波开放大学学报, 2023, 21(3): 13-17.
[3]	徐辉, 杨珣艺. 迈向教育“新征程”: 美国斯坦福大学数字人文教育的内容与支撑平台[J]. 外国教育研究, 2024, 51(7): 82-99.
[4]	易翠平, 谭洪卓, 方忠祥. 澳大利亚高校科教融合的科研体系与食品研究生培养——以墨尔本大学为例[J]. 粮油食品科技, 2025, 33(1): 32-38.
[5]	聂鹏. “OBE+混合一流”教学模式研究与实践——以国家级混合式一流课程“Web服务与RESTful技术”为例[J]. 职业技术, 2025, 24(1): 80-88.
[6]	方灿灿. “OBE+艾宾浩斯遗忘曲线”模式下智慧课堂教学模式研究——以现代汉语课程为例[J]. 海南开放大学学报, 2024, 25(4): 73-79.
[7]	王博. 基于互联网+OBE理念下面向机械电子工程专业实践与理论课程改革探索[J]. 科技风, 2024(36): 34-36.
[8]	秦华妮. 融合OBE理念的数据分析与挖掘课程案例教学探索[J]. 高教学刊, 2024, 10(36): 139-142+146.
[9]	季薇, 吴晓欢, 刘子威, 等. 基于思政与OBE理念融合的数字信号处理课程建设[J]. 高教学刊, 2024, 10(36): 36-39.
[10]	施炯, 李君. 面向工程教育认证的物联网工程专业课程体系构建[J]. 宁波工程学院学报, 2022, 34(1): 103-108.
[11]	王琳, 刘军利, 尚虹宇, 等. 基于产教融合的物联网专业实践教学创新模式探索[J]. 计算机教育, 2022(2): 67-72+78.
[12]	范茜莹, 姚琳, 崔晓龙. 面向个性化编程能力培养的Python教学模式探索[J]. 计算机教育, 2024(12): 182-187.
[13]	孙漫娜. 场域理论视角下高职商务英语个性化教学策略研究[J]. 科教文汇, 2024(24): 153-156.
[14]	孙佩娟. 面向个性化教学的高校计算机类公共基础课程改革研究[J]. 信息系统工程, 2024(12): 153-156.
[15]	谭雯, 胡越, 朱晓丹. 基于个性化学习视角的高职课程精准教学模式构建研究——以H高职院校财务大数据分析课程为例[J]. 中国管理信息化, 2024, 27(24): 116-118.
[16]	冯祖扬. AIGC有效促进个性化学习的信息科技教学实践[J]. 中国信息技术教育, 2024(23): 78-80.
[17]	刘晓文. 芬兰教育集群“异质分组教学”模式的教育理念、实践特征及其对我国美术教学的启示[J]. 西北美术, 2024(2): 92-98.
[18]	Forbes (2024) Khan Academy SAT Preparation Success Points to Post-SAT Future. https://www.forbes.com/sites/rayravaglia/2024/11/26/khan-academy-sat-preparation-success-points-to-post-sat-future/, 2025-01-17.

为你推荐

友情链接