Research on Application of Generative AI in the Resource Construction of “Data Analysis and Mining” Course
Generative AI is a tool for text (including code), image and video generation with the help of modern deep learning techniques. The Data Analysis and Mining course is characterized by its technical complexity, tool abstraction, and extensive code, which requires a complete mastery of numerous python tool commands to be able to operate it more proficiently. In addition, the learning resources of the course are scattered, the source of the case code is not clear enough, and the code annotations are not detailed enough, thus making the construction of the course resources take more time. Combined with the latest generative AI technology (in this paper, we use three tools: Wenxin Yiyin, Gamma, and Github Copilot), teachers can directly enter text prompts through chat or prompts, and then use generative AI tools to directly output course resources, such as lesson plans, PPTs, and code, etc., and the teacher only needs to be responsible for reviewing the validity and correctness of the generated results, which greatly improves the efficiency and accuracy of the work, and provides a reference for the application of AI in the construction of professional course resources.
Generative AI
“数据分析与挖掘”课程总学时数为48学时左右,要求学生能够利用Numpy、Pandas、Keras等Python工具,完成对数据集的加载、预处理(空值、重复值、异常值处理等)、挖掘和可视化,其中挖掘部分涉及具体算法的实现,主要包括:分类模型、回归分析、聚类、时序分析等内容。“数据分析与挖掘”课程是计算机科学与技术、智能科学与技术、数据科学与大数据技术等专业的主干专业基础课,是数据分析理论与实践应用相结合的课程,它担负着使学生系统且全面地理解数据的价值,并应用生产生活中的各种数据创造社会价值的使命。
生成式AI作为人工智能领域的一大分支
在课程资源构建方面,生成式AI同样具有广阔的应用前景
随着信息技术的迅猛发展,数据分析与挖掘已成为多个领域不可或缺的技能。然而,在数据分析与挖掘课程资源的构建方面,我们仍面临诸多挑战。本文旨在深入探讨这些挑战,并分析当前形势下对本门课程资源的需求,以期为相关教育工作者提供有益的参考
首先是技术挑战。数据分析与挖掘涉及众多复杂的技术和算法,如何将这些技术以易于理解的方式呈现给学生,是一个亟待解决的问题。其次是内容挑战。由于数据分析与挖掘的应用领域广泛,课程内容的选择和安排需要充分考虑不同领域的需求和特点。最后是教学挑战。如何激发学员的学习兴趣,提高他们的实践操作能力,是课程构建过程中必须关注的重要问题
与此同时,行业内对数据分析与挖掘课程资源的需求也日益旺盛。随着大数据时代的来临,越来越多的企业和组织开始重视数据分析与挖掘在业务决策中的应用。他们急需具备相关技能的人才来支持业务的发展和创新。因此,对于高质量、实用性强的数据分析与挖掘课程资源的需求也日益迫切
综上所述,数据分析与挖掘课程资源的构建是一个复杂而重要的任务。我们需要正视当前的挑战,深入分析行业内的需求,并从多个方面入手来改进课程资源的构建。只有这样,我们才能培养出更多具备相关技能的人才,为行业的发展和创新提供有力的支持。
为了满足教学相关需求,我们需要从多个方面着手来改进数据分析与挖掘课程资源的构建方式。首先,我们应该注重理论与实践的结合。通过引入实际案例和项目,让学生在实践中掌握所学知识,提高他们的操作技能。其次,我们需要及时更新课程内容,确保学生能够接触到最前沿的知识和技术。此外,我们还可以通过多样化的教学方式和手段来激发学员的学习兴趣,提高他们的学习效果。而生成式AI可以通过提示词较为容易地根据要求生成各种教学材料,且更新及时。生成式AI在数据分析与挖掘课程资源构建中的理论基础,主要涉及到生成式AI与课程资源构建的结合点,以及生成式AI在课程资源构建领域的应用价值和与数据分析挖掘课程的契合度分析。
生成式AI与课程资源构建的结合点体现在多个方面:(1) 自动化内容生成——生成式AI具备强大的数据处理和生成能力,能够快速分析海量教育数据,提取有用信息,并生成高质量的教育资源;(2) 个性化学习策略——在课程资源构建中,生成式AI可以助力教师和学习者更有效地利用数据,采用个性化生成教学内容。例如,通过分析学生的兴趣点,生成式AI可以为学生推荐个性化的学习路径和资源,从而满足不同学生的需求。目前,已有一些生成式AI辅助教学的相关论文发表,但主要集中在教学过程的辅助,例如:文献
常见的生成式AI教学辅助工具如
生成式AI辅助教育工具的使用步骤如
阶段1 (需求明确):
确定生成式AI所需生成的文档的类型,例如:PPT课件、课程教案、课程代码等;确定生成的内容的主题,例如:python代码生成中利用pandas去掉重复值等。
阶段2 (工具选择):根据任务类型,选择对应工具,例如:教案生成任务,可以参考
阶段3 (输入提示词):根据生成内容的主题,采用自然语言描述需求,要求尽量避免模糊和抽象的词汇,指令清晰无误,逻辑连贯通顺,避免词汇的歧义,受众明确,以确保模型能够理解任务要求。
阶段4 (结果评价):语言准确性评价——评价生成的内容的语法、用词和句子结构的准确性,以及统计拼写和标点的使用不当情况;内容质量评价——考察内容的质量,即是否与主题相关,所传达的信息是否准确和文本创新性。语境适应性——评价生成内容的文风和语境表达,以及对自然情感的理解能力。
综上所述,生成式AI在数据分析与挖掘课程资源构建中的理论基础坚实且富有应用价值。通过深入挖掘生成式AI与教育资源构建的结合点,分析其在教育领域的应用价值以及与数据分析挖掘课程的契合度,我们可以为数据分析与挖掘课程资源构建提供新的思路和方法,推动教育教学的创新和变革。
本文分别针对教案生成选择行业内公认的工具文心一言、PPT生成选择Gamma、代码生成选择Github Copilot进行实践。
在提示词里输入:帮我写一个数据分析与挖掘课程的“数据预处理”的教案。运行文心一言,可得如
从结果上我们可以看出:语言准确性方面,教案内容的语法、用词和结构的准确性都较高;拼写和标点没有使用不当的情况;内容质量较好,与主题完全吻合;语境表达与主题完全一致。所以,我们可以利用生成式AI较好地对大纲进行生成,然后对不够详细的地方进行修正,极大地方便了教学人员的备课工作。
在大纲输入框中输入如
选择“生成”,确定主题,然后选择“详细”进行生成,可得
从结果上我们可以看出:语言准确性方面,PPT内容的语法、用词、结构、拼写和标点没有出现不当的情况;内容质量好,数据来源可靠,与主题较吻合;语境表达与主题一致;PPT图文并茂,内容丰富且详实。所以,利用生成式AI可极大地提高教师备课效率。
以Github Copilot工具为例。Github Copilot是一款快速且智能化的AI编程助手,是微软、OpenAI和GitHub联合训练得到的代码编程大模型。通过使用Github Copilot,我们可以直接生成想要的程序片段,甚至是完整代码。首先通过在Pycharm里安装Github Copilot插件,并输入如
然后单击Pycharm的Github Copilot插件按钮,可得
从结果上我们可以看出:生成代码基本满足我们的要求,与提示词(注释)的要求基本一致,只需少量修改即可满足我们的要求。代码生成的过程完美地匹配了上下文环境,极大地减少了代码书写量,提高了课程资源构建中代码书写的效率。
随着科技的飞速发展,生成式AI作为人工智能领域的重要分支,其在教育领域的应用逐渐凸显出巨大的潜力。特别是在数据分析与挖掘课程资源的构建中,生成式AI不仅提升了教学效率,还为教师提供了更加个性化和高效的备课体验。本文将对生成式AI在数据分析与挖掘课程资源构建中的应用进行深入研究,并探讨其未来发展趋势以及课程资源的持续优化路径。
在未来发展中,生成式AI在数据分析与挖掘课程资源构建中的应用将更加广泛和深入。首先,随着技术的不断进步,生成式AI的处理速度和准确性将得到进一步提升,为课程资源的实时更新和优化提供有力支持。其次,生成式AI将与虚拟现实、增强现实等先进技术相结合,打造出更加沉浸式的学习环境,让学生在模拟实践中掌握数据分析与挖掘的核心技能。此外,生成式AI还将推动教育资源的共享和普及,打破地域和时间的限制,让更多人享受到优质的教育资源。
经过深入研究与分析,本文对于生成式AI在数据分析与挖掘课程资源构建中的应用进行了全面的探讨。在研究过程中,我们充分考察了生成式AI技术的特点及其在数据分析与挖掘领域的适用性,并结合实际课程资源构建的需求,进行了详实的理论分析和实证研究。在挖掘课程资源方面,生成式AI发挥出了显著的优势。传统的课程资源挖掘方法往往依赖于人工筛选和整理,效率低下且难以保证资源的质量。而生成式AI则能够通过智能算法,自动识别和挖掘出高质量的课程资源,大大提高了资源挖掘的效率和准确性。本研究的研究成果不仅丰富了相关领域的研究内容,还为后续的研究和实践提供了有益的参考和借鉴。展望未来,我们期待生成式AI能够在数据分析与挖掘课程资源构建中发挥更大的作用,为教育信息化的发展注入新的活力。
重庆科技大学本科教育教学改革研究项目“新工科模式下‘智能科学与技术’新兴专业课程教学资源体系构建与探索”(202158);重庆科技大学本科教育教学改革研究项目“以‘课程育人’助推学生网络安全综合能力全面提升”(202463);重庆科技大学本科教育教学改革研究项目“基于openGauss的数据库原理及应用课程实验教学模式探索”(202464)。