湖南师范大学周康丽
【摘要】大数据的崛起使得教育领域面临一场新的变革,教育信息的收集、存储将变得更加的高效和便利。文章探讨了大数据在教育信息处理样本、教学过程、数据处理和管理、教学评价四个方面的变革,这些变革有利于提供学习者更优质的个性化服务。
【关键词】大数据教育信息处理个性化
教育信息处理是以信息科学的思想与理论,技术与方法对教学过程进行研究、分析的一门综合性的新兴学科。主要解决教育信息的表示、教育信息处理方法、教育信息的有效性三个基本问题。[1]随着虚拟学习社区、网络课程和云计算的发展,教师和学生借助网络的学习是当下学习的趋势。原先教学信息采集依靠人工,人工的采集方式耗费大量时间和资源,且加入了主观的因素。随着大数据的发展,教学信息将被自动记录、存储下来,获得信息将变得更加的容易和快捷,教育信息的处理将产生变革。分析和处理教学数据,将有助于改进网络教学的方式,促进教育信息化的进程。
一.大数据的产生和发展
大数据的产生与信息技术、互联网等密不可分并且以越来越多的方式产生,如多媒体内容、社会网络以及各类传感器。[2]时至今日,大数据尚没有系统统一的定义和理论,学者们一般只是用该术语描述难以用传统软件和方法分析的超大量的复杂的数据。Laney首先提出用“3Vs”的概念(Volume,Velocity,Variety)的概念,[3]在此基础之上IBM用“4Vs”描述大数据,即大数据应该具备四个维度,大体量(Volume)、高速度(Velocity)、多样化(Variety)和真实性(Veracity)。[4]大体量是指各种类型的不断增长的数据很容易积累到百万兆字节甚至千兆字节的信息;高速度是指及时处理大数据的必要性,例如分析大量的当日呼叫详细记录可以实时预测客户流失的程度等;多样化是指数据形式的多样性,如可以分析多种数据的变化包括文本+图像+音频等来提高客户满意度等;真实性则意味着大数据提供信息的可信度以及据此决策的可靠程度。在教育领域,随着远程教育的发展和LMS(如Blackboard和Moodle等)的应用,大数据的潜在应用也越来越广。这些系统每天都记录大量的学生交互信息、个人数据、系统数据等。这些也促进了教育界学习分析学(LA,LearningAnalytics)和教育数据挖掘(EDM,EducationalDataMining)的发展应用,以及教育信息处理的变革。
二.大数据带来的教育信息处理变革
1.教育信息处理样本的变革
过去由于技术的限制,教育研究的样本是随机抽样的。这就导致研究对样本的随机性和精确性的重视。数据处理技术已经发生了翻天覆地的变化,从收集部分数据到收集尽可能多的数据的转变已经发生。如果可能的话,会搜集所有的数据,即“样本”=“总体”。[5]即“样本”=“总体”是指我们能对数据进行深度的探讨,而采样几乎无法达到这样的效果。教学中真正有趣的事情经常藏匿在细节之中,而采样分析法却捕捉不到这些细节。随着大数据分析取代了样本分析,教育研究不再单纯的依赖实证数据和调查问卷。当记录下的是教师和学生的平常状态时,也就不用担心做研究和调查时存在的偏见了。现在,我们可以收集到过去无法收集到的信息,不管是通过虚拟学习社区表现的群体关系,还是来自世界各地参与网络课程的人数。更重要的是,现在研究者不只单单地依赖抽样调查了。
2.教学过程的变革
教学过程更能体现以学习者为中心的思想。每个学生学习的资源不再是一致的,而是通过数据分析所反映的个性化特征,向不同的学生推送实时的教育资源。用多方信息如学生的知识程度、动机、元认知和学习态度等建立学生模型,并以此预测学生的学习行为,对不同的学习者实施最佳的教学序列,创建个性化的自适应学习环境,合理选择开始下一个知识点教学的时机,对有学习困难的学习者实施教学干预。利用大数据分析技术对教学组织过程中所涉及到的所有用户群体和所有教学资源对象分别进行研究和分析,从用户的群体中提取出用户对教学过程、教学目标的详细和准确的需求,同时也对用户的特征、用户的偏好等重要的信息进行研究和分析。在教学过程中,不仅仅要通过数据处理来达成对本学科学生学习情况的采集和处理,还要结合其他学科的老师一起综合多学科数据,来通过挖掘算法发现其中隐形存在的信息,通过各门课程的特点和执教教师的个性教学等元素进行大数据的挖掘处理,从而达成最为高效的课程设置。教师从数据的采集、处理和分析,将数据以可视化的方式显示出来,教师从直观的图标可以了解教学过程中每个环节出现的问题,及时再调整策略改进出现的问题。然后再根据数据的处理和分析看问题是否被解决,数据为教学过程提供了服务,教师更加了解学习者,从而为使教学过程更加个性化。
3.教育数据处理和管理的变革
由于教育研究样本的扩大,即“样本”=“总体”,给数据的处理和管理带来巨大的挑战。数据的类型可分为三种:非结构化数据、半结构化数据、结构化数据。非结构化数据指没有格式的数据,如PDF、Email和文档。结构化数据具备一定格式,便于存储、使用和从中提取信息,例如传统的事务型数据库。半结构化数据是指类似XML和HTML的有一定加工处理的数据。不同类型的数据就需要分类来处理和管理,这就增加了系统的复杂性,目前的技术还未成熟,就急需人类创新数据处理和管理技术,为大数据在教育领域的变革发挥更大的作用。通过对教育数据的处理和管理,进行深入的分析和判定,从而预测整体或个体后阶段的情况,有效地服务于我们的教学活动。通过这样的预测,我们可以针对学生在学习过程中出现的不良状态和学习问题进行深入诊断和处理,尽快解决学生在学习过程中遇到的问题,尽快让学生进入良好的学习状态进行学习。
4.教学评价的变革过去评价学生的学习效果依靠分数的高低,学生分数的高低是评判教师教学质量的依据。在数字化的学习环境中,学生所有的学习行为将被记录、存储成个人数据库,个人数据库记录了学习者在线学习的时间和进度、参与讨论的话题数、练习正确率和错误率、浏览过的资源等,个人数据库为学生的过程性评价提供了参考。教师可以分析每个学生的数据,得出学生最易出错的知识点进行强化,知道每个学生的兴趣所在从而提供个性化的服务,对于学习积极性下降的及时给予鼓励。如果全球各个国家的学习者同时学习同一门课程,这将形成大数据,从数据分析可以得出不同国家学习者的差异、普遍存在需要共同解决的问题等结论,分析得出的可视化数据反馈给学习者,使学习者了解个人在众多学习者中所处的位置,从而激发学习者的动机。大数据的分析,改变了传统的教学评价方式,有助于教师改善教学方式,促进学习者的个性化发展。
三.反思
在收集数据过程中,能否做到自动过滤掉无意义的数据,只留下有意义的数据,以免存储之后再处理的麻烦。就像将一块石头雕刻成雕塑一样,去掉没有用的,留下有用的。所以,前提是在数据存储之前就要知道哪些数据是无用的,哪些数据是有用的。同时也面临一下问题:不同格式的数据如何分类处理?如何储存海量的非结构化数据,例如学生的讨论等文本数据?如何分析复杂海量数据?如何理解数据结果并传达给非数据专业人员?如何管理数据?学生的情感、态度、价值观如何从数据中获得并可视化?
随着存储成本继续暴跌而分析工具越来越先进,采集和存储数据的数量和规模将爆发式地增长。学习者的隐私和自由受到了威胁,数据的收集者并未告知学习者作何用途。即使学习者是匿名,也可根据大数据的规模和相关性进行推断。大数据的预测能力导致学习者还没有发生危险性行为就可能受到惩罚。大数据的不利影响并不是大数据本身的缺陷,而是滥用大数据预测所导致的结果,必须避免对数据的过分依赖。
四.结语
大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据给教育领域带来了巨大的变革,学生是最大的受益者。但同时也面临着一些问题和挑战,大数据提供的不是最终答案,只是参考答案,更好的方法和答案在不久的未来,需要研究者在实践中不断完善。
参考文献
[1]傅德荣、章慧敏编著.教育信息处理[M].北京:北京师范大学出版社,2001.
[2]Purcell,B..Theemergenceof“bigdata”TechnologyandAnalytics.JournalofTechnologyResearch[DB/OL].[2013-05-10].http://www.aabri.com/manuscripts/1212l9.pdf.
[3]DougLaney.3-DDataManagement:ControllingDataVolume,VelocityandVariety(DB/OL].[2013-04-10).http://blogs.garlner.com/doug-laney/files/2012/0l/ad949-3D-Data-Management-Controlling-Data-Volume-Velocity-and-Variety.pdf.
[4]IBM[DB/OL].(2013-05-10]http://www-01.ibm.com/software/data/bigdala/.
[5]维克托迈尔-舍恩伯格,盛杨燕.大数据时代[M].杭州:浙江人民出版社,2013.