内容摘要:从“大数据”一词的起源与大数据的生成、关于大数据的描述及类型、大数据如何改变人类的教育方式、大数据如何改变人类的学习方式、大数据如何改变教育技术的研究范式,以及大数据能否改变人类的思维方式等多个方面,对当前国内外学术界关于大数据给人类社会的工作、学习和生活的方方面面造成何种影响的各种不同观点,进行了比较系统、深入的梳理与分析;对其中的正确论述给予充分的肯定,对于一些过激的片面观点则在科学论证的基础上予以辩驳,以正视听。
关键词:大数据;教育方式;学习方式;思维方式(思维加工方式)
作者简介:
作者简介:何克抗(1937- ),男,广东大埔人,北京师范大学教育信息技术协同创新中心教授,主要从事教育技术理论与应用研究,E-mail:hekkbnu@163.com,北京 100875
内容提要:从“大数据”一词的起源与大数据的生成、关于大数据的描述及类型、大数据如何改变人类的教育方式、大数据如何改变人类的学习方式、大数据如何改变教育技术的研究范式,以及大数据能否改变人类的思维方式等多个方面,对当前国内外学术界关于大数据给人类社会的工作、学习和生活的方方面面造成何种影响的各种不同观点,进行了比较系统、深入的梳理与分析;对其中的正确论述给予充分的肯定,对于一些过激的片面观点则在科学论证的基础上予以辩驳,以正视听。
关 键 词:大数据 教育方式 学习方式 思维方式(思维加工方式)
目前国内外学术界普遍认为,“大数据”是继云计算、物联网之后IT产业的又一次重大技术变革,甚至有学者把挖掘、应用大数据的意义提到与20世纪90年代初倡导“信息高速公路”相并列的高度——认为美国政府2012年3月发布的《大数据研究与发展倡议》是继1993年宣布“信息高速公路”以来的又一次重大科技部署,[1]甚至会像一场飓风那样,“摧枯拉朽地给教育、乃至整个社会带来一场变革”,从而使人类探索和认识世界的思维方式发生改变。
可见,人们对大数据寄予多么高的期望。下面,我们就对近年来国内外学术界对于大数据最为关注的若干问题进行比较系统的梳理与分析,看看大数据正在哪些方面改变着人类社会,从而形成关于“大数据”的面面观。
一、“大数据”一词的起源与大数据的生成
通过文献研究,我们了解到“大数据”一词最早是由美国NASA的研究人员Michael Cox和David Ellsworth于1997年提出,是他俩第一次用该词描述20个世纪90年代出现的数据方面的挑战——即超级计算机所生成的巨大数据量。在实验过程中,Cox和Ellsworth对产生于飞机周围的大量模拟气流数据觉得无法处理,也难以可视化,他们对自己当时的感受是这样描述的:“数据集相当大,对主机内存、本地磁盘甚至远程磁盘都造成挑战,我们称此问题为大数据。”[2]这就是“大数据”一词的由来(或起源)。
一般认为,大数据的产生与以互联网为标志的信息技术密切相关。例如著名的Facebook拥有超过9亿的用户,并且用户量仍在不断增长;Google每天都有不少于30亿条的搜索查询;而Twitter则每天要处理4亿次以上的短信(相当于12TB的数据量)。[3]
而大数据的具体生成过程,涉及大量数据的挖掘、存储、计算与分析,其前提是人手一机;[4]这个“机”通常不是PC机,而是简单的移动终端(也称云终端)——每个学习者从“云终端”输入自己的学习行为数据,并存储到“云”里。这些记录每一个个体行为的数据,表面上看好像是杂乱无章,但当数据累积到一定程度时,群体的某种行为规律和某个时间段内的个体行为规律就一定会在这些数据上呈现出来。
二、关于大数据的描述及类型
到底什么是大数据?目前,众说纷纭。有的学者认为,大数据是指太大或种类太多,以至于传统工具无法有效管理的数据。[5]也有人认为,大数据即一般软件工具难以捕捉、管理和分析的海量数据;通过对这些海量数据的交换、整合、分析,可以发现新知识、创造新价值,从而带来大知识、大科技、大利润和大发展。[6]
此外,大数据与传统数据相比,还有非结构化、分布式、数据量巨大、数据分析由专家层变化为用户层、大量采用可视化展现方法等特点,而这些特点正好适应了当前学习方式逐渐向个性化和人性化转变的需求,也使大数据时代的教育学,变成一门实实在在的实证科学。[7]
迄今为止,学术界对于“大数据”还没有规范、统一的定义。学者们只是用这一术语描述难以用传统软件技术和方法分析的超大型复杂数据。
关于对大数据的定量描述,最早由Laney提出的方法是通过三个维度描述——也称3V(Volume, Velocity, Variety)。[8]在此基础上,IBM的研究人员作了补充,认为应当用4V——即容量(Volume)、速度(Velocity)、多样性(Variety)和真实性(Veracity)等四个维度来描述大数据。[9]其中,容量在大数据情况下应是大容量,是指增长到百万兆字节甚至千兆兆字节的信息;速度在大数据情况下要求高速度,因为及时、快速处理大数据往往起着关键性的作用(例如分析大量当日呼叫的详细记录,可实时预测客户流失程度);多样性是指数据形式多种多样(包括文本、图像、音频、视频);真实性则是指大数据提供信息的可信度,以及据此作出决策的可靠程度。
关于大数据的类型,目前学术界认为大致有三种:[10]即非结构化数据、半结构化数据和结构化数据。[11][12][13]非结构化数据是指没有固定格式的数据,如PDF、E-mail和一般文档。半结构化数据是指类似XML和HTML的、有一定加工处理的数据。结构化数据则是指具备一定格式,便于存储、使用,并可从中提取信息的数据,例如传统的各种事务型数据库中的数据。
三、大数据如何改变人类的教育方式
大数据对人类教育方式的改变,结合目前国内外大数据的应用状况,可以从以下五个方面去考察。
(一)美国教育部关于“大数据教育应用”的报告
2012年10月,美国教育部发布了题为《通过教育数据挖掘和学习分析技术来提高教与学:问题简述》(Enhancing Teaching and Learning through Educational Data Mining and Learning Analytics: An Issue Brief)的报告(以下简称为:美国教育部关于“大数据教育应用”报告),[14]为教育中如何利用大数据指明了方向。该报告认为,大数据无处不在,教育中也是如此。主张通过教育数据挖掘、学习分析和可视化数据分析来改进自适应学习系统,实现个性化学习。并指出,大数据在教育中的应用主要有两大领域:教育数据挖掘(Educational Data Mining,简称EDM)和学习分析技术(Learning Analytics,简称LA)。[15]
教育数据挖掘(EDM)的内涵是要对学习行为和学习过程进行量化、分析和建模;[16]EDM的目的是利用统计学、机器学习和数据挖掘等方法来分析教与学过程中所产生的数据。[17]
美国教育部关于“大数据教育应用”的报告还指出,EDM关注和要回答的问题有五个方面:(1)什么样的教学顺序(即学习主题顺序)对不同特点的学生最有效?(2)什么样的行为与更好的学习成绩相关?(3)什么样的学生行为指标预示了学生的满意程度、参与度和学习进步?(4)什么特点的在线学习环境能导致更好的学习成绩?(5)什么因素能够预测学生取得成功?[18]
而学习分析技术(LA)的内涵是要利用已有的模型来认识、理解新的学习行为和过程。[19]Siemens则把LA定义为:关于学习者以及他们的学习环境的数据测量、收集、分析和汇总呈现。并认为,LA的目的是理解和优化学习以及学习情境。[20]按照Siemens的观点,LA的主要应用是监测和预测学生的学习成绩,及时发现潜在问题,并据此作出干预,以防止学生在某一科目的学习中产生风险。
对LA应当关注和回答的问题,按照美国教育部关于“大数据教育应用”报告的描述,则应涉及以下五个方面:(1)什么时候学生可以进行下一个学习主题?(2)什么时候学生可能在某一门课程中落后?(3)什么时候某个学生可能存在完成不了一门课程的风险?(4)如果没有干预补救措施,学生可能得到什么样的成绩?(5)对特定学生来说,下一个最好的课程是什么?是否需要特殊的帮助?[21]
正如有些学者所指出的,在大数据背景下,通过EDM和LA等技术,可以帮助教师有效地改进教学。[22]例如,教师可以查看学生在一张图片上停留的时间,判别他们在答错一道题之后有没有回头复习,统计他们在网上提问的次数、参与讨论的多少,然后在此基础上对他们的学习行为进行引导;学生学习过程所记录的鼠标点击量,也可以用来研究学生活动的轨迹、发现不同学生对不同知识点有何不同的反应?用了多少时间?哪些知识点需要重复或强调,以及哪种陈述方式或学习工具最有效。
大数据还可以帮助教师对学生作出全面、正确的评价,[23]而过去对学生的评价,往往依靠感觉、直觉和考试。但人的感觉中存在盲点,直觉并不完全可靠,考试也有局限。大数据凭借日常点点滴滴的信息采集,运用严密细致的逻辑推理,能客观地展现一个学生的完整形象;云端分立的数据库彼此相联,可用来进行多维度的联机分析。这样,将呈现给我们一个宏大的教育场景。可以把每个学生置于该教育场景中来进行审视与评估。
可见,应用EDM和LA的数据分析结果,教师可以更好地了解学生,理解和观测学生的学习过程,找到最合适的教学方法和教学顺序;还可以针对不同特点的学生采用不同的教学方法与教学策略,并能及时发现问题。进行有效干预和作出全面正确的评价,从而显著提高教学的质量与效率。
(二)大数据背景下的全新教育愿景及未来教室
2012年9月美国布鲁金斯学会(Brookings Institution)技术创新中心主任Darrell M. West在《教育大数据:数据挖掘、数据分析和网络仪表板》(Big Data for Education: Data Mining, Data Analytics, and Web Dashboards)一文中,对大数据背景下的全新教育愿景作出了这样的描绘:[24]
12岁的苏珊正在上一门旨在提高她阅读技能的课程。她一直在阅读一些短篇小说。每隔一周教师都会对她和她的同学进行纸笔测试,以测量他们对词汇和阅读的理解能力。测验表明,苏珊对词汇掌握得不错,但在关键概念的理解上还需加强。
而在未来,苏珊的弟弟理查德则是通过电脑软件程序来学习阅读。他每阅读一个故事,计算机都会自动收集他学习过程的相关数据。每个内容学完后,在他的屏幕上都会弹出一个小测验(用来测试有关词汇和阅读理解方面的问题)。理查德每回答一个问题,都会得到即时反馈,以表明其答案是否正确。对于较困难的题目,电脑会推送给他更详细的解析和相关概念的网站链接。他的综合表现则被可视化地显示在一个仪表盘上,综合表现包括:作业和测试的正确率、已经掌握的概念列表、学习表现、与班内同学(乃至全国学生)的比较情况等。
当一个学习环节结束时,理查德的老师会收到一封自动邮件,其内容是关于理查德和班上其他学生的个人表现以及全班情况的汇总(包括阅读时间、词汇知识、阅读理解、补充资料的使用情况等)。教师根据这些汇总信息,可以及时发现需要特别帮助的学生、学习时间不够的学生,以及全班大部分学生都感到困难的内容。接下来,教师就可以通过集中讲授、人为干预学习系统等方式来适应学生的学习需求,也可以为没有达到教学目标要求的学生进行个别辅导,或补充额外的学习资料。
对于学校的管理者来说,通过上述可视化仪表盘可以查看某年级、全校、乃至整个学区学生的学习情况。如果发现低效课堂或学习表现不佳的学生群体(根据性别、家庭背景等情况划分的群体),管理者还可根据可视化仪表盘的数据分析结果决定是否要给予特定的干预。对于更大范围的异常表现,管理者则可依据数据分析结果调整原来的管理策略,以适应教师更好地教和学生更好地学的实际状况与客观需求。
至于大数据背景下的未来教室,从2011年就开始关注如何运用先进技术手段来为大规模在线教育服务的知金教育咨询有限公司,不仅为“未来教室”界定了颇有创意的新内涵,还为此开发出相关的创新产品:为每个教室配备一个称作“云端”的小盒子,利用该小盒子,教师可实现智能终端授课和师生互动,还可实现学生与教学内容的互动以及生生互动。每节课结束以后,有关这节课的教学活动都会自动形成一个课件,并存储在“云端”里;没有完全听懂的学生可以把该课件下载到自己的iPad里,像电子书包一样,可用于课后复习和回看;而“云端”对课堂教学活动的持续录制和积累,将形成丰富而宝贵的教学资源,以支持与更多的学生分享,甚至可用于校外学习中心的远程教学。[25]







