近日,由中国民间文艺家协会(以下简称“中国民协”)主办的“中国口头文学遗产数字化工程(一期)成果展示会”在京举行。该工程从2010年启动,被誉为中国民间文学的“四库全书”,体现了近百年来几代民间文艺工作者田野普查的结晶。工程建立的数据库是我国乃至全世界迄今为止最大的口头文学遗产数据库,也是一个蕴含民间灵气、智慧的民族民间文学宝库。
凝结200万人次民间文艺工作者田野调查成果
录入4905本口头文学资料,共8.878亿字
收录神话、传说、民间故事、谚语等116.5万篇(条)
唤醒“沉睡的”民间文学资源
口头文学是民间文学的主要流传方式,包括神话、传说、民间故事、民间歌谣、谚语、谜语、歇后语等。口口相传的民间故事,传递着中国人传统的道德准则与价值观,蕴含着人们的生活智慧和丰富的生产经验,比作家文学更贴近广大劳动人民的生活,传播范围更广,社会功用更大。然而,口头文学无形存在、易于丢失,如果不及时搜集整理,就会消亡。
自新中国成立以来,中国民协分别在上世纪50年代、80年代以及本世纪初,组织过3次大规模的民间口头文学搜集和整理工作,耗时三四十年,先后组织了200万人次在全国2800多个县进行口头文学的普查、记录工作,获得了巨量的民间文学原始资料。这些原始资料都按照国际惯例记录,除记录口头文学文本本身,还附有讲述人情况、记录人与记录情况等,科学性强。
“对于许多没有自己文字的少数民族,口头文学常常就是一种活生生的口传历史。正是这几次的调查与发现,填补了这些少数民族很多的历史空白。”中国文联副主席、中国民协主席冯骥才说,最典型的例子是近几年在贵州麻山地区发现的大型苗族史诗《亚鲁王》。
不过,这几次搜集行动最终只出版了省级口头文学集成著作,绝大多数县级传说、故事等虽然被采集回来,却没有机会公开出版。未能出版的原始记录,大部分还以手抄本、油印本、铅印本等原始的方式保存着。
为了将这部分“沉睡的”资源唤醒,2010年12月30日,在冯骥才的倡议下,中国民协发起了中国口头文学数字化工程。该工程由中国民协与汉王公司合作,目的是将这些原始资料中的图片、文字全部数字化,并扫描每一页记录的原始页面,汇成一个数据库。数据还提供按地区、按故事主题等多种检索方式,方便使用者利用这些资源。
在民间文学研究领域耕耘了60年的“老兵”、数据库专家刘锡诚介绍说,数据库的主体是上世纪80年代至上世纪末20年间搜集到的口头文学资料。“上世纪最后20年是随时处在流变之中的,民间口头文学也像滔滔逝水随着时代、社会的变迁而嬗变。以数字化方式较完整全面地保存这20年的中国民间口头文学,就留下了这一风云激荡的时间段里民间文化的活态样相。”刘锡诚说。
“我们拥有了一座文学大山”
3年的时间,中国民协与汉王公司历经艰辛,完成了中国口头文学遗产数字化工程的一期预定目标。 一期工程共录入中国口头文学遗产资料4905本,8.878亿字,形成TIF、PDF、TXT三种格式;制作了检索发布软件;对神话、传说、民间故事、民间歌谣、史诗等11类口头文学作品进行了一级分类,总计116.5万篇(条);用flash动画形式概括民间文艺工作者百年来对口头文学遗产挖掘、整理的历程;完成了数据库文档多种形式的备份;按照国家图书馆标准对4905册资料进行了分类整理;对数字化一期建设工程的资料进行了整理归档。
数据库的建成是一个相当复杂的过程,需要历经扫描录入、数据加工整理等40多道程序。“我们主要负责软件技术方面的支持。一些生僻字、繁体字等的识别,以及文本的内容从属识别,都是由各个领域的专家来完成。”汉王公司的相关技术负责人介绍说,现在的数据库拥有庞大的后台系统,不同的用户会有不同的权限。用户可以采用“全文检索(输入关键词、字)”、“高级检索(输入民族、作品名等精确条件)”、“分类检索(按照神话、传说等11个一级分类检索)”、“书目检索(按照不同地区检索)”四种方式进行检索。同时数据库可实现多人在线阅读和全球在线服务。
记者有幸体验了一把口头文学遗产数据库的便利之处。在设计古朴的数据库首页的“搜索”一栏里,输入“少数民族”关键字,立刻检索出了出自《闽东畲族故事》的《戏状元雷海青》等2575篇作品,每一篇作品还附有讲述者、采集者、采集时间、流传地区等信息。
中国口头文学遗产数字化工程为中华民族保存了一份精彩而珍贵的记忆遗产,也为广大的文艺工作者提供了丰富的创作素材。冯骥才激动地说:“我们拥有了一座文学大山。工程使这五千年来一直无形存在的口头文学,看得见、摸得着,登堂入室,真正进入中华文明的殿堂。”
然而,这还仅仅是第一步。参与项目的中国传媒大学教授刘晔原介绍,在二期工程中,还将把那些专家学者和科研机构收藏的口头文学珍藏本,以及现有数据库遗漏的珍贵资料进行录入整理。
“目前,我们已经征集到近5000册的珍藏书目,准备录入数据库,这是一个新的挑战。”刘晔原说,在三期工程中,希望能将传统村落文化以及民间文化活动的3D影像也录入数据库,使得数据库的内容更为全面和立体。
据悉,中国民协还将着手规划这一巨型文学遗产的图书印制工程,并将启动申遗工作。