首页 >> 民族学 >> 学科纵览
中国民族地区网络舆情研究综述(2013年)
2016年11月30日 17:06 来源:中国社会科学网 作者:孔敬 字号

内容摘要:

关键词:

作者简介:

  1. 民族地区网络舆情研究概述 

  网络舆情研究作为一个新兴的热点研究领域,近年来的相关研究成果不断增多。本文主要在国内范围内对民族地区网络舆情研究成果进行概述。在中国知网(CNKI)中国学术文献网络出版总库平台,选取学术期刊、博硕士论文、会议论文和报纸四个子库为检索库,以网络舆情为主题词,精确搜索2006-2013年文献,共有相关文献7026篇,其中期刊论文4385篇,博硕士论文876篇,会议论文90篇,报纸1675篇。网络舆情文献发表统计分析表明(见表1和图1),网络舆情研究在近五年(2009-2013)呈快速发展趋势,已日渐成为研究热点领域。 

  1 2006-2013年网络舆情文献发表量 

年份 

期刊 

硕博论文 

会议 

报纸 

合计(篇) 

2013 

1395 

299 

21 

328 

2043 

2012 

1173 

238 

21 

356 

1788 

2011 

854 

165 

26 

417 

1462 

2010 

579 

98 

14 

347 

1038 

2009 

256 

43 

5 

159 

463 

2008 

77 

21 

2 

46 

146 

2007 

38 

11 

1 

18 

68 

2006 

13 

1 

0 

4 

18 

合计 

4385 

876 

90 

1675 

7026 

    

 

  1 2006-2013年网络舆情文献变化趋势 

 

  2 2008-2013年民族地区网络舆情研究论文变化趋势 

  本文进一步以民族地区、民族八省区地名和民族文字名称(如维吾尔文、藏文、蒙文)等关键词,获取到有关民族地区网络舆情文献36篇(见图2),发表年代起始于2008年的1篇,以后逐年增加,至2013年为17篇。从论文类型来看,其中期刊论文29篇,博硕士论文6篇,会议论文1篇,2012年以前博士、硕士学位论文较多,19篇文献中有5篇是博硕士论文。这表明网络舆情研究应用于民族研究领域起步于2008年,一开始主要在研究生群体中进行前沿性、试验性研究,在2012年开始出现了一批研究成果,于2013年逐渐进入更多学者视野,研究文献在2013年呈快速发展态势。 

 

  3 2014年民族地区网络舆情文献的作者机构 

  从文献作者与作者机构来看,绝大多数作者仅发表了1篇论文,有4位作者发表了2篇;作者机构(见图3)则是中央民族大学发表论文最多,共6篇,其次是新疆大学5篇,西北民族大学4篇,新疆财经大学、新疆农业大学、新疆师范大学、中国科学院新疆理化技术研究所和赤峰学院各2篇,其他还有11个单位各1篇。作者机构类型几乎都是大学,只有2篇文献的作者机构是研究机构。 

 

  4 2008-2013年民族地区网络舆情论文的研究地区 

  从研究地区来看,新疆维吾尔自治区最多,为17篇,其次是北京6篇,云南和甘肃各4篇,内蒙古2篇,吉林、上海和广东各1篇,民族八省区中主要在新疆、内蒙古和云南开展民族地区网络舆情研究(见图4),其他民族八省区鲜见相关研究成果发表,新疆的网络舆情研究成果远高于其他民族地区,这也说明新疆地区的网络舆情问题较为突出。 

 

  5 2008-2013年民族地区网络舆情论文的研究领域 

  从学科领域来看,如图5所示,网络舆情文献的研究领域主要分布在信息-计算机技术、新闻-传播理论、政治-民族理论、语言文字-民族语言文字等学科领域,少量文献在教育-教育工作领域。 

  从研究主题来看,学者关注点包括基本理论研究(如民族地区网络舆情的特征、表现、形态、演变、影响等),对策性应用性研究(如网络舆情的汇集、分析、引导、监测、预警、管控等),技术与系统构建研究(如民族文字信息处理技术、分析技术、网页分类、监测模型、监测系统构建等),拓展分析研究(如从教育德育、政治民主、公共政策、群体事件等角度展开分析)。研究主题的分类统计图表明(见图6),目前学者对网络舆情的研究主要是对策性和应用性研究,网络舆情在实践工作中的监管、控制策略,以及预警和内容分析是主要研究选题,这表明当前网络舆情研究偏重于对策性应用性,其次是技术与系统构建研究,以及比较外围的拓展分析研究,在基本理论研究方面尤其薄弱。国内的舆情研究尚处于起步阶段,大多数研究成果属于应用性研究范畴,而对舆情理论的研究尚显不足。 

 

  6 2008-2013年民族地区网络舆情论文的研究主题 

  2. 民族地区网络舆情基础理论 

  当前民族地区网络舆情基础理论研究主要体现在舆情的特征、表现、形态和影响等方面。重点在民族地区网络舆情特征方面。张玉强在其博士论文研究中,归纳了民族地区网络舆情的特征,指出民族地区网络舆情危机,不仅具有一般网络舆情危机的特征,同时由于民族问题和民族地区的特殊性,也导致了本地区网络舆情危机呈现出一些自身的特点 [[1]]。这些特性包括: 

  (1) 危机的复杂性。民族地区网络舆情危机,大多涉及和针对民族问题,而民族问题本身就具有复杂性。当前的民族问题,大多积淀着大量的历史事件和民族传统,同时与政治、宗教和其他社会问题相互交织在一起。 

  (2) 危机的敏感性。民族地区成为西部乃至全国经济转型与社会转型时期的一个敏感区域,尤其是人的心理特别敏感。正常的社会传播系统功能减弱,而非常态的传播机制异常活跃 [[2]] 

  (3) 危机的政治性。民族问题本身具有很强的政治性,一方面当前的民族地区稳定、经济发展、民族关系和谐等问题始终是政府民族地区管理重要内容。另一方面,部分民族地区一直存在着的民族分裂主义、宗教极端主义、国际恐怖主义“三股势力”正在不断抬头,并适时与“藏独”、“疆独”相互勾结,再加上反华势力推波助澜,必然影响民族地区的政治安全。 

  (4) 危机的国际性。中国内蒙古、西藏、新疆等民族地区,本身地处国家边界,远离中央政权,同时由于与邻国之间的历史和交往问题,又使这些地区的危机事件具有国际性的特征。而同时,民族地区特殊的位置,以及多民族、多宗教的特点,也很容易引起国际社会的广泛关注。特别是,一些国外的反华势力借助民族地区的一些危机事件大做文章,借助于网络的国际性,策划和组织社会动乱事件,并在网络上大肆传播反华言论,严重损害我国政府的国际形象,同时也增加了我国政府应对跨国网络危机的难度。如在2009 年乌鲁木齐‘7·5’事件中,疆独分子大都借助境外网站从事煽动分裂活动,而监控境外网站是一个世界性难题,不仅存在技术难题和法律适用性问题,而且如果不能事先锁定具体网站,对多如牛毛的各类网站很难一一实施同步监控 [[3]] 

  此外,张菊兰分析了新疆网络舆情的特征和效应,指出新疆的网络舆情具有区域性延展、群体极化、带有明显的时间性、突发性强、敏感度高,以及民族文化心理促使网络舆情集合与放大等特点; 在多年的实践中产生了舆情应对显著效应、问政效应、跟风效应、少数人操控效应、蝴蝶效应和“出气筒”效应等正负面效应 [[4]]。钟振明则对西藏突发事件舆情的特殊性进行了分析,认为西藏突发事件舆情的特殊性表现在三个方面:一是极易涉外性;二是极其复杂性;三是极具敏感性[[5]]。林凌以新疆"7·5"暴力事件为例,疆独分子直接利用互联网实施舆论煽动,增加了暴力事件的隐蔽性、突发性和不可控性,说明民族地区实施网络舆论引导的困难性和重要性[[6]] 

  3. 民族地区网络舆情对策与应用 

  由于地理、历史、文化等原因,民族地区不仅在经济发展水平上明显滞后,而且也成为众多民族类社会突发事件的多发地和集中地。近几年随着民族地区互联网的迅速普及,涉民族类的社会事件和网络舆情危机事件交相呼应,加上一些敌对势力、民族分裂势力、反华势力等借助于国际互联网的舆情煽动,更加剧了民族地区网络舆情监管的复杂性和困难性。从2008年西藏拉萨“3.15”事件到2009年新疆乌鲁木齐“7.5”事件,从四川阿坝事件到贵州瓮安事件等众多暴力和动乱事件,其中都有网络舆情危机的身影,并呈现出与网络舆情危机交相呼应的形态。因此,对民族地区网络舆情的对策与应用研究成为当前最为集中和重要的研究主题。 

  当前民族地区对策性应用性研究可归纳为引导机制、舆情分析、舆情监测管控等三大方面内容,讨论地区主要集中在新疆,其次是西藏和其它边疆地区。 

  (1)民族地区网络舆情引导机制 

  在民族地区网络舆情引导机制与策略研究方面,张玉强提出了民族地区网络舆情危机的政府引导策略,包括重点关注有关民族问题的热点事件和敏感事件,快速实现对网络舆情事件的正面舆论宣传,灵活运用各种政治公关手段,弘扬民族团结的主旋律,建立专职与兼职相结合的网络评论队伍,提高领导干部网络舆情的引导能力,注重与国际性的新闻媒体合作等等[[7]] 

  魏冲提出了涉及民族因素群体性事件的网络舆论引导机制,指出当前群体事件的发生发展常有网络舆情形影相随,注重涉及民族因素群体事件的舆情引导,防范民族问题舆情危机,应采取多种基本措施,包括:创新政府信息化建设理念,从战略高度认识并重视网络舆情影响与作用;完善应急信息公开机制,正视公共诉求,实现信息资源的整合与共享;健全信息公开发布常态化制度,积极促进多元社会主体的良性互动[[8]] 

  林凌针对新疆网络舆情实例提出网络舆论预防:一是防患于未然,增强新闻传播的预见性和导向性。新闻报道要有大局性和预见性,增加新闻报道的网络舆论引导性;二是网络舆论反制,进行信息公开与主动引导,如适度开发网络,封堵恶意网站,设置政府网络发言人,引导网络舆论,发挥网络舆论领袖作用;三是网络舆论反击,锁定疆独分子煽动暴力活动网站,揭露其谎言谣言以及其煽动暴力活动的本质;开放国内外媒体采访,争取网络国际舆论主导权 [[9]] 

  钟振明提出在西藏的网络舆论引导要强化相关宣传与监控部门之间的协调配合,充分利用传统媒体的正面舆论优势,突出网络媒体的舆论引导地位,形成网上、网下协调配合的工作机制,达到“1+12”的协同效应[[10]] 

  李育全提出边疆民族地区高校网络舆情引导要了解大学生思想动态,重视媒介素养教育,建立预防为主、调解为先、疏导为要的思想政治工作长效机制,加强少数民族学生心理健康教育和思想引导,建立网络舆情巡查制度和网络舆情报告制度,通过新闻发布、校务公开和调查处理等方式进行网络舆情引导 [[11]] 

  阿布都瓦依提•尼亚孜针对维吾尔文网站的舆情引导提出了重视维吾尔文官方网站建设,发挥网站在信息传播中舆论引导的主力军作用。利用高科技,提升网络舆情监测工作的有效性,建立健全公开透明的信息发布机制,利用各种渠道提高维吾尔文网站建设者的整体素质,加强维吾尔文网站建设与管理[[12]] 

  (2)民族地区网络舆情分析 

  民族地区的网络舆情分析是当前大家研讨的热点之一,例如李育全以云南、广西、新疆、内蒙古四省区高校的校园网及其论坛为随机观测对象,对获得的在校大学生舆情基本信息数据进行分析,指出民族地区高校网络舆情具有非线性、易受影响性、直观性和交流性等特点[[13]]。又如张菊兰提出网络的群体性和区域性是网络舆情分析的基本因素,如在“7·5”事件发生之初,网络舆情已经形成。网络舆情在区域聚集,新疆以外的地域对此舆情的关注度非常低,舆情呈现出非常明显的地域性。“7·5”事件发生之后,网络舆情发生逆转,蔓延至全国,直至国外。网络舆情监测的重点方向应是对最初的区域性舆情形成的研判[[14]]。采用网络舆情监测软件系统进行民族地区的网络舆情分析是大家的共识,但当前网络舆情自动分析较为困难,主要表现在由于少数民族语言文字信息化处理水平整体相对滞后,监管部门尚没有成熟的软件系统对少数民族文字的网站进行舆情监测。人民网的网络舆情监测尽管能够提供蒙古、藏、维吾尔、哈萨克、朝鲜等少数语言的舆情报告,但也是通过人工监测进行分析,与中文舆情报告相比,缺乏科学的分析工具[[15]]。网络舆情自动分析技术研究进展,本文将在随后的“民族地区网络舆情监控技术与系统构建”中介绍。 

  (3)民族地区网络舆情监测管控 

  当前民族地区网络舆情的监测管控是研究的热点和难点,关于民族地区网络舆情监管的机制和对策研究主要集中在新疆地区,另有少量文章针对西藏和其他民族地区。例如新疆社会科学院王秀丽提出了强化新疆舆情监测的对策:牢牢把握党对突发事件的舆论主动权,建立联系协调、快速反应的舆情分析处理机制;建设培养立场坚定、精通少数民族语言的网络舆情分析研判队伍;加大对新疆少数民族语种网站的舆情监测力度;加快网络监控技术的研制和开发,对网络信息的内容进行监测分析;加强与国外媒体的国际合作,开展信息安全技术的交流,建立反恐信息共享平台 [[16]]。帕哈尔丁·赛福丁等提出新疆网络舆情预警机制要遵循四点:完善新疆政府与民间网络舆情互动机制建设, 强化网络舆情主渠道功能;构建和提高新疆互联网信息评论管理水平,建立和完善一支业务强、觉悟高、技术精的高效网络评论队伍;提高网络舆情信息的能动性, 完善政府的决策机制,政府部门在制定政策、推进工作时,要充分利用网络舆情信息,制定有效和科学的政策,保证民族地区广大人民群众的利益所求;对于敏感时期和敏感事件的网络舆情要及时化解和疏导[[17]] 

  在新疆网络舆情监控研究中,对高校舆情监控的研究相对较多,如郑旭东提出新疆高校校园舆情监控机制的创新包括构建一个立体化监控体系,实施由新疆高校党委统一领导,行政为主,学生工作部门系统管理的工作模式的立体化舆情监控体系;明确日常监控和重点监控两种状态的监控策略;实现民汉、人技和课堂内外三个方面的结合;形成学校舆情管理部门、教职工、学生和社会四方面参与的多元监控[[18]]。桑华从文化安全视角下切入,结合新疆高校网络舆情调研,分析了文化安全面临的冲击与挑战,并提出了基于文化安全保障下的新疆高校网络舆情的有效管理方式和路径,包括:健全校园网络舆情管理体系,推动网络舆情的正能量作用;加强网络传播的教育管理,营造良好的网络文化环境;培养网络舆论领袖团队,强化主流正面引导作用[[19]] 

  在西藏网络舆情监控研究中,钟振明提出要采取符合西藏突发事件特点和网络舆情发展规律的监控措施,包括:强化网络媒体和网络舆情监控意识;加强网络媒体和网络舆情理论与知识的学习与培训,增强新媒体和网络舆情的监控能力,灵活运用监控策略;利用现代网络舆情监测技术,夯实网络舆情监控的技术基础,尤其需要开发藏文舆情监控软件和技术平台,并加强人才培养和引进,打造一支精于政策、法律、技术和业务的网络媒体宣传和网络舆情监控的专业队伍;加强立法工作,完善互联网络法律法规,强化公职人员的法治观念,规范政府行政行为;加强对国内外代表性涉藏网络社区和网络媒体的监测[[20]] 

  4.民族地区网络舆情拓展分析 

  关于民族地区网络舆情的拓展分析研究也是当前民族地区网络舆情的一大分支,目前主要在政治民主、教育德育、公共政策、群体事件等领域展开。 

  在民族政治理论方面,牛旭在其硕士论文中,探讨了网络政治参与对我国民族地区政治稳定的正负面效应,网络政治参与一方面拓宽了政治参与渠道、锻炼了民族同胞的政治参与能力,增强了对民族地区政府行政行为合法性的监督,为民族地区政府了解民情民意、制定更合理政策和舆情调控等工作提供了有效平台;另一方面网络政治参与可能带来非理性和无序的政治参与不断扩大、政治谣言和虚假信息的泛滥、激发各种冲突和矛盾,破坏我国民族地区的团结与稳定。例如新疆“7.5”事件,就是以网络为媒介引发的群体性暴力事件,它对民族地区的政治稳定和繁荣发展,造成了恶劣的影响。通过对“7.5”事件的深入分析,说明网络政治参与对民族地区政治稳定产生的重大影响。因此要促进网络政治参与发展维护民族地区政治稳定,应该规范网络政治参与,削弱网络政治参与负效应,提高网络政治参与水平,维护民族地区政治稳定,加快发展网络技术,确保民族地区信息安全[[21]]。黄璞在其硕士论文中,着力探讨民族地区公共危机、网络舆情与政策变革之间互动的内在机制,分析民族地区政策变革的产生背景、表现、特点、影响,通过研究民族地区政策变革在现实中的特点和不足,提出优化民族地区政策变革的策略选择,为民族地区公共政策质量的提升提供指导框架和诊断工具[[22]]。马存孝针对近些年在网络舆情中出现的一些取消民族区域自治的言论,分析了网络上这些言论产生和传播的原因,继而提出,在当前我们必须从宪法的基本原则和民族区域自治法的相关规定出发,继续坚持民族区域自治,才能更好的解决我国的民族问题,促进我国各民族共同团结奋斗,共同繁荣发展[[23]] 

  在教育德育方面,刘勃然对少数民族地区网络舆情危机进行了教育学解析,提出在教育学视域下,从受教育者、教育者、教育培养目标及教育内容等层面加强针对性工作,包括:加大对少数民族地区初、高中青少年学生的媒体素养教育力度;提升少数民族地区教师的舆情事件解读能力和对学生舆论的引导能力;弘扬少数民族地区学校文化,抵制网络低俗文化,确保学校教育培养目标的实现;重视少数民族地区高校大众传媒及相关专业人才培养;建立和完善少数民族地区高校网络舆情相关机制,从根本上找到网络舆情危机的应对之策[[24]]。张秀红提出网络舆情监管、利导机制不畅对公民意识的培育会产生不可忽视的消极影响,因此要加强网络文化建设,坚持以现代文化为引领,不断完善网络法律法规,建设网络法律文化、道德文化。依托法治、德治的力量协同应对网络舆情不和谐因素,培育健康向上的公民意识,进而构建人民精神文化的新家园[[25]] 

  在群体事件分析方面,陈玉冰对国内互联网舆情既有研究进行梳理,对群体性事件发生因素进行理论探讨,结合两个发生在少数民族地区的群体性事件案例——内蒙古511事件和湖北利川事件,分析了涉及民族问题的互联网舆情的特点,认为并不存在绝对意义上纯粹的民族问题互联网舆情,民族因素在互联网环境下已经成为社会动员的工具,应该以一个更广大、更宏观的视野对其进行研究[[26]] 

  5.民族地区网络舆情监控技术与系统构建 

  当前民族地区的网络舆情技术与系统构建的研究处于起步阶段,研究成果尚少。长期以来,少数民族文字网站监控是一个技术性难题,研究内容主要集中在民族文字信息处理技术、内容分析、系统构建等三方面。 

  (1)少数民族文字信息处理与网络舆情监测 

  从正式发表文献来看,少数民族文字信息处理应用于网络舆情监测的研究,目前主要在藏文和维吾尔文开展,其他民族文字在国内鲜见有相关研究发表,仅有一篇以彝文为例的跨境多民族语种网络舆情内容分析的研究,但研究文献中并未涉及针对彝文的自动分词和文本信息抽取。 

  1)藏文信息处理与网络舆情分析。由于藏文信息处理技术的发展与中英文相比较为滞后,存在着编码方式不统一、藏文分词技术不成熟等问题,这对藏文网页的敏感词监控以及话题的发现与跟踪造成极大的困难,而国内外藏文网站网页日益增长,涉藏敏感事件导致的网络舆论影响较大,因此藏文网络舆情分析的研究极为重要复杂。 

  藏文网页舆情监控的研究相对于其他民族文字的网络舆情研究起步较早,现有正式发表成果主要来自西北民族大学。如2008年江涛等人设计了藏文网页舆情监控系统,基于藏文信息处理技术讨论了藏文网页的判定算法。目前藏文网页绝大部分采用同元和班智达的字库,也有少数采用微软的藏文字库,针对这些众多的藏文编码方式,他们根据编码结构的差异编写了编码转换的算法,对从网页中得到的藏文内容进行编码转换,将不同藏文编码统一成国家扩A标准码,并采用格助词与藏文舆情分词词典相结合的自动分词算法来针对舆情信息进行分词处理,用于敏感词监控、话题发现与跟踪[[27]]。又如夏建华2013年在其硕士论文中针对藏文Web网络中,Web页面内容和页面之间的链接构建了藏文Web网络模型,并针对Web页面的相关数据进行搜索算法的研究,找出网络社区中存在和潜在的信息,挖掘网络中蕴含的社会网络关系和藏语文字信息[[28]]。再如邓竞伟等根据复杂网络理论的研究方法对藏文网络舆情传播规律进行实证分析,设计了一个基于Web信息挖掘的藏文网络舆情挖掘分析模型。结果表明,通过聚类可提高藏文网络舆情的准确性,Web挖掘能够有效地从藏文网络上获取并分析相关舆情信息[[29]] 

  2)维吾尔文信息处理与网络舆情分析。近年来,作为新疆地区主要少数民族文字之一的维吾尔文,在计算机信息处理,标准化等方面,以及维吾尔文WEB建设方面有了迅速的发展,因此研究维吾尔文网络信息的安全和正确的舆情疏导机制成为一个重要的课题。卢修配等归纳了维吾尔文网络舆情分析要解决的几个关键技术问题,包括:针对维吾尔文字网站的搜索系统设计,建立维吾尔语舆情语料库,维吾尔文信息抽取、语义识别算法,维吾尔语热点话题与分析方法、维吾尔文网站的结构分析等[[30]]。目前已发表的与网络舆情分析相关的维吾尔文信息处理技术研究主要有敏感词识别、信息过滤、主题抽取、情感识别和意见挖掘等。如木合塔尔•沙地克等[[31]]采用MATLAB 开发一个维吾尔语敏感词检索系统,该系统对来自于新疆广播电台网站的维吾尔语新闻节目的语音信号进行连续敏感词检索,采用隐马尔科夫模型(HMM)实现维吾尔语敏感词识别功能,从并对识别结果进行分析。实验结果表明,该系统对敏感词的识别表现了较高的识别率。木尼拉•塔里甫[[32]]提出了利用维吾尔文词语间隔、段落间隔空间和标点符号混合使用的方法实现在Web文本中嵌入敏感词语和URL信息并可隐藏它们,从而实现信息反过滤的方法。禹龙等[[33]] [[34]]研究了维吾尔文的主题抽取和情感识别技术,在主题抽取方面,面向维吾尔语评论文本,针对显式主题和隐式主题,提出了一种陈述级的主题抽取方法。在情感识别方面,针对维吾尔语情感词汇获取难度大、人工扩充情感词汇工作量大且效率低的缺陷,结合维吾尔语主观文本语料的具体特点,分析维吾尔语情感词汇在情感语料中表现的特征,建立维吾尔语情感词汇的特征模板,利用条件随机场模型实现维吾尔语情感词汇的自动识别方法。在意见挖掘方面,段祥超[[35]]在分析维吾尔语词性规则和语法特征的基础上,以维吾尔语评论性语句为语料,提出了一种基于Bootstrapping算法的意见挖掘关系抽取方法。在每一次迭代过程中,根据改进的评分公式选取最优模式抽取主题词-意见词对;迭代结束后,对于主题-意见词对为空的评论语句,使用最近匹配算法抽取主题-意见词对;用并联模式和否定模式对抽取的主题-意见词对进行扩展和修正。 

  近年来少数民族文字网络舆情分析的研究基金项目也逐渐开展。例如由新疆大学禹龙主持的国家社科基金2010项目“维吾尔语的网络舆情信息自动获取与分析方法研究” [[36]];又如中央民族大学信息工程学院闫晓东副教授承担的国家民委资助课题“藏、维文网络敏感信息自动发现和预警技术研究”,也针对藏文、维吾尔文网络舆情分析技术展开了研究,预期目的是能够针对各类敏感信息,提出不同级别的预警方案,目前已能做到敏感词的自动发现和跟踪[[37]];再如由新疆大学和北京理工大学等联合主持的新疆自治区2012年高技术研究发展计划课题“新疆多民族语言网络舆情监测预警系统开发与应用”,以国内外涉疆的网络新闻、论坛、博客、微博、短信等为研究对象,覆盖汉、维、哈、柯等多民族语言社区,对网络舆情新疆多民族语言基础数据及领域知识的多模式集成方法、新疆多民族语言舆情本体库构建与共享机制、多通道网络新媒体信息与传统渠道的信息综合获取与舆情特征提取、舆情内容的识别/分析/推演与舆情调控、舆情敏感突发事件的发现与跟踪等技术进行研究,预期建成新疆网络舆情监测预警系统并进行应用示范 [[38]] 

  除上述少数民族文字网络舆情系统研究外,以民族地区为研究主题的中文网络舆情信息技术与系统研究也有开展。如中央民族大学王运松在他开发的试验性系统中,以四川阿坝事件在互联网中传播的相关信息为处理对象,研究了互联网上少数民族信息统计分析的关键技术[[39]]。王嘉梅等人以云南跨境民族语言彝文为例,对跨境多民族语种网络舆情内容进行深入分析与理解,构造了基于人工免疫系统的网络舆情信息智能滤取系统[[40]] 

  (2)网络舆情系统构建与舆情分析关键技术 

  网络舆情系统按流程通常包括舆情规划、舆情收集、舆情分析、舆情预警和舆情评估等子系统,其构建的重点和难点是舆情分析。网络舆情系统的工作主要包括两个方面:一是从互联网获取有效的舆情信息;二是针对获取的互联网信息进行分析、处理、分类、监控和预警。这两个方面涉及多个领域的技术,包括:Web文本挖掘、文本分类、情感倾向分析、话题检测与跟踪、自然语言处理和基于统计的预警和分析等。舆情分析系统主要功能包括:热点识别功能、倾向性分析、主题跟踪、信息自动摘要、突发事件分析和统计报告功能。 

  网络舆情分析技术是舆情系统的关键技术,主要包括以下几个方面: 

  (1) 文本预处理 

  网络舆情分析系统的文本预处理技术包括信息过滤、词法分析、句法分析、语义分析。当前民族地区网络舆情文本预处理技术的应用主要集中在信息过滤、词法分析和句法分析,少见有语义分析技术应用。 

  首先是词法分析和句法分析,即汉文和少数民族文字的分词和组词,特别是少数民族文字的分词和组词,如藏文、彝文分词,维吾尔文组词。以藏文为例,藏文只有音节字、句和段可以通过分隔符来划界,而词是没有分隔符的,因此藏文内容分析的基础是如何结合藏文字、词、句各类形式特征来确定藏文分词。藏文作为拼音文字和二维的书写规则等特点,使得其分词有别于汉语言分词。此外舆情监控与搜索引擎不同,对于敏感信息、人名以及专有名词的分词要求较高,已有词典不能很好满足舆情监控的要求,故需要对已有的词典进行扩充和修改,如江涛等建立了藏文舆情分词词典来解决此问题。 

  其次是信息过滤与web挖掘技术的方法,包括网页分类、网页识别、网页搜索策略以及关键词提取的相关算法。如王运松在四川阿坝事件互联网传播信息采集的信息过滤处理中,基于文本分类中的向量空间模型提出了一种网页识别算法,该算法提取网页的HTML标签、URL字符、网页文本等构成特征值,并基于KNN算法构造决策树模型识别网页;同时,在网页搜索策略方面,针对Web的动态性、异构性、复杂性和高效搜索策略等特点,在分析基于重要度优先的搜索策略和基于相关度优先的搜索策略基础上,使用了一种基于多元信息加权协调的广度搜索策略 [[41]]。又如王嘉梅等利用人工免疫系统在信息处理方面的特点来实现对外部未知信息的有效识别和判断,以完成对信息的更快速、准确、有效的检索和过滤。同时在分析网页信息采集、文本的预处理等基础上,构建了基于人工免疫原理的网络敏感信息滤取系统[[42]] 

  (2) 文本表示与特性抽取 

  网络信息的文本表示是将文本用计算机能够处理的形式化方式表示出来,是网络舆情内容分析的基础。当前文本表示通常采用经典的向量空间模型(VSM)。向量空间系统对文本进行简记表示,认为特征之间是相互独立的而忽略其依赖性,将文本表示为N维空间的一个特征向量,也就是N维特征空间中的一个点;一个文本集则可以表示为一个矩阵,也就是N维特征空间中的一些点的集合。在当前的民族地区网络舆情系统与相关技术研究中,基本上都是采用向量空间模型作为文本表示的方法。 

  目前网络舆情主题识别技术,正在从传统的线性文本聚类分析,向更注重内容特征的话题标引统计识别技术发展。特性抽取成为网络舆情主题识别的基础。特征抽取具有降低向量空间维数、简化计算、防止过分拟合以及去处噪声等作用。在当前的民族地区网络舆情系统中,特性抽取技术也被广泛应用,如王嘉梅采用国家“八六三”计划中文本语料库和Rocchio分类器对常用的特征选择算法进行评估,结论是几率比OR 方法最好[[43]]。在主题识别方面,还有禹龙等[[44]]采用GLR-Cascaded LDA模型抽取段落级的局部主题、篇章级的全局主题,建立全局—局部主题关系,并将这些关系对应到每个意见陈述中;然后运用Bootstrapping和模式匹配的方法进行显式陈述的主题抽取;最后使用隐式主题推断算法推断隐式陈述的主题。 

  (3) 话题发现与跟踪 

  目前对于话题发现有两种模型: 基于向量的模型和基于概率的模型。基于向量的模型将所有待处理数据表示为向量, 判断两个文档是否讨论同一个话题的方法是通过计算两个向量之间的相似度来完成, 而基于概率的表示则是把文档表示为词的概率模型或N 元语言模型, 通过计算话题T 与文档d的生成概率P(d|T) 来判断两者之间的关系。话题发现的文本挖掘方法主要采用文本聚类方法,如江涛等在其藏文网络舆情系统中采用SOM 神经网络聚类算法来进行话题发现。 

  话题跟踪功能是为了用户能够对自己所关心话题进行跟踪操作,用户可以将已获得的事件信息交给系统,系统自动对不断到来的信息进行处理和分析,从而准确的把握事件发展的整体情况,进而实现对网络舆情的控制和管理。如邓竞伟等根据网络舆情传播的复杂网络特征,运用复杂网络的分析处理方法对网络舆情热点进行挖掘。首先要对藏文网络中的信息进行采集,然后对Web网页抓取和对数据存储。通过用户网页访问频率的分析,在一定程度上发现用户感兴趣的问题,从而确定目前的热点网络舆情话题[[45]]。又如王运松等选取“四川、阿坝、阿壩、藏区、藏區、格尔登寺、格爾登寺、藏族、年轻、还俗、離寺、藏人、僧人、僧侶、自焚、事件”作为话题特征关键词,跟踪搜索抓取相关话题的网络信息[[46]]。话题跟踪的文本挖掘方法主要采用文本分类方法。 

  6. 网络舆情监控系统之民族地区应用 

  (1) 具有民族文字处理功能的网络舆情系统 

  近几年来国内网络舆情系统商业化产品得到很大发展,涌现了一批网络舆情监测系统,如军犬网络舆情监控系统、本果网络舆情监控系统、谷尼网络舆情监控系统、西盈网络舆情监测系统、人民网舆情监测平台、泰一舆情监测系统、新天网络舆情监测系统、乐思网络舆情监测系统、锐眼网络舆情监测系统和Rank舆情监测系统等。但提供少数民族文字网页舆情处理的系统不多,据各网络舆情系统官网介绍或媒体报道,目前有军犬网络舆情监控系统、本果网络舆情监控系统、谷尼网络舆情监控系统等少数系统可提供部分少数民族语言网络舆情支持功能。 

  1)   军犬网络舆情监控系统的军犬少数民族语言舆情系统,实现了53种少数民族语言或外国语言的检测和采集。其特色有:采集少数民族语言,如维文、蒙语、藏语、朝鲜语、壮语等;采集其他外国语,如缅甸语、英语、日语、法语、阿拉伯语、越南语、老挝语等;各种网站编码方式自动匹配,如:gb2312utf8gbkbig5iso88591等;支持境外数据的采集等[[47]] 

  2)   本果网络舆情监控系统的党政舆情监测解决方案提供了包括部分少数民族文字的多语言信息采集,支持中文、英文、蒙文、藏文、维文等多语言网络信息采集[[48]] 

3)   谷尼网络舆情监控系统官网未提及少数民族语言支持功能。但有报道称谷尼国际软件公司提供的少数民族语言监测服务,目前仅能实现定向采集与全网搜索这两种监测方式,至于中文舆情监测中的内容情感分析、主题词自动提取、全文检索等服务则无法实现,主要原因是“没有少数民族语言的相关词库和知识库。”这些都有赖于相关学术机构提供基础性的研究成果[[49]] 

  (2) 民族地区政府网络舆情系统应用现状 

  在互联网的飞速发展下,各类突发事件通过网络媒体得以快速传播,社会舆情压力瞬间呈几何爆发式增长,由网络舆情所引发的公共管理危机已日益成为我国各级政府关注的焦点。因此越来越多的政府机关开始采用网络舆情系统来监控本地区的媒体、论坛、博客、微博等网站里的舆情信息,以便及时发现敏感信息和社情民意,同时及时化解和疏导网络舆情引起的社会和政治危机,快速实现对网络舆情事件的正面舆论宣传和引导。据不完全调查,目前在民族八省区和民族自治地方中,已有一些政府机关单位应用网络舆情监测系统来监控网络舆情信息,如采用军犬舆情系统的内蒙古自治区宣传部、内蒙古自治区互联网信息办公室、内蒙古公安厅、中共乌兰察布市宣传部、中共乌海宣传部、霍林郭勒市委宣传部、鄂尔多斯市纪检委、赤峰市公安局、锡盟公安局、西盟公安局网安大队、宁夏中共六盘水市委宣传部、新疆兵团网、阿克苏地委宣传部、中共阿克苏市市委宣传部、青海西宁市委宣传部、贵州省毕节市委宣传部、四川省凉山州公安局等民族地区政府部门。又如采用西盈舆情监测系统的广西市委宣传部、广西壮族自治区民族事务委员会、新疆广电、云南省地州舆情监测系统、贵州省毕节市七星关区纪委反腐倡廉网络舆情监测系统等。 

  7.结束语 

  民族地区互联网的快速发展,以及网络舆情的复杂性、突发性和政治性等特点,使得民族地区的网络舆情研究更为重要。我国网络舆情的研究起步于十年前,在近几年呈快速发展趋势,相比之下,民族地区的网络舆情研究开展得更晚,2008-2013年开始有一批研究成果发表,来自新闻传播、民族问题、民族教育、民族文字处理和计算机技术研究领域的专家学者和研究生从基础理论、应用对策、系统技术和拓展分析四大方面对民族地区的网络舆情进行了探索研究。从地域上看重点研究地区是新疆,其次是西藏。从民族文字网络信息技术来看,主要是维文和藏文的信息处理和舆情系统构建。从研究成果来源期刊看,来自核心期刊的论文甚少,研究成果学术质量还需提高。从研究内容来看,当前民族地区网络舆情研究的问题还比较表层,缺乏对理论和技术的深层次研究。民族地区互联网发展以及民族地区网络舆情的特殊性,表明在民族地区尤其需要采用网络舆情监测系统来对网络舆情进行监控和疏导。据不完全调查,目前已有些民族地区政府机关开始应用商业网络舆情监测系统,但当前提供少数民族文字网络信息采集和监控分析的系统还非常少,少数民族语言信息处理技术研究的滞后仍然是民族文字舆情监测系统开发的技术瓶颈。从当前民族地区网络舆情研究和舆情系统应用来看,未来民族地区网络舆情的研究有两个重点方向:一是要填补民族地区网络舆情指标体系构建理论的空白,二是对少数民族文字网络舆情信息处理技术进行深入研究。 


 

[[1]]张玉强. 民族地区网络舆情危机的政府引导策略研究[J]. 中共南宁市委党校学报,2013(2). 

[[2]]罗安平. 民族地区突发事件中传媒应对原则探究[J]. 中国广播电视学刊,2009(5). 

[[3]]石静. 浅析民族地区网络媒介对突发事件的舆论引导[J]. 西北民族大学学报(哲学社会科学版),2010(6). 

[[4]] 张菊兰. 新疆网络舆情的特征与效应分析[J]. 新疆财经大学学报,2012(4). 

[[5]]钟振明. 论西藏突发事件的舆情监测评估与引导机制构建[J]. 西藏发展论坛,2013(2). 

[[6]]林凌.75”暴力事件的网络舆论传播特点及引导策略[J].当代传播2009(5). 

[[7]]1. 

[[8]]魏冲.浅析涉及民族因素群体性事件的网络舆情引导[J]. 神州,2013(5). 

[[9]]6. 

[[10]]5. 

[[11]]李育全.边疆民族地区高校舆情分析及引导[J].教育探索,2010(1). 

[[12]]阿布都瓦依提•尼亚孜.浅析维吾尔文网站网络舆情引导和控制[J].新闻世界2010(7). 

[[13]]11. 

[[14]]4. 

[[15]]李光,钟雅琼. 大陆研拟藏维文网络舆情监测系统,监控分裂风险[N]. 凤凰周刊,2012-06-25. 

[[16]]王秀丽.新疆网络舆情监测面临的困境及对策[J].新疆警官高等专科学校学报,2013(3). 

[[17]]帕哈尔丁·赛福丁, 蒲丽霞.新疆网络舆情机制的路径选择[J].时代教育,2013(5). 

[[18]]郑旭东.新疆高校校园舆情监控机制创新研究[J]. 前沿2013(14). 

[[19]]桑华. 文化安全视角下的新疆高校网络舆情管理探究[J]. 兵团教育学院学报,2013(1). 

[[20]]5. 

[[21]]牛旭. 网络政治参与与民族地区政治稳定探析[D]. 中央民族大学,2011. 

[[22]]黄璞. 公共危机、网络舆情下我国民族地区政策变革的优化策略研究[D]. 云南大学, 2012. 

[[23]]马存孝, 彭谦.网络舆情取消民族区域自治言论的原因分析[J]. 民族论坛2012(24). 

[[24]]刘勃然. 少数民族地区网络舆情危机的教育学思考[J]. 宁夏大学学报(人文社会科学版)2012(4). 

[[25]]张秀红, 丛培兵. 网络舆情对新疆公民意识培育的影响及应对[J]. 新疆师范大学学报(哲学社会科学版)2013(2). 

[[26]]陈玉冰. 民族地区群体性事件的互联网舆情研究——以内蒙古511事件和湖北利川事件为例[D]. 中央民族大学,2012. 

[[27]]江涛,于宏志,李刚. 基于藏文网页的网络舆情监控系统研究[C].上海:全国第23届计算机安全学术交流会论文集,2008.10. 

[[28]]夏建华. 藏文Web动态网络模型和搜索策略研究[D].西北民族大学. 2013. 

[[29]]邓竞伟,邓凯英,李永生,李应兴. 基于藏文网络的舆情传播模型[J]. 计算机系统应用2013(3). 

[[30]]卢修配,齐向伟,艾斯卡尔.维吾尔文网络舆情研究现状及几个关键问题[J]. 新疆师范大学学报(自然科学版),2012(2). 

[[31]]木合塔尔•沙地克,李晓,布合力齐姑丽•瓦斯力.维吾尔语广播新闻敏感词检索系统的研究[J]. 中文信息学报2011,25(4). 

[[32]]木尼拉•塔里甫, 安尼瓦尔•加马力, 亚森•艾则孜, 帕力旦•吐尔逊.基于简易密写架构的维文反过滤技术研究[J]. 信息网络安全2013,(7). 

[[33]]禹龙, 田生伟, 黄俊.维吾尔语评论文本主题抽取研究[J]. 中文信息学报2011,27(4). 

[[34]]禹龙, 田生伟, 冯冠军.维吾尔语情感词汇自动识别[J]. 计算机工程2011,37(7). 

[[35]]段祥超, 禹龙, 田生伟, 吐尔根•依布拉音等.维吾尔语意见挖掘关系抽取研究[J]. 计算机工程与设计2013,34(9). 

[[36]]全国哲学社会科学规划办公室网站,http://www.npopss-cn.gov.cn/. 

[[37]]15. 

[[38]]自治区科技厅发展计划处. 关于对2012年度自治区科技支撑、高技术研究发展计划拟立项目进行公示的通知[OL]. [2014-8-4].新疆维吾尔自治区科学技术厅2012-3-5. http://www.xjkjt.gov.cn/www.xjkjt.gov.cn/kjdt/tztg/2012/40780.htm. 

[[39]]王运松.互联网上少数民族信息统计分析的关键技术研究[D].中央民族大学,2012. 

[[40]]王嘉梅,张建营,赵继勇. 云南跨境多民族语言复杂网络舆情内容分析[J]. 信息与电脑(理论版)2013(6). 

[[41]]39. 

[[42]]40. 

[[43]]40. 

[[44]]33. 

[[45]]29. 

[[46]]39. 

[[47]]中科点击.军犬少数民族语言舆情系统[OL]. [2014-10-4]. http://www.54yuqing.com/contents/2/12645.html. 

[[48]]北京本果信息技术有限公司. 党政舆情监测解决方案[OL]. [2014-10-4]. http://www.ibenguo.cn/. 

[[49]]15. 

分享到: 0 转载请注明来源:中国社会科学网 (责编:孙志香)
696 64.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
wxgg3.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们