一、 立项概况
随着互联网应用的不断普及,网络舆情研究作为一个新兴的热点研究领域,近十年来的相关研究日益增多。由于地理、历史、文化等原因,民族地区不仅在经济发展水平上明显滞后,而且也成为众多民族类社会突发事件的多发地和集中地。随着民族地区互联网的迅速普及,涉民族类的社会事件和网络舆情危机事件交相呼应,加上一些敌对势力、民族分裂势力、反华势力等借助于国际互联网的舆情煽动,更加剧了民族地区网络舆情监管的复杂性和困难性。由此,近几年,国家对民族地区和少数民族文字网络舆情研究日益重视,一直持续不断地支持。以国家自然科学基金和国家社科基金为例,两类国家基金在民族地区网络舆情研究方面共立项36个。如图1所示,国家自然科学基金从2009年开始资助信息科学计算机领域在民族文字网络舆情关键技术方面的研究,至2016年每年都有相关课题立项,共20项。国家社科基金则是从2010年开始至2016年每年有相关课题获批立项,共16项。在社会科学界,一开始(2012年前)主要在图书情报学领域开展民族地区网络舆情研究,此后扩展到新闻与传播学、政治学、马列科学、社会学和民族问题研究等领域,以图书情报和新闻传播领域为主。
图1 2009-2016年民族地区网络舆情研究国家自然科学、社会科学基金项目
表1和表2分别列出了国家自然科学基金和国家社科基金资助的有关民族地区网络舆情技术与理论的研究项目。由表1和表2可见,36个国家级项目的依托单位主要为大学,其中新疆大学立项最多,共7项,其次是西藏大学和新疆财经大学各有4项,新疆师范大学、石河子大学和内蒙古工业大学各2项,其他单位都是各1项。研究地区主要分布在新疆,有16个项目,其次是西藏、内蒙古和云南,分别有5、4、3个项目,青海和甘肃各有2个项目。其他项目分布在四川、重庆、宁夏、甘肃和北京。
表1国家自然科学基金——民族网络舆情项目(截至2014年)
批准年度 |
项目名称 |
依托单位 |
项目负责人 |
2009 |
维吾尔语文本情感倾向性分析技术研究 |
新疆大学 |
田生伟 |
2010 |
维吾尔文不良信息过滤关键技术的研究 |
新疆大学 |
帕力旦•吐尔逊 |
2010 |
新疆汉维双语网络舆情分析关键技术研究 |
新疆师范大学 |
栾静 |
2011 |
多种语言文字环境下结合内容审计的网络舆情监测技术研究 |
新疆大学 |
努尔布力 |
2011 |
基于群体智能涌现的藏文网络舆情分析及突发事件预警机制研究 |
西藏大学 |
格桑多吉 |
2011 |
维吾尔文WEB舆情挖掘的关键理论及技术研究 |
新疆大学 |
艾斯卡尔•艾木都拉 |
2012 |
细颗粒度维吾尔语文本意见挖掘方法的研究 |
新疆大学 |
禹龙 |
2012 |
基于网络社群的网络舆情演化分析及突发事件预警机制研究 |
新疆财经大学 |
刘继 |
2013 |
蒙、汉双语的公共危机事件网络舆情管理体系研究 |
内蒙古工业大学 |
赵岩 |
2013 |
跨语言社会舆情分析基础理论与关键技术研究 |
中央民族大学 |
赵小兵 |
2013 |
云南跨境民族网络舆情信息挖掘关键技术研究 |
云南民族大学 |
王嘉梅 |
2014 |
汉越双语事件语料库构建及舆情观点挖掘方法研究 |
昆明理工大学 |
余正涛 |
2014 |
基于网络的情感语义词典的自动构建技术研究 |
青海大学 |
田芳 |
2014 |
维吾尔语命名实体间语义关系抽取理论方法研究 |
新疆大学 |
卡哈尔江·阿比的热西提 |
2015 |
基于网络流量分析的地区网络舆情监控系统研究 |
内蒙古工业大学 |
刘利民 |
2015 |
新疆暴恐事件国际舆论倾向性分析 |
新疆财经大学 |
张绍武 |
2015 |
基于深度学习的藏语网络舆情监测中的大数据处理研究 |
西藏大学 |
普次仁 |
2015 |
基于线上-线下双层耦合网络的信息传播模型研究 |
新疆财经大学 |
于凯 |
2016 |
基于内容的藏文网络不良舆情信息识别监测模型及其评价指标体系研究 |
西北民族大学 |
普措才仁 |
2016 |
基于Fillmore格语法的藏语句法语义研究 |
西藏大学 |
才华 |
表2国家社会科学基金项目——民族网络舆情项目(截至2014年)
批准年度 |
项目名称 |
依托单位 |
项目负责人 |
2010 |
维吾尔语的网络舆情信息自动获取与分析方法研究 |
新疆大学 |
禹龙 |
2011 |
民族地区突发事件的网络舆情研判及宏观预警研究 |
新疆财经大学 |
阿斯哈尔•吐尔逊 |
2012 |
少数民族地区应对与化解网络舆情危机策略研究 |
中共宁夏回族自治区委员会党校 |
梁春阳 |
2012 |
边疆民族地区舆情分析及媒体舆论引导机制研究 |
内蒙古大学文学与新闻传播学院 |
刘寒娥 |
2012 |
云计算时代民族地区网络舆情监控与疏导研究 |
西南民族大学计算机科学与技术学院 |
张建华 |
2012 |
西藏重大突发事件的舆情监控机制研究 |
中共西藏自治区委党校 |
钟振明 |
2012 |
新疆高校思想政治教育网络舆情研究 |
新疆师范大学 |
张秀红 |
2013 |
边疆舆情学的体系构建与边疆舆情治理研究 |
云南师范大学 |
李建立 |
2013 |
边疆民族地区网络舆情传播及其政府治理机制研究 |
内蒙古科技大学 |
刘建华 |
2013 |
西北地区民族宗教问题网络舆情危险辨识与引导机制研究 |
甘肃省社会科学院 |
胡圣方 |
2013 |
支持微博舆情服务的藏文主题挖掘关键技术研究 |
青海师范大学 |
叶成绪 |
2014 |
涉疆问题在社会化媒体中的舆情现状与应对机制研究 |
石河子大学 |
王怀春 |
2014 |
新疆非常规突发事件舆情信息监测与分析方法研究 |
石河子大学 |
郭理 |
2015 |
边疆地区突发事件网络舆情信息二维预警指标体系与监测平台研究 |
西藏大学 |
王朝霞 |
2015 |
社会化媒体环境下新疆突发事件舆情演变规律的分析及应对研究 |
新疆自治区委党校 |
哈丽云 |
2016 |
移动互联时代西部边疆民族地区网络舆情引导与风险防控研究 |
西南政法大学 |
邹东升 |
除上述国家基金支持的项目以外,各省区和院校也纷纷资助民族语言或民族地区的网络舆情研究。以新疆为例,新疆维吾尔自治区自然科学基金在2014年资助了“大数据环境下维汉网络热点话题高效检测方法研究”(项目负责人:王羡慧,依托单位:新疆大学)和“基于动态演化的维文舆情本体研究”(项目负责人:刘胜全,依托单位:新疆大学)两项研究;新疆维吾尔自治区社科基金项目2014年资助了“新疆暴恐事件网上舆情发现、研判、处置研究”(项目负责人:郜玉金,依托单位:新疆大学)。
二、 项目研究内容
目前国家级民族地区网络舆情理论与技术方面的研究课题内容主要有以下两大方面:
(一) 民族语言文字网络舆情系统关键技术研究
民族语言文字网络舆情技术的研究项目主要由国家自然科学基金支持,只有少数项目由国家社科基金资助。目前进行的项目主要包括以下几方面的关键技术研究。
1. 维吾尔语文的文本分析和信息处理
当前研究最多的是维吾尔语文的文本分析和信息处理,如维吾尔文的不良信息过滤技术、文本情感倾向性分析技术、维吾尔语命名实体间语义关系抽取等。
例如帕力旦•吐尔逊在“维吾尔文不良信息过滤关键技术的研究”项目中,围绕维吾尔文不良信息过滤系统所需要的相关技术,对维吾尔文网页收集与净化、语种识别、编码统一、拼写检查、候选词产生、文本分类、舆情控制等相关技术开展了研究,并取得了一些成绩。通过项目的实施,构建了100万次词人工校对的维吾尔文词法标注网络文本语料库,与公安部门合作构建维吾尔文不良信息语料库,研究与实现了统计和规则相结合的维吾尔文语种识别系统、维吾尔文四种文字相互转换系统,提出维吾尔文拼写检查方法、候选词产生算法,通过开源工具对文本分类及敏感信息过滤进行实验,研发维吾尔文不良信息检索过滤实验系统。通过项目,为维吾尔文不良信息过滤、舆情监控等奠定了基础。
2. 藏语文的文本分析和信息处理
藏文方面的文本分析和信息处理研究有基于深度学习的藏语网络舆情监测中进行藏语语义分析、基于内容的藏文网络不良舆情信息识别、基于Fillmore格语法的藏语句法语义研究等。如在格桑多吉在“基于群体智能涌现的藏文网络舆情分析及突发事件预警机制研究”项目中,将藏文网站、论坛、博客、微博等网络舆情信息作为研究对象,利用藏文文本挖掘和自然语言处理技术提取用户关心事件的时间、地点、主体、行为和客体要素,设计网络用户对事件的关注及态度模型并建立具有差异度的用户关注及态度模型库。
3. 其他少数民族语言文字的文本分析和信息处理
在网络舆情文本信息处理技术方面,除了维吾尔文和藏文的文本信息处理技术研究之外,还有少量的其他少数民族文字或跨境民族文字文本分析与信息处理,如哈萨克文、彝文和越南语等。如新疆大学努尔布力在“多种语言文字环境下结合内容审计的网络舆情监测技术研究”项目中,除了维吾尔,还对哈萨克语的文字分词、哈萨克和柯尔克孜语的文本特征选择、哈萨克文、柯尔克孜文文种识别算法、敏感词识别和过滤等关键技术进行了研究。又如云南民族大学王嘉梅在其主持的“云南跨境民族网络舆情信息挖掘关键技术研究”国家自然科学基金项目中,以云南跨境民族语言彝文为例,对跨境多民族语种网络舆情内容进行深入分析与理解,用于构造了基于人工免疫系统的网络舆情信息智能滤取系统。
4. 网络舆情分析技术与系统构建
这方面研究涉及到维吾尔文、藏文等少数民族文字基于网络舆情挖掘的关键理论技术研究,以及网络舆情监测技术和系统构建,包括网络舆情信息自动获取与分析、汉维双语网络舆情分析、维吾尔语文本意见挖掘方法;基于网络的情感语义词典的自动构建技术、网络舆情监测技术、网络舆情监控系统研究等。相关研究项目举例如下:
在维文网络舆情分析方面,禹龙等在其主持的“维吾尔语的网络舆情信息自动获取与分析方法研究”国家社科基金项目中,研究了维吾尔文的主题抽取和情感识别技术,在主题抽取方面,面向维吾尔语评论文本,针对显式主题和隐式主题,提出了一种陈述级的主题抽取方法。在情感识别方面,针对维吾尔语情感词汇获取难度大、人工扩充情感词汇工作量大且效率低的缺陷,结合维吾尔语主观文本语料的具体特点,分析维吾尔语情感词汇在情感语料中表现的特征,建立维吾尔语情感词汇的特征模板,利用条件随机场模型实现维吾尔语情感词汇的自动识别方法。
格桑多吉在“基于群体智能涌现的藏文网络舆情分析及突发事件预警机制研究”项目中,提出基于群体智能涌现的高效准确的藏文网络舆情分析算法,包括主题关注度分析、热点分析、焦点分析、敏点分析、拐点分析、频点分析、重点分析,用于预测潜在突发事件。提出了基于群体智能的半结构化藏文Web文本聚类算法,将聚类后的Web文本应用于网络舆情分析,进行主题关注度分析和话题热度特性分析。最后设计实现了基于群体智能涌现的藏文网络舆情分析及突发事件预警系统,提供了包括藏文信息采集、文本聚类和舆情分析管理等在内的藏文网络舆情智能分析处理能力。
努尔布力在“多种语言文字环境下结合内容审计的网络舆情监测技术研究”项目中,研究了多种语言文字环境下的信息预处理技术,结合内容审计技术提出网络舆情疏导监测机制,研究热点事件跟踪技术和舆情预警技术,开发了交互式分析程序和舆情监测工具。
(二) 民族地区网络舆情理论与应用
1. 网络舆情传播与管理体系
在网络舆情传播和管理体系等基础理论研究方面,有刘建华的“边疆民族地区网络舆情传播及其政府治理机制研究”、李建立的“边疆舆情学的体系构建与边疆舆情治理研究”、赵岩的“蒙、汉双语的公共危机事件网络舆情管理体系研究”、于凯的“基于线上-线下双层耦合网络的信息传播模型研究”等项目。此外,在综合应用类的研究项目中,也有不少舆情传播理论的研究,如刘继在国家自然科学基金项目“基于网络社群的网络舆情演化分析及突发事件预警机制研究”中,基于微博用户转发行为进行舆情信息传播模式分析,针对不同主题的微博信息传播,对网络舆情传播模式中单关键点型、多关键点型、链式型传播模式进行分析。
2. 网络舆情监控预警
当前民族地区网络舆情的监测管控是研究的热点和难点,关于民族地区网络舆情监管的机制和对策研究主要集中在新疆地区,其次是西藏和其他民族地区。这类主题的项目较多,包括刘继的“基于网络社群的网络舆情演化分析及突发事件预警机制研究”、钟振明的“西藏重大突发事件的舆情监控机制研究”、梁春阳的“少数民族地区应对与化解网络舆情危机策略研究”、张建华的“云计算时代民族地区网络舆情监控与疏导研究”、阿斯哈尔•吐尔逊的“民族地区突发事件的网络舆情研判及宏观预警研究”、刘利民的“基于网络流量分析的地区网络舆情监控系统研究”、普措才仁“基于内容的藏文网络不良舆情信息识别监测模型及其评价指标体系研究”等项目。
3. 网络舆情分析与应对策略
民族地区网络舆情分析与应对策略方面的研究是有关民族地区网络舆情研究的一个热点,包括王怀春的“涉疆问题在社会化媒体中的舆情现状与应对机制研究”、刘寒娥的“边疆民族地区舆情分析及媒体舆论引导机制研究”、张秀红的“新疆高校思想政治教育网络舆情研究”、张绍武的“新疆暴恐事件国际舆论倾向性分析”、邹东升的“移动互联时代西部边疆民族地区网络舆情引导与风险防控研究”等项目。此外,还有刘继在“基于网络社群的网络舆情演化分析及突发事件预警机制研究”项目中,对网络舆情分析的研究。网络舆情分析以微博内容分析为重点,以刘继的项目为例,该研究一方面面向舆情主题对微博用户网络影响力进行挖掘分析,对"腐败"和"城管"主题下的博主关系网络结构进行实证分析,对不同主题下影响力大的博主进行挖掘,以提高大数据背景下高价值微博用户的挖掘效率;另一方面,在暴恐主题下对微博用户特征及情感倾向性分析,基于“新疆暴恐”主题下的微博抽样数据,对微博用户的基本特征进行了统计描述,刻画了舆情情感倾向强度的动态变化,并构建有序多分类Logistic回归模型,研究了影响网民情感倾向性的主要因素。
三、 项目结项情况
根据当前国家自然科学基金和国家社科基金官方网站项目结项的查询结果来看,上述20个国家自然科学基金项目有5个已结项,分别是:2012年结项的“维吾尔语文本情感倾向性分析技术研究”(2009年立项);2013年结项的“维吾尔文不良信息过滤关键技术的研究”(2010年立项);2011年立项2015年结项的“多种语言文字环境下结合内容审计的网络舆情监测技术研究”、“维吾尔文WEB舆情挖掘的关键理论及技术研究”和“基于群体智能涌现的藏文网络舆情分析及突发事件预警机制研究”。上述16个国家社科基金项目有3个项目结项,分别是2014年结项的“西藏重大突发事件的舆情监控机制研究”(2012年立项);2016年结项的“少数民族地区应对与化解网络舆情危机策略研究”(2012年立项)和“民族地区突发事件的网络舆情研判及宏观预警研究”(2011年立项)。
上述结项项目在网络舆情文本信息处理技术与网络舆情理论等方面完成一批研究成果。举例如下:
艾斯卡尔•艾木都拉主持的“维吾尔文WEB舆情挖掘的关键理论及技术研究”课题,从维吾尔文语言文字特点出发,围绕网络舆情挖掘所涉及的关键理论和技术,开展了以下几个方面的探索性、创新性研究。研究了增量化采集和动态访问控制环境下的Web主动探测与智能采集方法,搭建了大规模分布式采集系统。建立了新老文字转换规则库,研究并实现了一种基于规则的新、老文(维吾尔语拉丁文转维吾尔语阿拉伯文)自动转换方法。针对维吾尔文传统分词方法的缺陷和不足,提出了语义分词的新思路并实现了相应的语义分词算法,以语义词作为特征并提出一种无监督特征选择方法选取特征子集来表示文本,从而明显提高了文本处理算法性能。建立了维吾尔文情感词典,研究了维吾尔文区分性关键词提取方法,并在此基础上实现了维吾尔文文本情感分类方法。根据维吾尔文命名实体结构特点,建立了维吾尔文命名实体库(人名:975660个,地名:193122个,组织机构名:142889个),还有首词库、中间词库和特征词库等,研究了基于规则和条件随机场的维吾尔地名、人名识别方法。实现了一种维吾尔文自动摘要提取算法。最终,搭建了一个维吾尔文网络舆情挖掘系统平台——《维吾尔文网络舆情监测预警系统》,已为新疆自治区相关部门提供网络舆情监测服务。
钟振明在其主持的国家社科基金项目“西藏重大突发事件的舆情监控机制研究”中,结合西藏突发事件的网络舆情监控现状与问题分析,提出遵循"突发事件的网络舆情监测与汇集→分析与评估→上报与预警→控制与引导"这一基本模式,通过更新网络舆情监控的观念意识、夯实网络舆情监控的基础保障、加强网络舆情监控的法治建设和强化网络舆情监控的部门协调等措施,以不断加强和完善西藏网络舆情监控工作。
梁春阳在其主持的国家社科基金项目“少数民族地区应对与化解网络舆情危机策略研究”中,针对少数民族地区网络舆情进行网络舆情危机特点分析,在民族网络舆情表现方面,提出少数民族地区网络舆情表现为产生舆情危机的多源性,除了来源于公共安全、社会安全、事故灾害、自然灾害等突发性事件外,还有历史、宗教和境外渗透等原因。网络舆情传播或参与主体的也表现为多元性,除了本国的网站、网民外,还经常有境外网站、网民的主动参与;除了有大量的以汉文为媒介的网站、网民外,还有以少数民族语言文字为媒介的网站、网民的主动参与等特点。在民族网络舆情危机的诉求表达特性方面,提出少数民族公众在网络舆情危机中体现的意愿、诉求、指向等态度与情绪,大都集中于表达利益、表达不满、行为动员三个方面。少数民族公众在网络上的利益追求与表达特点,主要反映在“相对剥夺感”在网络舆情中的显现或宣泄;表达不满是我国少数民族网络舆情表现之一,也就是说,制度外路径的选择,是少数民族民众表达不满的特点之一;少数民族网民的行为动员诉求表达的特殊性通常是非理性行为的实施。