优化推广

从舆论到舆情:舆情的概念与内涵

网站编辑:颐搜网 | 发表时间:2023-12-17

舆论的概念和内涵

(一)从舆论到舆论:舆论概念和内涵的演变。 在所有舆论概念中,大家比较认同孟小平对舆论的定义。 他认为:“舆论是公众对自己所关心的人、事件、现象、问题和观念的信念、态度和意见的总和,并且具有一定程度的一致性。 的性质、强度和持续性,并对相关事件的发展产生影响。”①这一概念考虑了舆论主体(公众)、舆论客体(人物、事件、现象、问题和观念)。关注)和舆论本体(公众的信念、态度和意见),还强调舆论的一致性、持久性和强度等,是一个相对完整、严格的舆论概念。

网络时代到来后,舆论的概念逐渐弱化,取而代之的是“舆论”。 “舆论”和“舆论”只有一字之差。 舆论中的“情绪”,首先强调的是网络时代舆论变化的速度。 “情”字凸显舆论正在发生变化; 其次,它强调了网络时代的舆论具有很大的情感特征,即有很多的情绪和情绪掺杂其中。 网络短文本、口语表达带来的舆论表达最大的变化,就是情感、感性成分的增加。 因此,“情”的第二个含义是情感或情感。

据此,舆论是指一定社会空间和历史时期内社会中介事物(可以是人、物、价值观念、制度、规范)的发生、发展和变化。 作为舆论主体,公众对有关社会事务的集体情感、愿望、态度和意见的总和。 由于互联网是舆论表达的主要平台,舆论必须通过言论表达。

(二)舆情分类。 目前,舆情分类较为多样。 按内容可分为政务舆情、经济舆情、社会舆情、民生舆情、文化体育舆情等; 按涉及主体可分为公共权力舆情、企业舆情、事业单位舆情、个人舆情等; 根据预警级别,可分为红色舆情、橙色舆情、黄色舆情和绿色舆情等; 按发生范围可分为国际舆情、国家舆情、省级舆情、城市舆情、县以下舆情等; 可以按照产地来划分。 为媒体宣传舆论,为网民发布突发新闻。 在日常舆情分析工作中,中国人民大学舆情研究所一般将舆情按照内容分为社会民生、反腐廉洁、文化教育、警务法制、社会治安、时事和政治、灾难和事故、公司财务和公共卫生。 和其他类别。 只要存在内部一致性,各种舆论划分的范围就不重叠,可以相互排斥、面面俱到。

舆情软件系统平台:

舆情大样本定向分析法

目前关于舆情分析的研究方法有很多,但可以概括为以下两个基本类别。 一是大样本定向分析,利用大型舆情软件系统平台进行; 另一种是小样本多元分析,即根据最新的研究方法,从当地样本中收集数据并进行分析。

(一)舆情软件系统平台基本原理。 近年来,舆情监测方式层出不穷,但舆情监测的底层方式并没有发生根本性的改变,即通过网络爬虫程序实现数据采集。 基本原则如下:一是构建需要监控的样本库(包括微博、微信公众号、论坛、贴吧、网站等)作为监控数据源; 其次,通过网络爬虫抓取数据并下载到本地服务器; 第三,在本地服务器上进行数据的去重和聚合; 第四,“清洗过”的数据以图像等方式智能直观地呈现。 舆情监控软件监控微博中的数据,需要向新浪申请付费API(应用程序编程接口)才可以访问和抓取数据(否则会对网络爬虫关闭)。 舆情监测软件可以24/7实时监控和采集互联网信息,对获取的信息进行全面检索和自动去重,进行舆情主题演变分析、时间趋势分析、话题传播分析。 目前国内比较大的舆情监测软件服务商有Torsi、方正舆情、古尼舆情、美亚舆情等。

(二)舆情软件系统平台发展趋势。 近两年出现了一个新的趋势,那就是从舆情软件的开发转向云平台的建设。 舆情监测主要基于单一监测软件。 软件产品放置在客户本地服务器上,由软件供应商提供后续的软件升级和支持服务。 这种服务模式有一定的缺点。 由于各自独立工作,服务器相对分散,数据采集和分析也相对分散,不利于数据的大规模处理和集约化输出。 随着大数据和云计算时代的到来,软件服务逐渐被构建云数据平台所取代。 客户可以通过网页或客户端远程访问,并可以自定义具有一定权限的关键词,以捕获和可视化舆情数据。 呈现数据结果。

(三)舆情软件系统平台缺陷。 首先,舆情监测的有效性和可靠性难以验证。 当前舆情监测的最大问题是无法展现自身的有效性。 每个公司都有自己的“黑匣子”,相对不透明。 不同的方法和算法必然会导致监控出现问题。 对于结果的偏差很难下定论,仍然存在“盲人摸象”的风险; 其次,数据源的多少在一定程度上决定了舆情监测的准确性。 目前舆情监测采用样本数据库作为数据检索源。 它不收集基于全网的舆情信息。 事实上,这只是样本量较大的部分数据。 数据来源不完整可能会导致重要信息监测的缺失,最终影响数据监测。 三是在重复数据删除和聚合过程中,计算机仍然无法替代人工。 目前舆情监测软件最大的区别在于后台的数据处理能力。 然而,计算机尚无法进行情绪辨别、影响力评估等高级信息处理。 完全替代手工作业; 第四,网络爬虫本身的弊端也在不断显现,主要是关系数据越来越重要,而爬虫爬取的数据主要是碎片化的信息数据,关系数据往往被忽视。 另外,越来越多的一些网站对爬虫抱有不友好的态度。 一旦发现,他们会直接封锁端口。 而且,越来越多的微信、豆瓣等社交网站没有开放自己的数据抓取端口,导致这些新兴社交平台的抓取变得困难。 数据。

舆情小样本多元分析法

从舆论到舆情:舆情的概念与内涵

在现实舆情分析研究中,不可能完全依赖舆情软件平台进行数据抓取。 一般情况下,研究人员根据研究对象的情况进行必要的抽样,使用R和R语言捕获数据,并利用各种方法进行舆情分析。 。 综上所述,目前小样本分析方法主要有以下三种:

(1)基于关系的分析:社交网络分析(SNA)。 随着社交平台的兴起,“关系”逐渐成为虚拟网络空间的基础资源和底层结构。 “没有一个自我是一座孤岛。 每个人都存在于一个关系网络中,而这个网络比过去任何东西都要大。 时代变得更加复杂和流动”②。 舆情信息是基于社交网络传播的,社交网络分析方法是描述和可视化社交网络的重要工具。 近年来,社交网络分析已成为舆情分析的重要工具和方法。

此外,传统民意调查方法的局限性进一步显现,正如弗里曼指出的,“过去30年,实证社会研究一直以抽样调查为主。 然而,正如人们经常指出的那样,调查是一种社会学绞肉机,它将个体从其社会情境中提取出来,并确保研究对象之间不存在任何联系。”③舆情抽样调查有一个基本前提——人们的“ “属性数据”将决定人们的言论和行为。然而,在关系网络兴起的今天,人们的言论和行为越来越受到其社会关系、社会阶层等“关系数据”的影响。社交网络分析是一种测量和考察社会系统中各部分(节点)的特征和关系(联系),将其以网络的形式表达出来,进而分析其关系的模式和特征的一套理论、方法和方法。描述和衡量行为者之间的关系或分析流经这些关系的各种有形或无形事物,如信息、资源等的方法,主要包括图论、社会计量学和代数方法。 图论适合描述小型传播群体的核心关系和凝聚力; 社会计量学适合研究结构等价和“块模型”关系; 代数方法适合分析角色和职位关系。 研究视角大致可以分为两种:关系取向和立场取向。 关系取向主要研究社会行为体的社会联系——密度、中介、强度、对称性、规模等; 位置取向主要关注社会行为者之间的社会关系格局,以及不同行为个体的结构状态。 是否与上述一致,强调用“结构对等”来理解人类行为。 社交网络分析目前主要使用Gephi、 、 Pajek、 、 、 等软件,其中Gephi、 等最为常用。

(2)基于文本的分析:词频和语义网络分析。 舆情是由各类文字组成的信息文本。 文本中的单词数量以及单词之间的联系可以凸显信息文本的价值观、语义结构和社会需求。 因此,近年来,不少研究者将词频分析、词语和词语之间的关系网络分析等方法引入舆情分析中。

1.词频分析法。 分词是文本挖掘的基础。 成功的对输入文本进行中文分词,可以达到计算机自动识别句子含义的效果。 词频分析是对舆情文本中重要词语出现的次数进行统计和分析。 它是舆情文本语义挖掘的重要手段,也是文献计量学中传统且有代表性的内容分析方法。 基本原理是通过词语出现频率的变化来判断舆情热点及其变化趋势。 至少在认知层面上,某个关键词被提及的次数越多,表达者的诉求就越集中、越紧迫。 词频分析可以实现微博微博聊天分析、新闻文本分析、分词、词频统计、英语词频统计、流量分析、聚类分析等一系列文本分析。

词频分析的基本步骤是首先对文本进行分词。 分词的基本前提是必须有一个相对完整的“词典”。 “词典”的分词容量越大,分词的准确度越高; 分词后,计算出关键词的个数,即词频。 目前词频分析工具越来越多,尤其是一些在线工具。 国外比较有名的有图阅、按钮词云、腾讯文智、新邦词云词频分析、Excel词频分析工具、易词云等。 比较著名的在线工具有、、、等。近年来,随着各种编程语言的出现,利用语言进行词频计算的研究也越来越多。 一般使用jieba包中的中文分词工具()对对象文本进行分词和词频计算。

2.社会语义网。 社交语义网络只是一种说法,它主要通过社交网络分析工具将各种高频词连接起来,形成高频词关系网络,进而推测话语文本的主要表达逻辑和焦点。 具体来说,有以下几种不同的分析方法和手段。

首先是共词分析。 共词分析的基本原理是通过统计一组术语在文本中一起出现的次数来对单词进行聚类,反映这些术语之间的强相关性。 弱,然后分析这些术语所反映的文本的主题结构。 一般来说,术语对在同一文本中出现的次数越多,则该术语对之间的关​​系越密切。 术语对在大量文档中出现的次数越多,说明术语对与术语对之间的关​​系越紧密。 文本之间的相关性越强,共词分析使用一组结构图来有效地展示术语之间的相关性。 一般来说,点的大小代表词频。 节点越大,词频越高。 连接的粗细表示两个单词之间共现的次数。 同时出现的次数越多,联系就越紧密。

二是聚类分析。 其基本思想是根据变量的相似程度将变量归属于同一组,“物以类聚,人以群分”,这是共词分析中常用的统计方法。 根据一些可以衡量多个变量指标之间相似性的统计方法,作为分类的依据,可以将不同相似程度的变量聚合到不同的类别中,然后以谱系图的形式表达它们的密切关系。 。 在不同类别的聚合中,同一类别内变量之间的相似度越高越好,不同类别之间变量之间的相似度越低越好。 高频关键词聚类分析是对文本中高频关键词之间的密切关系进行分析,反映高频关键词相似性和不相似性的分析图。 通过地图,可以进一步挖掘作者意图、社会语义等深层次信息。

三是词语多维尺度分析。 它主要通过测量物体之间的距离来展示数据结构,利用物体在低维空间中的具体位置。 通过观察这些物体之间的平面距离,我们可以了解它们之间的相似性。 通过多维尺度分析,研究人员可以帮助研究人员发现数据中的深层结构,而软件绘制的平面图可以清晰地揭示数据中隐藏的联系。 在多维尺度分析的结果中,分析对象呈现出点分布的特征。 图中点之间的距离表示它们之间的相似程度。 同时,相似度高、相关性高的对象被聚集到A类中,处于中间位置的对象,代表该对象的中心位置。

(3)基于情感的分析:情感计算。 情感计算是计算主体内心对某一对象的主观存在的喜欢和厌恶倾向的方法。 主要从情绪倾向方向和情绪倾向程度两个方面来衡量。 情绪倾向的方向也称为情绪极性,可以理解为用户对某个对象所表达的观点的态度是支持、反对还是中性,通常称为积极情绪、消极情绪或中性情绪; 情感倾向是指主体对客体的情感强度。 不同层次的情感往往通过不同的情感词语或情感语气来体现。 为了区分情感程度的差异,一般通过给每个情感词赋予不同的权重来体现。

目前情感计算方法主要分为两类:一类是基于情感词典的;一类是基于情感词典的。 另一种是基于机器学习的,比如基于大规模语料库的机器学习。 前者需要使用带注释的情感词典。 有很多英文词典。 对于中文来说,主要有中国知网(CNKI)和台湾大学编译发布的NTUSD两种情感词典,以及哈尔滨工业大学信息检索实验室开源的“同义词”。 “词林”可以用来扩展情感词典。基于机器学习的方法需要大量人工标注的语料作为训练集,通过提取文本特征并构建分类器来实现情感分类。文本情感分析的分析粒度可以可以是单词、句子、段落或章节。

从舆论到舆情:舆情的概念与内涵

舆情分析方法的发展趋势

(1)“文本+关系+情感”多元耦合分析。 社交平台上的文字通常都是短文本形式,用户发帖随意性大,语言标准化程度很低。 措辞和语法常常违反标准语言规范,导致高维、稀疏、高维的文本表示。 噪声等特性。 这使得传统的文本分析方法很难直接应用。 如何对此类社交网络短文本进行有效建模和分析,是未来舆情监测的一个难点和重要方向。 另外,社交平台用户通过相互关注建立的网络关系就是典型的社交网络。 这种社交网络不仅是用户社会关系和兴趣偏好的反映,也是舆论信息传播的渠道。 如何将社交平台的文本分析与用户社交关系分析有机结合起来,进行语义分析和网络结构分析,是未来舆情分析中不可避免的问题。

(2)“地理位置+社交网络”综合研判。 地理位置数据具有多源、异构、高维、动态等特点。 这些特点使得地理位置大数据模型多变、复杂,使得各种信息(特别是物理空间信息和社会空间信息)的关联映射成为必须。 该领域的相关工作主要包括实体提取、主题建模、基于位置信息的搜索等。地理位置大数据信息经过关联映射和融合阶段后,需要进行有效的表征,以进一步高效的群体智能认知和实际应用分析。 ()作为整合多源异构大数据的有效表示方法也受到了广泛的关注。 鉴于深度学习和张量在大数据表示方面的优异性能,近年来提出了一些基于张量的深度学习方法,如机、张量循环神经网络、深度张量神经网络等。

(3)“动态+实时”结构演化分析。 社会关系网络结构是舆论信息传播的载体。 然而,由于社会关系网络中个体的不断进出,使得社会关系网络高度动态演化,直接影响和制约着舆情信息的传播过程。 大量研究表明,社会关系网络结构的动态演化是由结构的微观变化决定的。 对群体行为本质规律的认识,离不开对社会关系网络结构动态演化微观机制的深入认识。 对微观结构演化缺乏认识,割裂了社会网络结构与信息传播的动态关系,无法更好地理解群体行为的本质,​​实现精准的舆情预警。 因此,建立社会关系结构的微观动力学模型,进而动态地把握和演化其结构,是未来舆情预警研究的关键。

点击下方空白处可查看笔记

笔记:

①孟小平:《揭开公共关系的奥秘——舆论学》[M],中国新闻出版社1989年版,第8-9页

②,J.The,出版社,1984 年,第 131 页

③刘军:《社会网络分析导论》[M],社会科学文献出版社2004年版,第34-35页

(作者为中国人民大学新闻学院副教授、中国人民大学新闻与社会发展研究中心副主任)

【文章摘自《青年记者》7月号】图片来自网络。

TAG标签:中国舆情分析 

声明:本文来自投稿,不代表颐搜网立场,如若转载,请注明出处:http://www.tpsem.cn/yhtg/show1341.html 若本站的内容无意侵犯了贵司版权,请给我们来信,我们会及时处理和回复。