未解决
此帖子已超过 5 年
Community Manager
•
7.3K 消息
0
1714
【转发】技术分析“赵本山20吨黄金”是怎么来的
原文出处:数据化管理微博 http://www.weibo.com/p/1001603792670748238527
近日“赵本山”被大家在微博刷屏了,一大波“赵本山被抓,家中搜出20吨黄金”的微博扑面而来。正好睡不着,于是本数据分析师开始工作了。
分析关键词
这样大的事件一定要用到新浪微博的搜索功能,不过我们需要先找出这条“新闻”(姑且叫新闻吧)的关键词:20吨、黄金、赵本山。赵本山当然是这三个词中的核心。
看关键词趋势
打开新浪微博指数查询页面(index.weibo.com),输入“赵本山”,首先出来的是这张30天趋势图。
不过由于微博指数的滞后,这张图是看不到27日的具体数据。我们需要看实时趋势,下图是关键词“赵本山”的24小时指数。
图中有4个地方数据突变:15:00,21:00,22:00,23:00。从这条新闻的持续发酵来看,15:00是这条新闻的起源显然是不可能的。
初步锁定21:00是该新闻的开始传播点。
微博源头是谁?
回到微博页面搜索“20吨+黄金+赵本山”,发现第一条微博是个只有几百个粉丝的草根在23:04发出来的,显然不是他。
考虑到谣言在传播过程中的多样性和变化性,我去掉关键词赵本山改搜索“20吨+黄金”,发现共有9748条微博,这样多的微博一条一条的去找源头是不可能的(新浪也不让你看50页后的搜索结果)。
结合上面提到的关键时间,我再次缩小搜索范围。我的秘诀是用微博高级搜索,一般人我不告诉他(今年的昆明火车站砍人事件我就是用这个方法搜出了来自现场的第一条微博的)。
秘诀如下图:
这样搜索出来的微博只有两条,其中一条明确的指出了新闻来源。
老沉是谁?原新浪网的总编辑,现在是小米公司副总裁。按我对老沉的了解,他应该不会去主动传播这样的新闻的,不过既然指向了他,我就去他的微博看看。
没有,没有这条微博,可能是删了,不过我找到一条相关的微博。
从而确定新闻源头,确实来自老沉。通过其他网友的截图,我找到了到时的微博(发出来的时间21:28,和我前面的判断一致)及10分钟后老沉的解释微博。
如何传播开来的?
如果你看过马尔科姆·格拉德威尔的《引爆点》这本书的话,一定记得流行三法则:人物法则、附着力因素法则和环境威力法则。三法则我理解就是关键人物、新闻价值、传播渠道。
这个新闻三个要素完全具备:关键人数老沉、新闻价值是20吨黄金(初期还不是赵本山)、传播渠道新浪微博。
20吨黄金不是新闻,但是在这个谣言就是遥遥领先的预言时代,老沉这16个字足够让别人浮想联翩的了。
由于这条微博被删,我看不到评论中大家的联想和演变过程,也就看不到是如何和赵本山扯上关系的,不过我能看到很多网友跑到赵本山最新一条微博下留言,大家也是闲的。
虽然老沉后了解释了这句话的来历,是最近上映的一部电影台词,可是在微博时代,三法则中的环境威力法则发挥了巨大的作用,微博对社会热点新闻的传播那是相当的病毒式的传播,何况赵本山最近本来就是舆论的中心。
病毒式传播怎样个恐怖的
放大24小时微博指数图给大家看。如果以20:00的指数为基数的话21:00-凌晨1:00这是个小时,“赵本山”这个关键词依次上涨了2倍、5倍、21倍、47倍(这个时段可是晚上0:00-1:00哦)。
23:00是一个飙升的时间窗口,各种微博大小号争相报道,至此这个乌龙事件彻底被舆论“坐实”了,赵本山和老沉躺枪。
哎,写了这么多,和我又有什么关系?还是洗洗睡吧。本文是讨论数据分析技术,不讨论赵本山在哪?赵本山怎么样了?这样的话题。请大家不要过度解读!
Yanhong1
1.6K 消息
0
2015年1月4日 05:00
看得有点晕
born_chen
2 Intern
2 Intern
•
1.8K 消息
0
2015年1月4日 06:00
确实,这分析逻辑。哎。
liulei_it
2 Intern
2 Intern
•
3.2K 消息
0
2015年1月4日 17:00
贝叶斯理论?
DELL-Leo
Community Manager
Community Manager
•
7.3K 消息
0
2015年1月4日 17:00
贝叶斯理论是怎么回事?求科普~