「新五毛」的推文分析

通过对「新五毛」的账户信息以及关注情况,大概了解其规模和社交网络情况,平均来说他们的发推量不高,因此我直接抓取了这2581个账户的54737条推文(包括转推)来分析,看看能不能得到一些有趣的结果。

在推文分析之前,有一个有趣的结论可以和大家分享,在这2581个「新五毛」账户中,有接近1200 个昵称能在搜狐微博里面100%匹配,不知道是同一家营销公司在管理,或者是用爬虫抓出来的。查看了一下,匹配到的搜狐微博用户多数停用已经很久了。这个发现要感谢 @Arctosia

推文时间分布

首先看了下每日推文发送时间,看不出什么规律。再看推文的按月分布,如下图:

有三个明显的时间高峰,大概是3月初,6月初和9月初。考虑到推文有两种情况:鸡汤和五毛,所以将不同类别的推文分开统计,红色表示五毛推文,绿色表示鸡汤推文,我们可以得到如下直方图:

从这幅图我们大概可以看出,「新五毛」攻击最活跃的时候就是在6月初,之后只是保持一个大致稳定的发推频率,但是鸡汤推文的数目在9月之后显著的增加了。

可以列一个推数前十名的统计数据,对比之后就更明显了:

五毛推日期 数量 鸡汤推日期 数量


6-4 4726 9-1 4161
6-1 2127 9-2 3695
6-3 2051 9-7 3085
3-8 1415 9-3 2248
3-9 1375 9-9 2221
5-21 833 9-5 2111
5-20 617 9-4 2083
6-23 430 9-8 2070
7-22 422 6-12 1939

Read More

推特上有多少「新五毛」?

大家都知道,相对于微博来说,推特上不存在言论管制,但是这种事情怎么可以让他发生呢?那还不天下大乱?随时随地都要关心你的组织当然得把伟大的光芒投射到这一片「法外之地」,于是从很久以前开始,组织就会弄很多帐号来关心大家的思想动态。当然,有的负责听,有的负责说。不过之前的手段都很粗糙,特别是顶着一个蛋头,说一些连微博上的五毛都不好意思说的话,广大推友们迅速就能识别,要么拉黑要么举报,很快的这些帐号就消失了,也不知道组织设立这些帐号的成本有多大。当然,另一方面,如果只是以发推数目来计算工作量,而不是以「舆论导向」的结果来算的话,我觉得这些帐号还是完成任务了的。

很长一段时间都没有被这样的五毛帐号(我称之为「老五毛」)骚扰了,突然前几天,我发了一条

中纪委给老外解释”四风”:都是”胖子”干坏事:形式主义:一个干部模样的胖子被公章、文件包围;官僚主义:还是那个胖子坐在高椅上,另外一个瘦瘦的群众模样的人可怜地站在下面仰望他;享乐主义:胖子躺进酒杯里,脸喝得红扑扑;奢靡之风:摆满大餐的桌前,胖子大吃大喝——习总:尼玛

过会在推上突然就遭到了围攻,如下图:

Read More