「新五毛」的推文分析

通过对「新五毛」的账户信息以及关注情况,大概了解其规模和社交网络情况,平均来说他们的发推量不高,因此我直接抓取了这2581个账户的54737条推文(包括转推)来分析,看看能不能得到一些有趣的结果。

在推文分析之前,有一个有趣的结论可以和大家分享,在这2581个「新五毛」账户中,有接近1200 个昵称能在搜狐微博里面100%匹配,不知道是同一家营销公司在管理,或者是用爬虫抓出来的。查看了一下,匹配到的搜狐微博用户多数停用已经很久了。这个发现要感谢 @Arctosia

推文时间分布

首先看了下每日推文发送时间,看不出什么规律。再看推文的按月分布,如下图:

有三个明显的时间高峰,大概是3月初,6月初和9月初。考虑到推文有两种情况:鸡汤和五毛,所以将不同类别的推文分开统计,红色表示五毛推文,绿色表示鸡汤推文,我们可以得到如下直方图:

从这幅图我们大概可以看出,「新五毛」攻击最活跃的时候就是在6月初,之后只是保持一个大致稳定的发推频率,但是鸡汤推文的数目在9月之后显著的增加了。

可以列一个推数前十名的统计数据,对比之后就更明显了:

五毛推日期 数量 鸡汤推日期 数量


6-4 4726 9-1 4161
6-1 2127 9-2 3695
6-3 2051 9-7 3085
3-8 1415 9-3 2248
3-9 1375 9-9 2221
5-21 833 9-5 2111
5-20 617 9-4 2083
6-23 430 9-8 2070
7-22 422 6-12 1939

Read More

推特上有多少「新五毛」?

大家都知道,相对于微博来说,推特上不存在言论管制,但是这种事情怎么可以让他发生呢?那还不天下大乱?随时随地都要关心你的组织当然得把伟大的光芒投射到这一片「法外之地」,于是从很久以前开始,组织就会弄很多帐号来关心大家的思想动态。当然,有的负责听,有的负责说。不过之前的手段都很粗糙,特别是顶着一个蛋头,说一些连微博上的五毛都不好意思说的话,广大推友们迅速就能识别,要么拉黑要么举报,很快的这些帐号就消失了,也不知道组织设立这些帐号的成本有多大。当然,另一方面,如果只是以发推数目来计算工作量,而不是以「舆论导向」的结果来算的话,我觉得这些帐号还是完成任务了的。

很长一段时间都没有被这样的五毛帐号(我称之为「老五毛」)骚扰了,突然前几天,我发了一条

中纪委给老外解释”四风”:都是”胖子”干坏事:形式主义:一个干部模样的胖子被公章、文件包围;官僚主义:还是那个胖子坐在高椅上,另外一个瘦瘦的群众模样的人可怜地站在下面仰望他;享乐主义:胖子躺进酒杯里,脸喝得红扑扑;奢靡之风:摆满大餐的桌前,胖子大吃大喝——习总:尼玛

过会在推上突然就遭到了围攻,如下图:

Read More

RStudio使用Knitr遇到的问题

最近正在读Advanced R这本书,作者非常慷慨的的在github上提供了书的源代码,正好我就学习一下怎么样用Rmarkdown来记笔记。

我的Windows台式机和MBP上都有RStudio,但是两者都不是装好了knitr包就能用的,其中遇到了好几个奇怪的问题,就在这里记录一下

Windows

Windows 上面安装的是texlive 2013版本,平时使用的时候没什么问题,但是knitr编译pdf始终显示article.cls' not found, 我干脆重新安装了一个texlive 2014,然后升级RStudio以及和knitr相关的包到最新版本。问题就这么解决了。

Mac

Mac上的texlive版本就是2014,不知道为什么RStudio总是提示'TeX installation not detected', 在RStudio的网站支持里面相关问题只有这篇提供了一个解决方法,就是在/usr/bin里面建立三个符号链接

1
2
3
sudo ln -s /usr/texbin/pdflatex /usr/bin/pdflatex
sudo ln -s /usr/texbin/xdvipdfmx /usr/bin/xdvipdfmx
sudo ln -s /usr/texbin/xelatex /usr/bin/xelatex

然后RStudio就能检测到TeX,于是能编译出PDF文件了,不过怎么弄中文我还没明白。

说来也怪,明明我的PATH里面就有/usr/textbin/,但是RStudio死活找不到这几个命令的位置。

另外,OSX默认长按某键的默认是出现声调变体,在RStudio的vim模式里面,这会导致默认英文输入法里面长按j/k无法上下移动游标,解决方法是在终端里面输入(注意大小写)

1
defaults write -g ApplePressAndHoldEnabled -bool false

然后重启即可。

knitr真是一个强大的包,慢慢琢磨怎么用吧