全球第一款自媒体数据打假引擎,横空出世!
我本真诚,奈何世间套路重重
我跨过重重套路,却发现一山更比一山高
10月10日晚上,清博在公号上推出微信公众号异常评估工具《微信公众号异常指数》,称为“全球第一款自媒体数据打假引擎”,水军杀手。
大叔以为是啥高级货呢,经试验,操作也是十分的简单,只需在页面输入微信公众号名称或ID,就可出现“微信公众号异常评估”情况,包括异常率、头条平均阅读数和9月28日头条阅读数。
后台回复关键词:清博,可体验此工具。

大叔发现,清博评定某个自媒体是否有水军刷量的核心依据,就是9月28日的阅读量与之前的阅读量相比较,大背景大家都知道,因为28号那天微信做了升级,导致大部分的水军公司无法帮微信订阅号刷阅读量。所以,人们普遍认为,那天的阅读量才是最真实的。
不知道是为了“赚钱”,还是缓解服务器压力(大叔估计是后者),用户若要查看更具体的数据分析,则需向清博支付9.9元。大叔的自媒体虽然“异常率是0”,但为了写本文,大叔还是狠了狠心,花了9.9元,看到了一下具体的信息:包括WCI动态(微信传播力指数)、阅读数、总点赞数三个曲线图,和头条阅读变化率、篇均阅读变化率、日均阅读离散程度等三个百分比。

那么问题来了,这么一个小应用,真的能十分准确测出来自媒体的阅读数是否掺了水分?答案显然是否定的。
某不愿意透露姓名的业界人士表示,对于清博推出的这个工具持保留态度,表示其监测维度单一,按天的阅读数分析来体现水军程度显得简单粗暴而不够严谨,评判标准应该还包括文章内容、标题、粉丝数、粉丝活跃度等维度,数据监测也应该升级到效果监测,比如导流情况等,而在此时推出也有借势打知名度的嫌疑。
但大叔认为,清博借着“全球第一款自媒体数据打假引擎”打知名度,无可厚非,而且大叔注意到,包括大叔在内的很多自媒体都拿到了“异常率为0”的好成绩,当然,大家也都十分乐意转发到朋友圈和各个微信群里“炫耀”,好像在说:“虽然ZF给我的清白迟到了几天,但该来的还是来了,我是清白的!我没有刷!”还好,大叔克制住了。
来自清博官方的数据,超过10万个自媒体参与本次打假行动。
“全球第一款自媒体数据打假引擎”的计算逻辑是什么?清博加入数据分析阵营是有什么用意和想法呢?面对部分自媒体的质疑又如何回应的呢?
针对这些问题,大叔团队独家采访了清博大数据常务副总裁蔡幼林先生和清博研究院副院长向安玲女士。
大叔团队:听说是产品团队国庆加班推出的,是与国庆前微信自媒体阅读近乎“裸泳”事件有关吗?
蔡幼林:其实这个产品我们半年前就已经在PC端上线了,只是借由这次事件由PC端延伸到了移动端。
大叔团队:我们尝试输入了一些账号,大多的异常率都在0%,请问指数评估的依据是什么?监测推算和采样分析的方式是怎样的?
向安玲:基本上是通过三个方面,阅读数的下降幅度、阅读数的波动幅度和是否出现爆文,而爆文相当于“降噪因子”,会降低异常率。
另外,如果公号在当天未发文,会继续分析其发文频次。
大叔团队:详情中有个百分比数据是“日均阅读离散程度”,请问是如何计算的?正常区间在清博的大数据中是多少呢?
向安玲:离散程度就是波动性,是对前一个月的最高数据、最低数据和平均数据的综合评定。一般波动率<1%则基本属于异常。
大叔团队:现在很多平台比如新榜都有这个监测,清博也推出这样一个“不太讨好”工具是有什么想法吗?与其他的工具有什么不同呢?
蔡幼林:我们其实有两个目的,一个是想要帮助净化自媒体环境,有些号确实存在刷量比较严重的情况,导致市场失衡;另一个是给予信心,刷数据只是少数人的行为,据我们的数据统计,1800多万个账号中只有5%——10%的号在刷,所以不必太过悲观。
不同的话,其实每个工具的数据模型都是不同的。
大叔团队:在开发过程中有遇到什么技术难题吗?
蔡幼林:技术上没什么难题,只是过程中对于“如何判断异常是人为还是意外”难以界定,我们目前全网扫描1800多万个账号,从中选取59万个活跃账号进行具体监测分析,有2万个存在异常,但中间不可避免存在少数误伤。
目前的数据是以9月28日为基点,与前一个月的数据比对,这里面会有比如当天确实没有推送的情况,所以我们只是用科学的方式摆数据,而存在异常也并不一定就是造假,中间还是需要大家去综合自行判断。
所以我们还设置了“我有话说”的接口,用户可以进行举报或申诉,我们也会慢慢扩大监测范围,不断完善,尽可能的做到公正、客观、准确。
大叔团队:现在因为水军刷量情况,很多品牌的投放都终止了,您怎么看此事?
蔡幼林:新媒体的环境是日新月异的,不管形式如何变迁,原创内容都是重中之重的,从微博的用户变化,到微信的打击保护,市场是慢慢趋向成熟。而自媒体生态正在一个转折路口,营销界对自媒体失去信心,也更体现了大数据的重要性。
总结:
“上有政策,下有对策”一直是各个链条中斗智斗勇、技术升级、淘汰、变迁的筛选机制,需求产生供应也是不变的经济形态。目前,不止新媒体,广告投放、场景营销等等都在运用大数据进行效果评估,大数据的探索运用确是在用“事实”说话,但评判标准和公式算法却是因时、因事、因需求侧重不同而无法定论的,因此,数据分析工具带来的实效还需要大家一起沟通分享。
