这几天,一个公众号的小编找到了我,提出希望转载我写的一篇关于微信公众平台阅读数分析的文章。那篇文章大概是一年半之前写的了,名字叫做《微信阅读数和什么有关?——我的微信公众平台数据分析》。今天,我又重新看了一遍当时写的文章,对比着微信后台的数据,惊讶地发现,当时回归所得到的结果可能是错误的。
2015年1月的时候,我在本公众号上曾发过这篇文章的1000字左右非常简略的版本,不过后来补充了很多内容,包括通过工具变量尝试做进一步分析,就没有再往微信上发,只是放在了博客上。当时得到的回归结果是:文章在朋友圈的转发1次,大概可以增加10人阅读;而关注人数增加5人,才能带1人阅读量的增加。最后文章表示大概支持2/8分布结论,也即80%的阅读量来源于微信朋友圈。
当时统计用的是2014年12月及之前近一年的数据,离现在的确已经是比较长的一段时间了,而在这段时间里微信平台也做了很多变化。最重要的是,当时微信后台还不支持图文来源分析,而现在微信后台的数据分析已经详细了非常多,已经支持了公众号的阅读来源分析。于是今天,当我仔细去看微信后台提供的数据来源的时候,惊讶的发现一年半前,我做回归分析得到的结论是错误的。
当时写文章回归分析的数据,大概是选取自2014年1月至2015年1月。在微信后台的图文分析页中,我截取了同时间段的微信提供的阅读来源分析,发现在几乎同样一段时间,微信后台显示83%的阅读来源于“会话”,而朋友圈的阅读仅占13%。(“会话”是指什么?我在网上查到的解释是:指通过你推送的消息(会话窗口)查看到你的内容,复制链接发送给好友等等。)
2014年1月-2015年1月 我的微信公众号后台图文页阅读来源分析
这和当时得出的结论,也就是“80%的阅读量来源于朋友圈”简直背道而驰。接着我也看了一下近期数据,选取的时间范围从一年变成两个月。能够看出情况其实差不多,62%的阅读来源于”公众号会话”,而从朋友圈点击进入阅读的比例只有14%。
2016年3月-5月 我的微信公众号后台图文页阅读来源分析
一年半之前回归数据还支持“80%的阅读量来源于朋友圈”,并因此说明“好的内容是最重要的”。而一年半后的今天,从微信后台却看到,“来源于朋友圈的阅读量还不到15%”。这么以来,得到的结论就完全不一样了,我想能得出的结论是:与阅读数相关性最密切的不是文章质量,而是公众号关注人数。
这真是一个值得进一步探讨的问题。一年半前,我的统计方法哪里出了问题,或者是分析的哪个步骤犯了重大的逻辑错误,让结论之间的差距这么大?
我想本文先提出一个简单的问题,我这段时间也会想一下可能的原因是什么。很惊奇的一件事情是,这篇文章放在自己的博客上的一年多时间,给页面导了好多流量。这在Google Analytics上看的不是很明显,因为Organic Search的关键词大多都是(not provided),但是看一下Alexa上网页关键词分析就比较清楚了。搜索我的博客地址,能看到Search Traffic大部分关键词搜索都贡献给了这篇文章。
这也让我很郁闷,很多访客特地搜索看到我写的这篇文章。而这篇为引流做出了很大贡献的文章,结论却可能错的那么离谱……