我关注41个HR公众号,爬取了8万多篇人力资源文章,做了个简单的分析


最近在找工作,和一些HR有一些沟通,而且在上一份工作,我们主要的目标用户群体是HR,所以工作期间也和一些HR有打交道,不算了解HR,但是也算有所接触,所以关于HR的阅读,我做了一些事情。

我关注了41个HR行业的微信公众号,更换了10多个IP,采集了88745条HR行业的微信文章,做了一些简单的数据统计。


我关注41个HR公众号,爬取了8万多篇人力资源文章,做了个简单的分析排名第一的环球人力资源智库还有另外一个公众号叫每天学点HR,排第11位,这家公司的小编的午饭应该多加鸡腿了,毕竟你是最勤奋的。



我关注41个HR公众号,爬取了8万多篇人力资源文章,做了个简单的分析人力资源分享汇的小编也非常棒,遥遥领先,甩第二名那么多。


我关注41个HR公众号,爬取了8万多篇人力资源文章,做了个简单的分析人力资源数据分析的文章总数虽然只有233篇,但是原创度高达57.85%,这个小编算是非常良心了,而且这是一个个人号,非常值得鼓励。


各大平台都在鼓励原创的时候,HR行业的原创度并不是很高,在88745片文章中只有8%被标记为了原创文章,实在是有点低。


我关注41个HR公众号,爬取了8万多篇人力资源文章,做了个简单的分析

而这个表就腻害了,这里统计了分别被重复发布5-11次的文章数,也就是说,有1405篇文章被重复发布了5次,有48篇文章被重复发布了11次,选择统计到11次是因为没有文章被重复了12次~~~


那小编们爱在哪些时间推送文章呢?

我关注41个HR公众号,爬取了8万多篇人力资源文章,做了个简单的分析

从图表来看,大部分的文章都是在早上上班路上的这段时间发布的,再就是中午休息和晚上下班时间比较多。


那么这些公众号都在关注什么内容呢?

我关注41个HR公众号,爬取了8万多篇人力资源文章,做了个简单的分析

这张图表统计的是这些关键词在标题中出现的次数,一般标题也都是文章主要想表达的内容,大部分小编还是想给大家看一些招聘和员工关系方面的内容。


最开始本来想统计一下文章内容里出现词频最高的关键词,我尝试用我所知道的分词方法去做分词和词频统计,奈何电脑带不动,就曲线从标题中获取了一些数据。


本次数据全部来自于微信公众号,数据截止时间是2019年5月8日,图表制作工具是BDP,这里没有统计每一篇文章的阅读数,实在是因为爬这个数据太耗时间了,不过好在用到了一些前段时间学的SQL。


除了统计一些公众号信息,我还做了一个微信小程序,HRead,主要是让大家能够更集中的去阅读HR相关文章。


我关注41个HR公众号,爬取了8万多篇人力资源文章,做了个简单的分析



再就是,我在找产品运营方面的工作,希望被勾搭。


email:hi@zhangleilei.cn


题图来自 unsplash

发表评论

电子邮件地址不会被公开。 必填项已用*标注