Recent Posts

理解HITS算法

9 minute read

Hits算法通过迭代的方法来计算权威度a和导航度h。其中: 1. 节点i的权威度$a_i$利用指向它的节点的在上一轮的导航度hlast和链接的权重来决定。 2. 节点i的导航度$h_i$利用指向它指向的节点在这一轮的权威度$a_i$和链接的权重来决定。

解决python读取文本数据中的encoding问题

1 minute read

在使用python读取一些数据的实际应用当中,我们总会遇到各各种各样的encoding的问题,一般会使用utf8,中文常用的是gb18030和gbk。有时候这种问题非常令人头痛,有没有一种终极的解决方案?采用二进制的方法就可以读取,然后需要将二进制的字符串进行相应的decode,并忽略出错的地方。

2017数据新闻比赛

less than 1 minute read

由武汉大学媒体发展研究中心、财新网和中美教育基金联合主办、镝次元数据新闻研究中心承办的第三届数据新闻比赛现在开始接受报名。本次大赛将通过奖励最出色的数据新闻报道或数据研究报告来促进中国数据新闻行业和专业人才培养的发展。

VERSTEHEN FOR SOCIOLOGY: COMMENT ON WATTS

44 minute read

We seek only to demonstrate that his observations do not imply that the pursuit of verstehen is a diversion for the field. To the contrary, we argue that the...

社会传染动力学:阈值模型及其扩展

less than 1 minute read

本文回顾了社会传染的经典模型之一阈值模型的相关内容。并且根据近年来在线服务产品采纳行为传播的实证研究讨论了阈值模型的局限性。在此基础上,介绍了一个新的模型。该模型在传统的阈值模型中引入两个新的机制,从而成功地解释了现实生活中社会传播的现象。

Computational Journalism

21 minute read

Journalists look for the unusual handful of individual items that might point toward a news story or an emerging narrative thread.