Posts by Category

Jekyll

Welcome to Jekyll, Markdown, and Atom!

2 minute read

这个网站使用Jekyll构建。Check out the [Jekyll docs][jekyll-docs] for more info on how to get the most out of Jekyll. File all bugs/feature requests at [Jekyll’s GitHu...

Python

真实熵与人类行为可预测性

3 minute read

在Limits of Predictability in Human Mobility一文(Song, 2010, Science)当中,Song等人提出人类移动行为的可预测性问题。强调了采用香农熵或随机熵不能捕捉到移动位置的时间序列特点,主张采用一种真实熵(the actual entropy)的测量方式,表示...

algorithm

使用powerlaw拟合重尾分布

2 minute read

幂律分布的存在非常广泛, 对于很多科学研究问题具有重要意义。但是,因为幂律分布的长尾具有很大的波动,因而确定长尾的范围尤为复杂。最小二乘方法估计幂律分布会有很大的误差,即使没有误差,也并未能确定这一分布是否幂律分布,因为没有同其他的分布的形式做比较,比如指数、对数正态、截尾的幂律。Clauset等人2009年发表...

理解HITS算法

9 minute read

Hits算法通过迭代的方法来计算权威度a和导航度h。其中: 1. 节点i的权威度$a_i$利用指向它的节点的在上一轮的导航度hlast和链接的权重来决定。 2. 节点i的导航度$h_i$利用指向它指向的节点在这一轮的权威度$a_i$和链接的权重来决定。

css

model

理解人类个体移动的模式

3 minute read

与列维飞行和随机游走模型预测相反,人类的实际移动轨迹显示出高度的时空规律性,个体特征可以用一个与时间无关的特征移动距离和一个优先返回概率来刻画。在校正行进距离的差异和每个轨迹固有的各向异性之后,个体行进模式转变成单个空间概率分布,这说明尽管他们的旅行历史具有多样性,人类的移动轨迹遵循简单的可再现模式。

network

使用R模拟网络扩散

2 minute read

与普通的扩散研究不同,网络扩散开始考虑网络结构对于扩散过程的影响。

探寻社交网络中的关系: 统计网络模型初探

9 minute read

在上一章当中,我们对于网络的基本知识进行了介绍,这些知识构建起了网络科学的基础,同时也孕育着巨大的潜能。社会科学追求理论的建构,但疏于思考理论层次的丰富性。以社会学为例,一度在宏大理论和抽象实证主义之间摇摆(参见米尔斯所著《社会学的想象力》)。大数据时代的到来,再一次使得少数人开始对理论的认识产生动摇,以为只要把...

python

解决python读取文本数据中的encoding问题

1 minute read

在使用python读取一些数据的实际应用当中,我们总会遇到各各种各样的encoding的问题,一般会使用utf8,中文常用的是gb18030和gbk。有时候这种问题非常令人头痛,有没有一种终极的解决方案?采用二进制的方法就可以读取,然后需要将二进制的字符串进行相应的decode,并忽略出错的地方。

12行Python代码回复微信拜年

less than 1 minute read

今天上午在朋友圈读到了《12行Python代码,自在随心应付微信拜年群发》一文,非常简单,主要是借助于两个python的包 itchat和pillow,可以使用pip安装。

《数字媒体阅读报告》

从概念到真实:SNS的形式蜕变

less than 1 minute read

本文载于《数字媒体阅读报告》。本文是作者从技术和资本角度对于SNS浪潮的反思。其中部分内容取自作者硕士毕业论文,虽然名为《正在爆发的互联网革命》一书的读书笔记,但并不限于此。

传播网络

小世界网络的输运效率

1 minute read

Latora(2001)的主要贡献 对于小世界网络的描述,可以简化为efficiency(记作E)一个变量即可,且efficiency本身有其物理意义。efficiency衡量了网络信息交换的效率。

在线扩散的结构性病毒特征

1 minute read

本文以《The Structural Virality of Online Diffusion》一文为基础,介绍了The Structural Virality在当下在线信息扩散中的特点。

网络增长动力学:BA模型

1 minute read

在 1999的 一篇文章里, Barabasi 和 Albert 提出了网络增长的优先链接(preferential attachment)模型.他们假设新节点每次携带常数m条边,且每条边链接到老节点的概率与老节点的度成正比。为了获得度分布的解析式,他们在论文原文中用的是平均场方法(mean-field anal...

可视化

Python中的统计可视化库Seaborn

less than 1 minute read

本文主要介绍使用seaborn可视化单变量、可视化双变量、可视化多对关系、可视化线性关系、绘制函数、适应各种模型、控制图片大小和格式、分类数据画图等内容。

使用ggplot2可视化多主体建模结果

less than 1 minute read

本文将介绍如何使用R软件中的ggplot2展示不同参数条件下多主体建模的数据,主要包括数据读取、数据清洗和数据可视化三个环节。

数据新闻

2017数据新闻比赛

less than 1 minute read

由武汉大学媒体发展研究中心、财新网和中美教育基金联合主办、镝次元数据新闻研究中心承办的第三届数据新闻比赛现在开始接受报名。本次大赛将通过奖励最出色的数据新闻报道或数据研究报告来促进中国数据新闻行业和专业人才培养的发展。

恐怖袭击距离中国有多远?

less than 1 minute read

1970年至1990年20年间,东德的恐怖袭击事件一直保持着低水平的平稳趋势,但在1990年东西德统一后,德国的恐怖袭击事件激增。而前苏联在这20年间,国内恐怖袭击事件一直保持着递增的平稳趋势,1989年苏联解体,恐怖袭击事件在1990年突然上升,虽略有波动,但一直稳健增长。

文本挖掘

模型算法

PageRank算法浅介

1 minute read

一个页面的“得票数”由所有链向它的页面的重要性来决定,到一个页面的超链接相当于对该页投一票。一个页面的PageRank是由所有链向它的页面(“链入页面”)的重要性经过递归算法得到的。

社会网络

网络残缺度:共同好友间可否两步到达?

less than 1 minute read

网络是由节点和关系构成的,而对于关系的描述是社会网络的关键。我们已经知道对于节点的网络特性可以从中心度、近度、介度、特征度(eigenvalue centrality)等方式描述。那么对于关系呢?最简单的就是直接关系的强度了。

计算社会科学

VERSTEHEN FOR SOCIOLOGY: COMMENT ON WATTS

44 minute read

We seek only to demonstrate that his observations do not imply that the pursuit of verstehen is a diversion for the field. To the contrary, we argue that the...

社会传染动力学:阈值模型及其扩展

less than 1 minute read

本文回顾了社会传染的经典模型之一阈值模型的相关内容。并且根据近年来在线服务产品采纳行为传播的实证研究讨论了阈值模型的局限性。在此基础上,介绍了一个新的模型。该模型在传统的阈值模型中引入两个新的机制,从而成功地解释了现实生活中社会传播的现象。

Computational Journalism

21 minute read

Journalists look for the unusual handful of individual items that might point toward a news story or an emerging narrative thread.

Duncan Watts’ AMA Interview

18 minute read

On the other hand a single high impact paper is worth many low impact papers, so from a career perspective it’s not necessarily a waste of time to devote a y...

Common Sense and Sociological Explanations

88 minute read

Sociologists rely on common sense more than they realize. Moreover, this unacknowledged reliance causes serious problems for their explanations of social act...