2017

2016

理解人类个体移动的模式

3 minute read

与列维飞行和随机游走模型预测相反,人类的实际移动轨迹显示出高度的时空规律性,个体特征可以用一个与时间无关的特征移动距离和一个优先返回概率来刻画。在校正行进距离的差异和每个轨迹固有的各向异性之后,个体行进模式转变成单个空间概率分布,这说明尽管他们的旅行历史具有多样性,人类的移动轨迹遵循简单的可再现模式。

新闻在注意力场中的逃逸

less than 1 minute read

新闻的传播过程是科学界与工业界都关注的重要问题。传统研究多关注新闻在社交网络上的传递。但是以人为节点,以人们彼此间的交互为连边的社交网络,是很容易变化的。在这个不断变化的背景上研究新闻的复制和扩散,显然不是一个非常聪明的策略。

第一届计算传播学论坛

less than 1 minute read

Watts提出“如果处理得当,基于互联网传播产生的数据和互动性将会变革我们对于人类集体行为的认识”(Watts, 2007)。当人类传播行为的数据构成了计算社会科学的重要基础的时候,深入认识计算传播学的时机已经到来.

可视化的重要性

1 minute read

在我们对数据中的变量的数学分布及其相互关系进行任何分析和建立任何假设之前,为了便于理解它们的特征和找到合适的分析技术,对数据进行可视化通常是一个好主意。在本文当中,我会展现我们利用(1)简单的统计和(2)数据可视化所能得出的结论之间的巨大差异。

记忆优先随机游走模型

2 minute read

We consier a finite space of M locations, in which N individuals perfom random wolk with the probability of visiting a position proportional to its weight.

计算传播学的起源、概念和应用

2 minute read

计算传播是指数据驱动的、借助于可计算方法所进行的传播过程,而分析计算传播现象的研究领域就是计算传播学。本文首先分析了计算传播的起源、概念和应用,然后从计算社会科学的角度对计算传播学的理论脉络进行了介绍。

使用plotly-py进行数据可视化

less than 1 minute read

Plotly.js已经开源了,可以在线下生成独立的html文件,因此现在通过python使用plotly完全免费了。本文介绍基于python使用plotly的方法。

男女选秀弥漫与娱乐机器轰鸣 ——试对《人民日报》的娱乐话语进行文本挖掘与可视化 (2005-2016)

4 minute read

本研究选取了内地媒介市场化的代表节目形态之一,选秀节目,作为分析的对象;而选秀节目如雨后春笋,秉着见微知著的精神,又选取了“音乐类选秀节目”作为分析的重点。本研究通过中文LDA主题模型的方法,分析党报《人民日报》过去12年间对音乐类选秀节目的话语主题,从而归纳其主旨,并对结果进行可视化。

中国交通事故媒介日记

less than 1 minute read

在2000-2014年这15年间,全国各个省份在媒体报道中的交通事故数量和死亡人数随时间的变化趋势。

利用python实现knn算法

4 minute read

NBA历史上与这些超级球星处于同一位置的球员都有谁?这些球员是否能依据某种原则进行分类?能否通过一些算法来预测他们的赛场表现? 根据NBA官网上的部分统计数据,我进行了如下实践。

对《政府工作报告》进行文本挖掘

less than 1 minute read

3月5日上午,十二届全国人大四次会议开幕,国务院总理李克强作政府工作报告,系统总结了2015年政府工作,并为转型期的中国经济发展提出了新的方向。分析《政府工作报告》成为社会各界关注两会的重要视角。为了更好地理解《政府工作报告》,本文对自1954年以来的47次《政府工作报告》的文本进行自动化分析。

Mlxtend简介

1 minute read

Mlxtend是一个基于Python的开源项目,主要为日常处理数据科学相关的任务提供了一些工具和扩展。

视角:计算社会科学

1 minute read

以上的种种事情都留下了我们的数字脚印,这些踪迹汇聚起来就成为一幅复杂的个人和集体行为图景,同时这些踪迹也有可能改变我们对人生、组织和社会的理解。

标度行为的几何模型

1 minute read

这个几何模型,不仅适用于物理空间,也适用于抽象空间(abstracted space)。前者包括城市、因特网的autonomous systems、大脑,后者包括相似性空间(similarity space,如引文网络、科学合作网络、在线社区)、语义空间、生态位空间(niche space)。

新闻地图项目与gdelt数据介绍

2 minute read

中国新闻地图是一个以可视化的方式反映中国新闻在时间与空间分布的差异性的网页应用,利用gdelt已有历史数据作为数据源,通过多样化的统计图表对中国新闻进行展示。

社交网络vs大众媒体:公共意见的动力学模型

less than 1 minute read

当个体更新观点时,他以概率P选择媒体观点作为他的新观点,而以概率1−P随机选择他的一个好友并将其新观点设置为与该好友一致。最终这个动力学过程将达到稳态。

2015

无标度的意义

less than 1 minute read

网络科学使得幂律(power law)和无标度(scale-free)变得非常普及。那么究竟无标度的意义是什么呢?其实,无标度来源于统计物理的一个分支:相变理论(the theory of phase transition)。

复杂网络零模型构造的方法及应用

6 minute read

关心真实网络和该网络随机化零模型比较后的相对值,通过相对结果的统计结果来说明实证网络的性质,此时如何构造出一个合理的复杂网络零模型作为参照物就变得非常重要。

小世界网络的输运效率

1 minute read

Latora(2001)的主要贡献 对于小世界网络的描述,可以简化为efficiency(记作E)一个变量即可,且efficiency本身有其物理意义。efficiency衡量了网络信息交换的效率。

Python中的统计可视化库Seaborn

less than 1 minute read

本文主要介绍使用seaborn可视化单变量、可视化双变量、可视化多对关系、可视化线性关系、绘制函数、适应各种模型、控制图片大小和格式、分类数据画图等内容。

使用ggplot2可视化多主体建模结果

less than 1 minute read

本文将介绍如何使用R软件中的ggplot2展示不同参数条件下多主体建模的数据,主要包括数据读取、数据清洗和数据可视化三个环节。

在线扩散的结构性病毒特征

1 minute read

本文以《The Structural Virality of Online Diffusion》一文为基础,介绍了The Structural Virality在当下在线信息扩散中的特点。

恐怖袭击距离中国有多远?

less than 1 minute read

1970年至1990年20年间,东德的恐怖袭击事件一直保持着低水平的平稳趋势,但在1990年东西德统一后,德国的恐怖袭击事件激增。而前苏联在这20年间,国内恐怖袭击事件一直保持着递增的平稳趋势,1989年苏联解体,恐怖袭击事件在1990年突然上升,虽略有波动,但一直稳健增长。

PageRank算法浅介

1 minute read

一个页面的“得票数”由所有链向它的页面的重要性来决定,到一个页面的超链接相当于对该页投一票。一个页面的PageRank是由所有链向它的页面(“链入页面”)的重要性经过递归算法得到的。

网络增长动力学:BA模型

1 minute read

在 1999的 一篇文章里, Barabasi 和 Albert 提出了网络增长的优先链接(preferential attachment)模型.他们假设新节点每次携带常数m条边,且每条边链接到老节点的概率与老节点的度成正比。为了获得度分布的解析式,他们在论文原文中用的是平均场方法(mean-field anal...

2014

注意力流网络分析的三个维度

less than 1 minute read

12月22日上午九点三十分,南京大学新闻传播学院计算传播实验中心第四次讲座如约开讲,本次应邀前来为大家做讲座的是来自亚利桑那州立大学的博士后研究者吴令飞博士。吴令飞博士毕业于香港城市大学媒体与传播学系,曾在百度做算法工程师,主要研究方向为注意力动力学。

译稿勘误:有向三元组的类型

less than 1 minute read

去年我参与翻译了《社会网络分析:方法与实践》一书,其中,我负责翻译4,5,6三章。今天收到了一封来自台湾大学的一个读者的来信,提出了书中的一个问题,如下:

社交网络演化中的局部传递性

less than 1 minute read

人类动力学(human dynamics)研究者习惯于从系统的角度来分析问题;社会科学家则强调个体作为基本研究单位的重要性。系统的特性会作用于个体,个体的行动汇总起来可以塑造系统的全局特性。

从概念到真实:SNS的形式蜕变

less than 1 minute read

本文载于《数字媒体阅读报告》。本文是作者从技术和资本角度对于SNS浪潮的反思。其中部分内容取自作者硕士毕业论文,虽然名为《正在爆发的互联网革命》一书的读书笔记,但并不限于此。

网络残缺度:共同好友间可否两步到达?

less than 1 minute read

网络是由节点和关系构成的,而对于关系的描述是社会网络的关键。我们已经知道对于节点的网络特性可以从中心度、近度、介度、特征度(eigenvalue centrality)等方式描述。那么对于关系呢?最简单的就是直接关系的强度了。

使用R模拟网络扩散

2 minute read

与普通的扩散研究不同,网络扩散开始考虑网络结构对于扩散过程的影响。

Welcome to Jekyll, Markdown, and Atom!

2 minute read

这个网站使用Jekyll构建。Check out the [Jekyll docs][jekyll-docs] for more info on how to get the most out of Jekyll. File all bugs/feature requests at [Jekyll’s GitHu...

2013

探寻社交网络中的关系: 统计网络模型初探

9 minute read

在上一章当中,我们对于网络的基本知识进行了介绍,这些知识构建起了网络科学的基础,同时也孕育着巨大的潜能。社会科学追求理论的建构,但疏于思考理论层次的丰富性。以社会学为例,一度在宏大理论和抽象实证主义之间摇摆(参见米尔斯所著《社会学的想象力》)。大数据时代的到来,再一次使得少数人开始对理论的认识产生动摇,以为只要把...

QAP检验:计算两个网络的关联

less than 1 minute read

QAP检验:两个网络之间的关联 通常一组个体具有多种类型的关系,例如友谊关系和经济往来关系。我们通常会对这两种网络关系在多大程度上相互关联感兴趣。当我们知道一组个体之间的两种关系网络,我们就可以计算这个两个关系网络之间的相关程度。在统计学当中,皮尔森相关系数是用来反映两个变量线性相关程度的统计量。与之类似,对于由...