Recent Posts

使用scihub.py下载论文

5 minute read

scihub.py是一个sci-hub.cc的非官方的python接口,可以在实现从谷歌学术搜索论文并从sci-hub.cc下载论文的操作。

使用python可视化地理空间数据

5 minute read

本文介绍使用python可视化地理数据,使用维基解密阿富汗战争日志数据作为例子,涵盖folium,geopandas两个主要的工具。

基于泰森多边形的网络可视化

5 minute read

Voronoi图,又叫泰森多边形或Dirichlet图,它是由一组由连接两邻点直线的垂直平分线组成的连续多边形组成。N个在平面上有区别的点,按照最邻近原则划分平面;每个点与它的最近邻区域相关联。本文介绍Emden Gansner, Yifan Hu, Stephen Kobourov三人所发展的GMap方法,将网...

使用python进行数据清洗

20 minute read

本文介绍使用python进行数据清洗的一个案例。在数据新闻教学当中,我们通常会介绍使用open refine进行数据清洗。不过我一贯主张采用编程的思路来进行数据清洗,以保证分析的可复制性。本文介绍使用python,尤其是pandas包对university data进行数据清洗的一个例子。

ROC分析与统计检验

2 minute read

pROC是一个进行deLong显著性检验的R包。本文介绍计算AUC、绘制ROC曲线、并进行显著性检验。

真实熵与人类行为可预测性

3 minute read

在Limits of Predictability in Human Mobility一文(Song, 2010, Science)当中,Song等人提出人类移动行为的可预测性问题。强调了采用香农熵或随机熵不能捕捉到移动位置的时间序列特点,主张采用一种真实熵(the actual entropy)的测量方式,表示...

2017年计算传播学年会暨工作坊

1 minute read

熟悉计算社会科学研究范式并掌握基本的计算技能,是传播学者进入计算计算传播学领域的基本条件。基于此,南京大学新闻传播学院、百度、社会媒体处理专业委员会以及香港城市大学传播研究中心/互联网挖掘实验室拟共同举办2017年计算传播学年会暨工作坊(南京,9月22-9月24日),包括一天半工作坊 + 一天会议。