Recent Posts

使用python进行数据清洗

20 minute read

本文介绍使用python进行数据清洗的一个案例。在数据新闻教学当中,我们通常会介绍使用open refine进行数据清洗。不过我一贯主张采用编程的思路来进行数据清洗,以保证分析的可复制性。本文介绍使用python,尤其是pandas包对university data进行数据清洗的一个例子。

ROC分析与统计检验

2 minute read

pROC是一个进行deLong显著性检验的R包。本文介绍计算AUC、绘制ROC曲线、并进行显著性检验。

真实熵与人类行为可预测性

3 minute read

在Limits of Predictability in Human Mobility一文(Song, 2010, Science)当中,Song等人提出人类移动行为的可预测性问题。强调了采用香农熵或随机熵不能捕捉到移动位置的时间序列特点,主张采用一种真实熵(the actual entropy)的测量方式,表示...

2017年计算传播学年会暨工作坊

1 minute read

熟悉计算社会科学研究范式并掌握基本的计算技能,是传播学者进入计算计算传播学领域的基本条件。基于此,南京大学新闻传播学院、百度、社会媒体处理专业委员会以及香港城市大学传播研究中心/互联网挖掘实验室拟共同举办2017年计算传播学年会暨工作坊(南京,9月22-9月24日),包括一天半工作坊 + 一天会议。

pytorch初步

2 minute read

pytorch是一种更加灵活的深度学习框架,本文介绍在anaconda环境下的安装、导入和使用。

Implementing an ERGM from scratch in Python

10 minute read

I’ve always felt a bit nervous about using them (ERGM), though, because I didn’t feel confident I really understood how they worked, and how they were being ...