Blogs

王成军等参加CCS2015年会 世界复杂系统2015年会在美国亚利桑那州立大学举行,会议共同举办方还包括圣塔菲研究所,会议持续5天,从九月二十八到十月二日。欧洲复杂系统大会(European Complex Systems Conference)是一个历史悠久的复杂系统研究盛会,04年第一次举办,至今已经有十一年。今年开始走向全球,来到位于坦普的亚利桑那州立大学。本次会议的主要组织者Sander van der Leeuw,他同时也是亚利桑那大学-圣塔菲研究所合作的生物社会复杂系统联合研究中心主任。此次会议聚集了全球复杂系统研究者,同时还包含了经济、语言、建筑等多个领域的复杂系统研究者。作为实验中心成员,王成军和吴令飞分别宣读其研究论文。值得一提的是,本次会议设立了“计算社会科学”分会,中心研究员吴令飞参与Organizing Committee,王成军参与Program Committee。2016年CCS年会将回到欧洲,在阿姆斯特丹举行。 因为该中心是与圣塔菲研究中心合办的,所以圣塔菲也是会议的主要合办者,此外还有springer出版社。会议注册人数超过600人,并不算太多,但会议时间从9月26号开始到10月2日下午结束,整整持续了7天,不可谓不长,全程参加下来也很累。 会议的粗略议程见这个Program-at-a-Glance。会议采用了app的方式,无纸化推送详细的program。不过这里有个问题是身在GRW内的我苦苦装了一个多小时也没有成功下载到我的ipad上,后来去了后两分钟下载好。用起来就很方便了,支持按时间、人、活动多种方式查询。会议在twitter上的hashtag是#css2015,在这个app里也可以完美呈现。 从时间上讲,这个会议设有preconference,主要在26和27号两天,工作坊主要在这两天。比如26号上午是来自圣塔菲的Melanie Mitchell讲Introduction to Complexity,她在网络上有一个同名的课。关于她我们已经很熟悉了。她的博士导师就是大名鼎鼎的侯世达,她曾在圣塔菲讲解complexity,整理出版了同名著作Complexity:A guided tour,中文译本由湖南科学技术出版社出版。我来到南京后曾专门组织读书会研读这本书。下午同样是来自圣塔菲的Aaron Clauset介绍Networks。他和Newman曾写过如何判定powerlaw的R和python的程序。27号,Robert Axtell介绍Agent-Based Models,下午Simon DeDeo介绍Information Theory and Maximum Entropy Methods。整体而言,这些介绍都比较基础。因为我是27号下午才到的,所以这些都错过了。

Continue reading

《中国网络传播研究》登陆CNKI 《中国网络传播研究》开始登陆中国期刊全文数据库(cnki)。在中国期刊全文数据库当中通过“期刊导航”检索“中国网络传播研究”就能看到已经上传的往期文稿。目前,还只有2011年也就是第五期刊物上传,之后其它各期会陆续上传。 《中国网络传播研究》(Chinese Journal of Computer-Mediated Communication)由南京大学新闻传播学院主办,是目前国内唯一的一本以网络传播、新媒体研究为主旨的学术研究刊物(集刊),主要刊登与互联网、新媒体传播有关的高水平学术性论文,自2007年以来已出版7辑。2013年经中国社会科学评价中心评定,入选CSSCI来源集刊。《中国网络传播研究》旨在为研究网络传播的学者提供学术讨论的平台,倡导从多学科、全球化视野的视角开展具有科学性和创新价值的学术研究,以彰显网络传播研究对传播学、乃至于整个人文社会学科学的理论贡献,促进网络传播学者与其它学科的对话。

Continue reading

秦强加入奥美数据科学实验室 奥美数据科学实验室昨日又迎来一枚新成员–秦强。秦强对实验室进行了预先体验和学习,并照例进行了实验器材清点、签订实验室合约、填写每周轮值表格,并规划了其年度学习计划。研究工作方面,秦强在实验室老师帮助结合已有项目基础与个人兴趣,暂时将研究方向划为手机数据信息挖掘与分析。

Continue reading

“编程马拉松“热身活动圆满结束 2015年10月17日晚,为呼应同学们对数据挖掘分析和编程方面的浓厚兴趣,普及编程方面的基础知识以及介绍数据挖掘的应用工具,计算传播学实验中心开展了名为“编程马拉松:从kaggle开始”的编程马拉松活动,新闻传播学院和各院系同学踊跃参加了本次活动,甚至众多闻讯的校外人员也纷纷赶来参加活动。本次活动由实验室王成军老师主持。 所谓编程马拉松(英语:hackathon,又译为黑客松),又称黑客日(hack day)、黑客节(hackfest)或编程节(codefest),是一个流传于黑客(hacker)当中的新词汇。编程马拉松的灵魂是合作地编写程序和应用。其精髓在于:很多人,在一段特定的时间内,相聚在一起,以他们想要的方式,去做他们想做的事情——整个编程的过程几乎没有任何限制或者方向。 活动开始,王成军老师阐释了组织本次编程马拉松活动的初衷并介绍了有关编程语言的发展演进,并向大家介绍了在当今数据科学领域,业界以及学界备受推崇的Python编程语言的应用,之后王老师着重向大家展示了一些Python语言在运用过程中的强大,并用风趣幽默的方式将Python与其他语言工具做了对比。接下来,针对Python的学习与应用,王老师推荐了许多实用的Python技巧(如pandas分析包的运用),并介绍几个对初学者大有裨益的网站,如Wikipedia、stackoverflow、kaggle,以及众所周知的你永远的好伙伴儿——Google! 活动后半部分,王老师带领大家进行了实际操作训练,主题是Predict survival on the Titanic,首先由王老师运用Python对整个操作过程进行了演练,着重讲明了Python的操作思维和使用技巧,随后同学们便纷纷摩拳擦掌进行了练习。由于许多同学都是第一次接触编程语言,在这个过程中有许多的困难,但大家纷纷采取互相帮助、讨论的方式去解决问题,相信这也就是本次编程马拉松活动想要传达的精神。晚上10点多的时候,王成军老师宣布活动结束,同学们都表示收获很多,期待下一次的聚会学习。 本次活动的PPT见:vdisk.weibo.com/s/3nFszmOa7t 以下为本次活动现场照片

Continue reading

《临界:智能的设计原则》读书会活动开始 读书会介绍 科学就是找规律:在极繁的世界里,找到它的极简「设计原则」。从美剧《纸牌屋》中的西藏坛城沙画到黄石公园的森林大火,再到恐怖组织的活动;从鸟群的行为到大脑的行为,从黑客精神到互联网产品的黏性,从我们每天用的语言到金融市场;真令人感叹,科学家们简直像是在脑门儿上装了探测仪一样,到处寻找隐藏的关联,简直就是「连连看」嘛!然而,一直以脑洞大开作为人生使命的我,也从来没有想过,「证明我妈是我妈」这种问题居然能够用物理模型来描述。现在好像大家都在说模型:股票模型的目的是预测近期股票的走势;天文学家可以通过计算机的模拟,推算出过去的夜空,得知千年以前的某一天月亮和星星的位置;而神经科学做的模型,旨在模拟人的大脑,让它能够像人类一样看、听、学习、思考、交流……傅渥成的新书《临界:智能的设计原则》,提供了各种各样有趣的「模型」,让你从新的角度来看日常生活中大大小小的细节。 活动组织:本读书会将会一起阅读《临界:智能设计的原则》及其他有关“临界”的相关文献,旨在了解有关智能设计的相关原则,希望通过读书会活动形成一些合作项目。本次读书会共分四次举行,将会涉及物理学视角下的复杂系统、集体运动、幂律和人类行为的特征、临界的大脑和分叉的记忆四个部分的内容。 主讲人: 傅渥成,物理学在读博士,知乎深度用户,「知乎盐 Club 2014」荣誉会员。主要研究方向为统计物理及其在生命科学问题中的应用,关注复杂系统等领域的最新进展,曾作为中国博士生代表参加在德国林岛举办的「诺贝尔奖获得者大会」。 主办方: 本次活动由集智俱乐部@南京读书会、南京大学计算传播学实验中心、奥美数据科学实验室负责组织。集智俱乐部(http://www.swarma.org/ ),英文名:Swarm Agents Club,简称“SA Club”,成立于2008年,是一个从事学术研究、享受科学乐趣的探索者的团体。它倡导以平等开放的态度、科学实证的精神,进行跨学科的研究与交流,力图搭建一个中国的“没有围墙的研究所”。2015年集智俱乐部开始走向全国。 读书会的时间: 10月24日、11月7日、11月21日、12月5日的周末下午14:00-17:00 读书会地点: 南京大学鼓楼校区费彝民楼A409 相关图书: 豆瓣读书:http://read.douban.com/ebook/13943314/ 亚马逊:http://www.amazon.cn/临界-智能的设计原则-傅渥成/dp/B015YVCWQO/ 第一次活动视频 视频:http://weixin.duobeiyun.com/room/jz540932026ca04e6b8806073e710fddc4

Continue reading

《中国网络传播研究》审稿系统上线 《中国网络传播研究》审稿系统上线 http://zwcy.cbpt.cnki.net/

Continue reading

本科学术基地班“传播网络分析训练营” 11月1日,实验中心成员王成军给南京大学新闻传播学院本科学术基地班同学开展了“网络数据挖掘”培训课程。该课程持续一天时间,讲解了计算传播学的基本理论框架、简单介绍了R语言、并学习了R语言在网络分析中的应用。 时间:11月1日,周日 主讲人:王成军 内容: 上午 《计算传播学导论》 练习:R语言的使用 下午 《数据科学编程工具介绍》 练习:Python编程工具的使用 课前准备工作: 请务必在课前完成以下账号注册、软件安装、R语言练习的课前工作。 注册Github账号 www.github.com 下载并安装Github客户端 https://desktop.github.com/ windows安装经验 http://jingyan.baidu.com/article/6b97984d9bd6ed1ca2b0bf07.html 下载并安装anaconda python https://www.continuum.io/downloads 注意选择2.7版本 下载安装R软件 http://cran.r-project.org/ 确保R软件安装完毕后,下载安装Rstudio。 下载链接 打开Rstudio, Rstudio–>File—>R script 按ctrl+s(mac为command+s)命名并保存到本地github小组文件夹当中 打开http://tryr.codeschool.com/完成练习,先完成前四节。 每完成一个练习,复制代码到RSTUDIO的代码区域 在Rstudio的代码窗口输入代码或写注释 可以按ctrl+enter(mac为command+enter)执行一行代码,全部执行后, 在Rstudio里File—>Compile Notebook Rstudio会说Install Required Packages,按yes 同意安装,等候2分钟安装完毕,自动开始compile 最后,将compile成的html和R代码保存下来 课程简介见: https://github.com/data-science-lab/AcademyCamp2015 。

Continue reading

实验中心参与数据新闻与可视化培训 11月2日,实验中心成员王成军为青海日报社的记者和编辑们讲解了数据新闻和可视化。课程分为两部分,第一部分讲解了数据新闻的未来、现在和历史,主要强调了通过数据新闻实现从信息传递到知识发现的过程;第二部分,主要针对数据叙事和可视化展开,强调了可视化对于数据新闻的意义,以及数据新闻的可视化生产的历史、形式、生产流程、理论和应用。

Continue reading

《临界:智能的设计原则》读书会第二期(视频) 时间:2015年11月7日下午14:00-17:00 地点:南京大学鼓楼校区费彝民楼A407 主讲人:傅渥成 视频:http://weixin.duobeiyun.com/room/jz969865448e2745a88893973f90c866ac 内容摘要 集体行为与临界(Collective Behaviors and Criticality) 非平衡统计力学中的伊辛模型(Ising Models in Non-equilibriumStatistical Mechanics) 集群运动与相关函数(Analyzing collective behaviors: Correlation Function) 信息流(Information flow) 2015年11月7日下午两点,集智俱乐部@南京读书会——《临界:智能的设计原则》第2期继续在南京大学新闻传播学院开展,本次读书会延续了上一期的话题,邀请了南京大学物理系的在读博士傅渥成,带领大家以统计物理的视角,从集体行为的研究角度切入,探讨“临界”这一概念在集体行为的控制与形成中的体现。下面我们带大家回顾一下本次活动的核心要点。 首先傅渥成的讲演围绕非平衡统计力学中的伊辛模型展开。Ising Model(伊辛模型)是描述物质相变的一种模型。相变是物质从一种相转变为另一种相的过程。物质经过相变会出现新的结构和物性。在介绍平衡系统下的伊辛模型时,傅渥成主要讲述了使用Metropolis Monte Carlo Method模拟平衡系统下的伊辛模型时所用的算法,帮助大家更好地领会了伊辛模型的思想。对于非平衡系统,也即一个存在能量流动的系统,可以采用ASEP模型(Asymmetric Exclusion Process,非对称排斥过程)进行研究,这个模型是由分子生物学家提出来的,在统计物理中也有广泛的应用。如果将ASEP模型扩展到二维,则可以用来研究交通流中的拥堵现象,以及人在行走时的方向选择问题(行人动力学,Pedestrian Dynamics),这一类的研究可以参考日本东京大学西成活裕教授的科普书《堵塞学》。 接下来介绍的是关于集群运动的一些模型,主要介绍了Vicsek Model。该模型给出了一种描述集群运动原理的设想,即假设集群中的每个个体参考其邻居的运动情况,保持与邻居速度对齐。“与邻居速度对齐”是一个很复杂的过程,会有各种各样复杂的临界点存在。Vicsek Model相当于是粒子不在格点上的伊辛模型,稍加改进可以变成Active Ising Model。Vicsek Model的缺陷在于它人为地假设了一些规则,而这些规则并不一定是自然界真实存在的规律。为了找到更好的规则,一般会采用计算相关函数的方法,常用的相关函数有:余弦相似性、皮尔森相关性、向量内积、时间序列、自相关性。值得注意的是,得到了相关性并不一定能揭示因果性。此外,他还提到了Inverse Ising Model(反伊辛模型),它的作用是可以从相关函数倒推出相互作用 最后,他举了两个例子,第一个是Community Detection(社区识别),主要讨论了从关联函数出发,研究社区识别中的几个主要问题,比如:如何评估社区识别的结果,如何定义相关性和连接性,随着时间的演变以及社区中的层级结构等等。第二个问题是Transfer Entropy(以股市中的信息量的流动为例),介绍了Mutual Information(互信息)的概念,通过分析历史信息的互信息性质,引出了Granger Casuality(Granger因果)的概念,最后总结出了一条比较好的研究路径——从设定一些物理测量到计算相关函数,从而得到信息流,最后实现对群体行为的预测。 主讲人简介 傅渥成,物理学在读博士,知乎深度用户,知乎盐Club2014荣誉会员。主要研究方向为统计物理及其在生命科学问题中的应用,关注复杂系统等领域的最新进展,曾作为中国博士生代表参加在德国林岛举办的诺贝尔奖获得者大会。 微信号:生命的设计原则 知乎:http://www.zhihu.com/people/fuwochen 《临界》一书地址如下: 亚马逊:http://www.amazon.cn/临界-智能的设计原则-傅渥成/dp/B015YVCWQO/ 豆瓣读书:http://read.douban.com/ebook/13943314/

Continue reading

王成军参加418博士之家活动 王成军,博士。先后毕业于兰州大学、北京大学,获香港城市大学传播学博士学位,于2014年9月加入南京大学,现任奥美数据科学实验室主任,计算传播学实验中心成员,兼任香港城市大学互联网数据挖掘实验室研究员,集智俱乐部科学委员会成员,主要研究兴趣为采 用计算社会科学研究方法分析人类传播行为。 2015年11月20日中午,新闻传播学院“博士之家学术午餐会”第三季第8期(总第58期)在鼓楼校区费彝民楼A座418室举行。此次午餐会邀请到的是南京大学新闻传播学院奥美数据科学研究室主任王成军博士,为老师和同学们做了题为“跨越网络门槛:信息分享类网站上的信息扩散”的学术报告。本次讲座由巢乃鹏教授主持。 讲座开始前,巢乃鹏教授就当前传播学交叉发展的现状发表了评论和感想。 他认为传播学是一个开放的学科,即所谓施拉姆所说的十字学科,很多学者来转一圈,然后就离开了。如今看来,可能正是这个构成了传播学的学科内核,内核就是存在于这样的开放中间。不过现今的互联网时代,来自于自然科学和人文学科的跨大学科种类跨学科的趋势越来越明显。在传播学的研究中间,同样有研究者会发表在国际的顶级期刊像Science、Nature上。但是遗憾的是,虽然他们研究的是人类的传播行为,但他们很可能不认为自己在研究传播学。 如今的情况跟几十年前的十字学科一样,很多学者并不来自于传播学领域,而是更加多元化,来自于数学的、计算机科学、物理学。正是因为人类传播行为显现出魅力,才会吸引来自于其他学科的研究者。更重要的是,跟几十年前相比,很多研究者,并没有像拉扎斯菲尔德一样,留下一些研究成果就转身离开了,而是留了下来。因此今天讲的传播学是大传播学,包括互联网和社交媒体兴起之后这样一个大的可以从海量数据环境中间去研究人类传播学的一个大的传播。跳出经典的研究视角,或许会给传播学研究带来更好更强的生命力,也为未可知。 巢乃鹏教授 概念辨析和研究方法感想 王成军博士幽默的表示,他是去年的8月份博士论文答辩,11月份才正式地毕业,时隔一年,再来答辩一次很紧张。 王成军博士的论文题目叫做《跨越网络的门槛:信息分享类网站上信息扩散》。在分享之初,王成军博士就帮助大家厘清了一个概念,社交媒体还是社会化媒介。首先,王成军博士认为,相对于媒体而言,媒介的含义更广阔。其次, social这个词,很多人会把它窄化为社交,有本中文期刊,认为应该翻译为社交,但其实不是这样,就应该翻译成社会化。因为我们去考察这些社会化媒体,它的功能主要是有两类,第一类是交友,但是另一类叫做“信息分享类的”,在这个层面翻译成社会化更准确。所以他个人更愿意用social media,因为它的意味更为丰富。 王成军博士介绍说,他的《跨越网络的门槛》的研究缘起是因为确实有一个在做网络门槛的东西存在着,格兰诺维特在这方面的研究对他启发很大。王成军博士也赞赏了格兰诺维特的强弱关系研究,认为他是为数不多的在博士论文的阶段就可以达到整个学术研究巅峰的学者。王成军博士还认为,格兰诺维特强弱关系研究之外的第二个研究,即网络门槛的研究之所以重要,就是因为他开始采用网络的视角去观察很多东西,观察集体行为,观察社会运动,观察我们这个领域所研究的一个理论,叫做沉默地螺旋。 王成军博士还从自己的研究经历出发,发表了自己对研究方法的看法。他认为在传播学研究中,研究方法特别容易把它窄化为定量和定性,或者是文化研究以及批判。但是王成军博士觉得开放的思维特别重要,今天很多学者所理解的定量恰恰不是真正意义上的定量,因为它被窄化成为基于统计的分析。这是很严重的信息压缩,如此作为研究方法就丧失了吸引力。所以很多人并不理解真正的定量,更不能理解真正的研究方法。 王成军博士自北大毕业去香港城市大学读博,一开始就确定了采用门槛模型研究信息扩散的研究,在四年的博士生学习中从来没有换过题目。王成军博士认为,如果选择了一个方向,认为这个方向有潜力,就应该坚持下去,有时候人需要有一种钝感的,做研究的有时候不能太敏感,面对别人的一些不理解,以及一些善意的批评的时候,突然就完全扭转方向。离开了自己理性的思考,是非常可怕的。 研究背景与理论框架 在王成军博士的研究视野中,社会化媒体中的信息分享类网站非常重要。正是它使得“信息扩散”这一研究领域重新复活,“信息扩散”被研究的历史非常悠久,从研究新闻的扩散,到研究文化的扩散,再到研究创新的扩散等等。新闻扩散从60年代就开始发展,但发展到80年代之后它就衰落了,一代学者离开这个领域之后,就没有人能够扛起来这个重任。那是到了社会化媒体发展起来,不同领域的人都开始去研究社会化媒体上的信息扩散。就使得信息扩散作为一个研究领域变得朝气蓬勃。 在2000年之后,一些研究认为,在网络信息扩散的过程当中,扩散的门槛会消失,意味着会产生全局性的扩散,规模会非常巨大。但是实际上后续地一系列的研究都证明,扩散的规模实际上非常有限。 为什么预言的那些大规模的信息没有产生,王成军博士的研究从这个角度开始切入,要去解决这个困惑,并细化成了一些具体的研究问题,比如说信息在信息分享类网站上它扩散的规模、受到人际作用、社交作用的影响,以及扩散上的时间模式。 王成军博士的论文理论框架较为丰满,其中包括格兰诺维特的门槛理论,信息扩散的模式等等。王博士首先定义了门槛,门槛首先是个人门槛,个人门槛会阻碍信息的扩散。社会化媒体使得社会网络或者是朋友关系,转移到了一个虚拟的空间里面存在,因此可以定义成网络门槛。网络门槛一般来说是可以定义为比率,这个比率就是当转发这条信息的时候,已经转发了朋友的数量比上所有朋友的数量。举一个例子,有一个人他叫V,他在中间,然后他有7个朋友,这7个朋友里面有4个人转发了某一条信息,剩下3个人没有转发,当这4个转发了之后,中间这个人他也决定转发了。于是他的网络门槛,我们就可以给他定义为4/7。 王成军博士 思考信息的扩散比较复杂的,复杂的原因是因为有不同层面的影响,至少可以分为四类。有外部冲击,也有社会网络内部影响,还有个人层面影响,再有信息本身属性。由此归纳出来信息推动力,由此可以细化到不同的变量上去。

Continue reading

《临界:智能的设计原则》读书会第三期 11月28日,第三次《临界》读书会在南京大学费彝民楼如期举行,本次读书会的主题是“自然现象和人类行为中的幂律”,主要讲了三个部分:第一部分讲了恐怖活动、地震以及太阳黑子的幂律活动特点及其异同;第二部分主要讲述了临界的大脑:神经的雪崩效应;第三部分则将重点放在了人类行为与幂律关系上。 http://weixin.duobeiyun.com/room/jz82b49a469bc548c3bfd5e5f40c789828[观看读书会视频](http://weixin.duobeiyun.com/room/jz82b49a469bc548c3bfd5e5f40c789828) Part1 第一部分,傅渥成博士以最近刚刚发生的巴黎恐怖袭击作为开讲事例,进而引出恐怖活动这类突发性事件是否具有某种规律特征、是否可以对其进行预测的疑问,随后其在前人的研究中可以看到阿富汗、伊拉克、哥伦比亚、秘鲁四个国家发生的袭击事件符合某种幂律分布特征。 为什么也总会有幂律出现?对此,傅渥成博士引出了一个暴动框架模型(图2),主要考虑恐怖组织大小因素对恐怖活动的影响。由于各种恐怖组织会因为矛盾产生分裂,而其它的组织又会吸纳这些从某一恐怖组织中分裂出来的成员。我们假定组织 i 可以以速率 v 分裂为两个组织,而与之对应的,任意两个组织 j 和 k 又可以以速率 1 - v 聚合产生新的组织。这里,模型假定了这些组织分裂(和聚集)的速率与组织本身的大小无关。根据这一假定,可以列出描述这一动力学的主方程(master equation),对这一方程进行求解,可以解得恐怖组织大小的分布中出现了一个指数等于 2.5 的幂律。 通俗一点儿的解释,恐怖分子就像公路上行驶的一个个汽车,恐怖分子集团就是汽车与汽车之间距离,当一辆车的司机突然心血来潮地加速,汽车与前面汽车的距离会减小,而与后面汽车的距离就会增加,意味着加速的汽车加入了前面的恐怖集团。因此,一些急剧发展壮大的恐怖组织不但可以吸引被其它组织所排斥和忽视的人员,甚至还可以吸引世界各地的中二青年加入,并且能募集或者勒索到大量资金支持其恐怖活动,这些恐怖组织的破坏力是惊人的。 随后,傅渥成博士又以自然界中的地震为例,介绍到一次主震后,余震的数量会呈现处幂律分布的特征,如余震的数量与主震的强度成正正相关;余震与主震间隔时间也与主震强度成正相关;余震的强度总是与上一次地震的强度接近但是总小于前一次。 但是这种幂律特征并不是通用于自然界中的所有突发事件,如太阳耀斑的活动中,下一次的爆发强度虽也与前一次的强度相近,但总是大于前一次的强度。 Part2 第二部分主要内容是讲大脑中的临界现象。傅渥成博士首先介绍了弹簧块模型、雪崩效应和沙堆模型的概念,由此引申出人类大脑中是否也有类似于这样的活动?傅渥成博士将人类的大脑形容为一个电路板,在人类大脑中确实存在类似链式反应的过程,在神经中,某个神经元信号的发放可以导致与其连接的其它神经元也产生兴奋,我们把这样的过程看成是一个分支过程,对这一过程的描述用分支率来进行刻画,分支率 σ 被定义为一个神经元的「下线」跟其「上线」数目之比。当 σ < 1 时,随着神经信号的传递,活动性会逐渐衰减,就像一片由耐火的树木形成的森林,因为被闪电击中(神经信号发放),某一棵树燃烧了起来,但这棵树只能以较低的概率引燃附近的其它树,在这种情况下,即使不灭火,逐渐着火的范围也会渐渐缩小,这种状态被称作“亚临界态”;与这种状态恰恰相反的就是“超临界态”,当 σ > 1 时,如果还用森林大火来类比,就像一片燃点很低的数目组成的树林,一棵树不但可以被周围的树木点燃,而且因为远处已经着火,空气的温度上升,因此即使周围的邻居暂时还没有着火,它也可以被点燃,这种情况下,随便一点小小的火星就总是可以点燃,癫痫病人脑神经活动即是这种状况;而在亚临界态和超临界态的中间存在着临界的分支率( σ = 1),此时会出现我们熟悉的“临界态”。在临界态上,森林大火的规模是满足幂律分布的,有较小的概率产生大规模的火灾,而较大的概率产生小规模的火灾。 对于神经雪崩的时间与规模的关系,傅渥成博士给出了一个指数分布关系,其公式即: Part3 第三部分的主要内容是关于人类活动是类似于神经雪崩的过程的。本小节首先人类人类在一段时间内的活动是有一定的周期的,如工作的时候神经兴奋,下班后神经活动减弱,晚上娱乐的时候神经再次兴奋等等,这种变化有一定的规律,而对比于患了抑郁症的人,可以看出其神经活动非常不规律,忽高忽低。但是通过数据统计和建模,可以看出人类活动与雪崩效应是有关联的。 人类活动 雪崩效应 主讲人简介 傅渥成,物理学在读博士,知乎深度用户,知乎盐Club2014荣誉会员。主要研究方向为统计物理及其在生命科学问题中的应用,关注复杂系统等领域的最新进展,曾作为中国博士生代表参加在德国林岛举办的诺贝尔奖获得者大会。 微信号:生命的设计原则 知乎:http://www.zhihu.com/people/fuwochen 《临界》一书地址如下: 亚马逊:http://www.amazon.cn/临界-智能的设计原则-傅渥成/dp/B015YVCWQO/ 豆瓣读书:http://read.douban.com/ebook/13943314/

Continue reading

《临界:智能的设计原则》读书会第四期 时间:2015年12月5日(周六)14:00~17:00 地点:南京大学鼓楼校区费彝民楼A座409 读书会视频:点击这里http://weixin.duobeiyun.com/room/jz20de330956c9404a80a7f9ffcae3a3ab 主讲人简介 傅渥成:物理学在读博士,知乎深度用户,知乎盐Club2014荣誉会员。主要研究方向为统计物理及其在生命科学问题中的应用,关注复杂系统等领域的最新进展,曾作为中国博士生代表参加在德国林岛举办的诺贝尔奖获得者大会。 微信号:生命的设计原则 知乎:http://www.zhihu.com/people/fuwocheng 我从10月24日起至12月5日,在王成军老师的帮助下,一共举办了四次关于我自己写的《临界:智能的设计原则》的读书会。本周的第四次,也是这次活动的最后一次,主题是对前几期读书会内容的总结和对未来的展望。 首先回顾了一下之前几次读书会提到过的一些内容。在前几次的读书会中,我们讨论了为什么「临界」是一个重要的问题,介绍了「临界」与单粒子、多粒子问题的「智能」之间的联系,并说明「幂律」是「临界」的一个重要标志。众所周知,关于「幂律」本身已经有了许多研究,我们希望从幂律出发,更进一步,深入到多个幂律背后隐藏的标度关系和在幂律背后的一些关联性来对各种复杂系统现象进行研究。例如,人类的语言统计满足Zipf 定律,但Zipf 定律却不是语言的本质特征,各种各样的自然语言处理(NLP)方法揭示出了语言中隐藏的一些限制条件和关联性,我们在研究各种自然现象的幂律时,也应该有类似的考虑——从这个意义上来讲,我们超越幂律,是在进行广义的「对大自然的语言进行处理」。 具体地来讲,前三讲中我们讨论了以下问题,包括: (1)信息熵、互信息和观念动力学 (2)单粒子的「智能」:因果熵力和「临界」的关系 (3)多粒子的「智能」:关联函数和标度无关的涨落 (4)对涨落进行数据分析:包括对关联矩阵进行社区识别和转移熵的有关应用; (5)对临界的数据进行更全面的分析的一些方法(数据重排作为零模型、分析等待时间跟强度之间的关联等等) (6)神经中的雪崩和人类的行为(例如运动)的相似性,与临界有关的一些标度关系。 在简单回顾了这些内容之后,我们接下来继续介绍了与神经有关的一些模型。 讨论的第一个问题是「通往临界的适应性」。讨论的是今年 Woodrow Shew 等人发表在 Nature Physics 上的一个工作。他们对大脑切换到另一工作状态的过程重新设计了实验。他们在实验中用到的是乌龟的视皮质(turtle visual cortex),而这一部分神经仍然与眼睛相连,从而可以接受外界的刺激。在这个实验中,乌龟的眼睛可以看到外界的「影片」,即不断受到不同的外界刺激。影片的初始部分并没有信号,而从某一个时刻开始,影片开始播放,这相当于提高了这一神经网络的「输入速率」。实验结果表明:那些初期的雪崩并没有呈现出完美的幂律特征,而是有相对较大的概率出现规模较大(且持续时间较长)的雪崩,不过当达到了适应之后,雪崩现象的统计会呈现完美的幂律分布。这一工作暗示了这样一个事实,当大脑突然以高频率接受某一类刺激开始工作时,它通常不能马上达到临界状态,而是会从「超临界」逐渐适应到临界,临界性是生物体「适应性」的目标。 讨论的第二个问题是「临界的大脑」何以可能。这一部分主要介绍了 Munoz 等人关于大脑与 Griffiths 相有关的一些工作。对于那些模块化、层级化的网络结构,「临界」不再是唯一仅有的一个「临界点」,而是会在相当大的一部分参数取值的区域内出现类似「临界」的「相」。而根据大脑的连接组(connectome)进行分析,我们的神经网络(也包括动物的神经网络,例如线虫等)正是层级化和模块化的。这种结构的特性使得临界性不再需要进行过于精细调节的优化就可以很自然地实现,即在一个较大的分支率取值范围内都可以形成类似「临界」的效果。这种在模块化、层次化网络中表现出来的类似「临界点」的「相」叫做 Griffiths 相。我们还用一个「两模块」模型简化的讨论了这一问题。这个讨论的结果告诉我们大脑的拓扑结构对于大脑的临界是重要的。 第三个讨论是接下来的一个延伸。我们接下来思考一个这样的问题:拓扑真的是重要的吗?我们首先介绍了与生物异速生长标度律有关的一些结果,并介绍了 Frank 和 Murell 等人基于树状结构进行的一些分析结果。对于生长问题,从流的效率的角度来看,拓扑是很重要的。接下来我们介绍了 Kaneko 等人对细胞递归生长的研究,这一分析中需要预先设定一个细胞内的化学物质催化网络,随着物质扩散系数的不同,细胞生长的速率会有些不同,存在一个临界的扩散速率让细胞增殖的速率最大化(与此同时,子代跟亲代的相似性也是最大化的)。此时如果来看细胞内各种物质的含量,会发现物质的含量排序也会出现 Zipf 律,这种 Zipf 律暗示了存在着催化的级联——排名靠后、含量较少的那些化学物质催化了排名比它们靠前且含量更多的化学物质的反应。这种 Zipf 律在许多生物体内都有观察到。不过介绍这一工作我们主要想说的结论是:虽然生物体内的生化网络大多也是 Scale-free 的网络,但催化的级联是与网络的拓扑无关的结论,这背后所蕴含的道理比从 Scale-free 的网络出发得到的结论要更深刻和普遍一些。 这几次读书会讨论的内容不是针对某些具体问题展开研究的完整的路线图,而是像地图集一样列举了一些复杂系统研究领域的若干有趣的问题。这些问题有的是从设计原则出发进行理论思考的,也有的完全是数据驱动的。虽然简单的模型是物理学家的最爱,但在这个数据大量产生的时代,关注数据同样非常重要。我们介绍了复杂系统研究中的跨学科问题,并且讨论了多尺度的一些分析方法,但最后我们所介绍的 Kaneko 的研究还暗示我们,可能需要考虑一些(我称之为)「跨范式」的研究。例如同样考虑最快速的生长,从网络的角度出发,会考虑流效率和网络的拓扑,然而从基本的设计原则出发,不对网络拓扑进行假定,仍然可以得到化学物质催化的级联。真实的生物系统中,化学物质催化的级联跟 Scale-free 网络可能是同时产生的,将这两种分析问题的范式进行结合可能是非常有意义的问题。

Continue reading

计算传播网2015改版初步完成 寻找可计算化的基因。计算传播学简介 (点这里阅读)。基因是生物学飞跃的原因,货币是经济学发展的关键。人类传播行为所隐藏的计算化“基因”是什么? 人类不应停止对永恒的普适法则的追寻,不仅在学术,而且在生活中,如康德所言:A person acts morally when he or she acts as if his or her conduct was establishing a universal law governing others in similar circumstances. 计算传播学网站致力于寻找传播学可计算化的基因、学习和传播可计算化思维/方法(电子化数据收集能力、编程能力、数学建模能力、网络分析、文本挖掘)、了解和训练计算传播学的社会化应用方法(数据新闻、计算广告、可视化等)。 计算传播网是计算传播学社区的主要阵地之一(http://computational-communication.com/),2011年是计算传播学提出的时间节点,互联网挖掘实验室成员提出'computational communication’的概念,并建立了计算传播学谷歌邮件组。 2012年建立了豆瓣计算传播学小站,这是计算传播学社区建立的起点,以社区的形式吸引活跃用户参与编辑工作,确立了计算传播学主要分为七个功能板块:两个研究领域(传播网络分析、媒介文本挖掘)、两个应用领域(数据新闻、计算广告)、两类研究方法(数学模型、编程工具),以及开放数据 2013年,互联网挖掘实验室推出了一系列的计算传播研究工作坊,这是计算传播研究的制度化发展的重要节点。2014年12月,计算传播学实验中心作为第一个计算传播学研究机构正式在南京大学建立。计算传播学实验中心于2015年筹备召开了第一次集智“注意力科学”年会,并开始参与一些计算社会科学为主题的国际会议。2015年11月,为了更好地容纳计算广告与数据新闻等产业应用,更名为计算传播网。新版网站建立在阿里云端,并正式经过了ICP备案(京15060397号),真正开始贯彻编辑委员会制度,为计算传播学社区服务。 我们是一个社区。凡对计算传播学和计算传播应用感兴趣者,欢迎加入微信群,我们更欢迎你成为内容贡献者,网站编辑每个月需贡献不少于一篇文章,竞选主编需要贡献四篇文章以上,且需要编委会投票半数以上通过。请发邮件至:[email protected]

Continue reading

《数据新闻》2015课程:定位、内容、学生作品 2015年秋季第一次《数据新闻课程》结束,共有68位同学选修了该课程。数据新闻是计算传播学的重要应用领域,对于媒体融合时代的新闻业而言,数据新闻使得新闻业回归新闻的本质:提供有效的社会知识,有助于新闻业在转型的阶段重塑新闻专业主义。 此次课程贯穿了数据新闻的全过程,包括数据的收集、清洗、分析、呈现,尤其注重数据驱动的互动可视化。该课程以Github作为教学辅助平台,选课同学通过github提交作业,平均不到两周就需要完成一次课程作业,同时每个小组需要分享数据新闻阅读材料、制作微议题排行榜,并最终完成期末小组大作业。 数据新闻课程2015 数据新闻作品 伍仁组, 2014全国cpi desert, 商品房销售价格 李易峰太太团, 失业?失业?还是失业? kcll, 看懂一场比赛:2015亚锦赛决赛数据 luckylucky7, 2015年中国公益慈善组织排行榜 睡不够天团, 中国文化创意产业经济近年来趋势发展 3L, “二孩政策”对中国人口的影响 我没话说, 中小城市缓解交通压力的创新 小黄人, About Cancer 学沫联盟, 2015年Q3第三方支付市场分析报告 靠谱?小组, 电影票房的那些事 底线五人组, 2015年十一黄金周旅游报告 孔舒越, 钱都花哪儿去了?2015年中国社会消费品零售成绩单 逼格小分队, 二胎政策解读 DJ-HIGH, 爱我你怕了吗?——来自二线城市的自白 什么都不会, 2015全国大学就业去向调查 黄浩, 湖北省黄石市15年一、二手成交基本状况 Processing编程设计作品 伍仁组 , 咸蛋超人 desert, 咸蛋超人 李易峰太太团, 大白 kcll, 失败的灰色 luckylucky7, 加油咸蛋超人 睡不够天团, 没睡醒的兔子 3L, 咸蛋超人 我没话说, 飞机超人 小黄人, 橙色超人 学沫联盟, 熊猫超人 靠谱?小组, 巨大猫头鹰 底线五人组, 长臂超人 孔舒越, Lily 逼格小分队, 咸蛋超人 DJ-HIGH, 外星人, 张小盒 什么都不会, 进击的超人 黄浩, 乌龟超人 About

Continue reading

AdMaster与奥美数据科学实验室洽谈合作 2016年1月11日下午2点,AdMaster精硕科技项目经理、我校07级校友吴益鹏来到费彝民楼A座307奥美数据科学实验室,与实验室主任王成军老师及实验室同学们洽谈合作事宜。 首先,吴益鹏围绕下图向实验室成员介绍了当前互联网计算广告领域的生态圈和行业现状。 该图源自于@RTBChina 接下来吴益鹏为大家简单介绍了AdMaster及其主要的业务。AdMaster是领先的营销数据技术公司,利用先进的大数据技术帮助品牌指导营销策略并预先量化营销效果。AdMaster架起了品牌、广告主与消费者之间的桥梁,是贯穿各行业和领域的数据枢纽。它实时日监测并分析来自数字电视、电脑、智能手机和平板电脑的线上广告曝光量数据高达50亿次。 通过监测和分析不同行业的品牌在多种平台上的数字营销投放,AdMaster已经建立了行业标准、媒介规划工具,并积累了丰富的实践案例,帮助品牌实现数字营销投资收益的最大化。 AdMaster成立于2006年。发展至今,现已为超过80%的国际、国内品牌提供数据服务,品牌范围覆盖各行各业。 AdMaster的网站主页:AdMaster精硕科技 最后,围绕当前实验室的一些课题,如微博上信息传播的门槛、基于HITS算法的微博公共事件及公众人物排行榜等,吴益鹏与实验室老师同学们做了较为深入的交流,并与王老师就合作的问题达成了一些初步的思路,主要的开展方式为先进行一些尝试性的合作研究、邀请AdMaster来为南大开设讲座以及参与建设计算广告学相关的课程教学等。 注:吴益鹏简介 吴益鹏于2011年本科毕业与南京大学数学系,后在宝洁公司工作了3年,现在在AdMaster工作,他的个人主页是:alexwu.biz

Continue reading

论文发表:注意力网络的标度关系 We use clicks as a proxy of collective attention and construct networks to study the temporal dynamics of attention. In particular we collect the browsing records of millions of users on 1000 Web forums in two months. In the constructed networks, nodes are threads and edges represent the switch of users between threads in an hour. The investigated network properties include the number of threads N, the number of users UV, and the number of clicks, PV.

Continue reading

项目:新闻地图1.0版本发布 About News Map is built upon cartogram.js (a JavaScript implementation of an algoritm to construct continuous area cartograms ©1985), d3.js and colorbrewer . This visualization combines TopoJSON -encoded boundaries of the Chinese provinces with GDP data from National Bureau Statistics of the People’s Republic of China to size each province proportionally. Designed and built by Computational Communication Collaboratory , School of Journalism and Communication, Nanjing University. 新闻地图1.0版本由计算传播学实验中心发布,从时间、空间、事件多个维度综合展现了新闻视野中的世界,网络地址为:http://ccc.nju.edu.cn/newsmap(PC端浏览更流畅)。新闻地图建立在 cartogram.js (一个应用 算法构建连续性区域统计地图的javascript库 ©1985)、 d3.

Continue reading

实验中心与中数媒介研究有限公司展开合作 2月29日,计算传播学实验中心成员王成军、陈志聪、刘磊、周纬、秦强、朱静怡访问了中数媒介研究有限公司,与中数媒介有限公司王华、孔令浚、徐萍、王桂芹、宦琦等就进一步展开合作问题进行了深入了讨论。讨论议题包括:有线电视收视和广告数据分析、互联网用户行为分析、有线电视用户的抽样调查(根据登记手机号码)、“中数媒介大数据研究中心”成立事项等问题。双方同意通过成立一个研究中心来进一步加深合作,并拟定了研究中心的名称“中数媒介大数据研究中心”,另外对具体的成立事宜进行了规划。 南京中数媒介研究有限公司(以下简称中数媒介研究)成立于2010年,由江苏省广播电视信息网络股份有限公司(简称江苏有线)全资子公司江苏有线数据网络有限责任公司、南京遂达科技有限公司、南京图格科技发展有限公司三方出资组建。中数媒介研究顺应当前智能数字电视普及大潮,广电双向网络快速发展、互动电视业务迅猛推进的背景下,专注于数字电视用户行为数据监测及深度挖掘处理,采用全球领先的数据采集和处理技术,并对采集到的全用户海量数据进行科学的筛选、整理与分析,并在此基础上对长时段及多地域数据进行深度挖掘。在国内电视收视调研领域中,中数媒介研究是首家实现全用户收视行为监测及调研数据分析的公司,掌握并引领国内电视收视调研技术发展方向,并将对传统收视调研行业产生极大的影响。中数媒介研究的企业经营范围:可以为行政管理部门决策提供参考,为电视网络运营商、电视台、电视节目提供商、广告主、广告代理机构及相关研究机构提供数据支持和咨询服务。

Continue reading

论文发表:Mining Social Entrepreneurship Strategies Using Topic Modeling Mining Social Entrepreneurship Strategies Using Topic Modeling Abstract Despite the burgeoning research on social entrepreneurship (SE), SE strategies remain poorly understood. Drawing on extant research on the social activism and social change, empowerment and SE models, we explore, classify and validate the strategies used by 2,334 social entrepreneurs affiliated with the world’s largest SE support organization, Ashoka. The results of the topic modeling of the social entrepreneurs’ strategy profiles reveal that they employed a total of 39 change-making strategies that vary across resources (material versus symbolic strategies), specificity (general versus specific strategies), and mode of participation (mass versus elite participation strategies); they also vary across fields of practice and time.

Continue reading

会议论文:香港“占领中环”运动中的新闻报道 实验中心成员王成今年参加了于北京举行的第二届中国舆论学论坛,并发表关于占领中环运动的舆论研究论文。由中国新闻史学会舆论学研究专业委员会主办、人民网舆情监测室承办的第二届中国舆论学论坛26日在北京开幕。来自全国新闻舆论学界的300余位专家学者会聚一堂,围绕舆论学理论建构、网络舆情监测引导、舆论生成机制与演变规律、国家形象与对外传播等12项议题展开研讨。在中国新闻史学会的支持下,“中国新闻史学会舆论学研究专业委员会” (CAPOR)于2015年12月19日正式挂牌成立。2015年12月19日-20日,首届中国舆论学论坛成功举办,60多所高校以及中国社科院、上海社科院等五家社科院的130多名领导和专家参加。论文摘要如下: 参与者、议题与行动: 香港“占领中环”运动中的新闻报道 王成军、党明辉、顾慧君 南京大学新闻新闻传播学院,计算传播学实验中心 [email protected] 摘要:从舆论演化的讨论模型出发,利用文本挖掘和时间序列相结合的方法分析 了“占领中环”运动的新闻报道,为社会运动新闻演化建立了一个多变量的时间 序列模型。研究发现:媒介所展现的“占中运动”综合展现了舆论演化的整个过 程;新闻中的主要参与者主要包括反对派激进团体、青年学生和其他参与者(特 首、中央、记者);新闻主要关注的是普选和政改相关的政治议题,其次是法制 议题;本研究证实了参与者、议题、行动对于媒体舆论演化的推动作用,但是媒 体报道对于公众注意力仅仅具有较弱的第一层议程设置功能。 关键词:新闻媒体;占领中环;社会运动;讨论模型;舆论形成 Participants, Issues, and Actions: The News Report of Hong Kong Occupy Central Movement Abstract: In the perspective of computational social science, we analyzed the news reports of Occupy Central using the methods of text mining and time series analysis, and built up a multivariate time series model for the elements of news content on social movement.

Continue reading