导图社区 《链接:商业、科学与生活的新思维》
艾伯特·拉斯洛·巴拉巴西的重磅力作,详细讲解了网络的的形成及如何用网络的思维来思考问题。本书以大量的科学研究为基础来介绍网络、链接的各种属性以及在商业、科学方面的潜在应用。是不可多得的好作品。
编辑于2020-12-04 13:25:12《链接:商业、科学与生活的新思维》
书籍信息
作者:艾伯特·拉斯洛·巴拉巴西
出版时间:2013-7-1
首次出版时间:2003年
出版社:浙江人民出版社
笔记说明
个人思考
摘抄
本书主旨
本书的主旨很简单:让人们学会从网络的角度来思考问题。本书将探讨网络是如何形成的、网络是什么样子的、网络是如何演化的。
第一链:网络让世界变得不同
还原论
“人们曾经拆卸过宇宙,却不知道该如何将它再拼起来。”
还原论(Reductionism)是主张把高级运动形式还原为低级运动形式的一种哲学观点。它认为现实生活中的每一种现象都可看成是更低级、更基本的现象的集合体或组成物,因而可以用低级运动形式的规律代替高级运动形式的规律。
拆解是一个还原更加简单的过程,因为拆解注重的是组成成分,而还原的时候需要具备系统观点,寻求各个部件之间的相互关系。
复杂是简单的集合体,我觉得这是我们相信基本的物理理论都应该具有简洁的形式的哲学依据。比如三大牛顿基本定律,质能关系等。
自然界的神奇之处在于它利用了包罗万象的自组织法则,但对我们而言,这个法则仍然是个未知之谜。
随机网络
随机网络是指通过随机连接节点搭建起来的网络。在随机网络中,链接是完全随机放置的,所有节点有相等的机会获得链接。只要网络足够大,几乎所有节点拥有的链接数都基本相同。因此,随机网络是一个高度平等的网络。
欧拉桥的问题
欧拉证明了哥尼斯堡不存在一条路径能够走遍所有7座桥而不重复,他的证明基于一个简单的观察:在网络上沿着边“旅行”时,拥有奇数条边的节点,要么是旅行的起点,要么是旅行的终点。走遍所有桥的连续路径只有一个起点和一个终点。因此,如果图中有多于两个节点拥有奇数条边,就不存在前文所述的路径。而哥尼斯堡的图中有四个这样的节点,所以人们找不出他们希望找到的路径。对于我们而言,欧拉的证明最重要的意义在于,这样的路径是否存在不取决于我们寻找路径的能力,仅取决于图的性质。
这是解决问题的一种方式,即当问题始终无法找到解决方案时,可以试着证明问题本身无解。另一个角度是,从一个问题出发,寻找一类问题的特征,抓住一类问题的基本属性之后,找到确切的解决方案便只是时间的问题了。
相变、渗流、社区成型
当添加了足够多的链接使每个节点平均拥有一个链接时,奇迹出现了:一个独一无二的巨大节点簇出现了。也就是说,大多数节点都是这个节点簇的一部分,无论从哪个节点出发,沿着节点间的链接前行,都能够到达大多数其他节点。这个时刻就是你那瓶昂贵的葡萄酒不再安全的时候,因为巨大的节点簇使得葡萄酒的消息可以传递到每一个人。数学家们将这个现象称为巨大连通分量的涌现,巨大连通分量中包含了大部分的节点。物理学家把这个现象称为渗流(percolation),并把巨大连通分量的涌现称为相变(phase transition),这和水结成冰的瞬间是类似的。社会学家们会说,客人这时刚好形成了社区
尽管不同的学科有不同的术语,但他们一致认为,随机选择网络中的节点对进行连接时,会出现一些特殊的现象:当添加的链接数超过一个临界值时,网络将发生剧烈变化。在到达这个临界值之前,网络中包含许多不连通的小节点簇,每个节点簇对应只在内部进行交流的一组人。到达临界值之后,网络中将出现一个巨大的节点簇,几乎所有人都被连接在这个巨大的节点簇里。
这是非常重要的概念,可以横跨多个领域的基本概念。这就是我们经常说的现象背后的本质。
平均链接数
“1”是这里的阈值。如果节点拥有的平均链接数少于1,网络将破碎成相互间没有联系的小节点簇;如果每个节点拥有的链接数超过1,网络就可以远离破碎的危险。
这里的认识应该是只算一边的,即A认识B,B认识C,C认识A, 这样平均下来就是每人有一条链接,但每个节点与至少两个其他节点链接?所有节点可以形成一个闭环网络,信息可以从一个节点传递到所有节点。
数学家
为什么埃尔德什和莱利这样世间罕见的智者选择将网络涌现建模成完全随机的过程呢?答案很简单:他们从没有打算提出一个网络形成的通用理论。他们更多地着迷于随机网络的数学之美,而没有关注模型忠实表达网络特性的能力。在他们1959年那篇开创性论文中,他们的确提到“图的演化可能是某种通信网(铁路、公路、电力网络系统等)演化的一个相当简化的模型。”但是,除了这次对真实世界的偶尔涉足之外,他们在该领域的工作,与应用几乎没有任何关系,完全受他们对有关问题数学深度的好奇的鼓舞。
数学家总给人这样一种感觉,他们构建了一座大厦,然后沉迷于大厦的装修,大厦越大越少有人问为什么要有这样的大厦。很多人终其一生都在研究这座大厦里面的内容,但与眼下的现实似乎没有一点联系。但他们的工作,很可能只是现实社会还没有追上。就像一群人在沙漠城市里修建了一个精致的诺亚方舟,或许眼下无用滑稽,但后来发了滔天洪水,人们才发现这架方舟的真正价值。
随机网络的平均间隔
上述论断可以很容易地转化为数学公式,该公式使用关于节点数目的函数来预测随机网络的节点间隔。[插图]d的值肯定不会超过N。因此,让kd=N,我们得到了一个能够很好适用于随机网络的简单公式。该公式告诉我们,随机网络中平均间隔遵循公式d=log N / log k。" />网络间隔之所以小,和公式中出现的对数项有关。事实上,即使是非常大的数,其对数也非常小。以10为底,10亿的对数仅为9。例如,如果我们有两个网络,节点平均链接数均为10,而其中一个网络的规模是另一个的100倍,那么,较大网络的节点间隔仅比较小网络的节点间隔大2。对数让大型网络变小了,在我们身边形成很多小世界
如果按照这个算法,60亿地球人的平均距离是5.5,那么一个节点的平均链接数约为60,也就是是说,粗略估计,每个人平均认识60个不同的人。 但社会学家估计的数据是每个人认识的人平均在200-500个,以低值200个算下来应该是4.25左右,所以后文也说到六度分隔实际上是一个理论上的上限值才对。更多情况下,人与人之间的实际链接应该是小于6的。
弱关系与强关系
在《弱关系的优势》中,格兰诺维特提出了一个乍听起来很荒谬的观点:无论是找工作、获取消息、开餐馆,还是传播新潮流,弱社会关系比我们所珍视的强社会关系更重要。他指出,每个普通人周围的社会网络结构(他称之为Ego,即以自己为中心的社会圈)相差无几。

弱关系在我们和外部世界互通消息方面发挥着至关重要的作用。在找工作的时候,我们的密友往往帮不上忙。因为他们和我们处在同一个圈子里,他们接触的信息和我们一样。为了获取新信息,我们必须使用弱关系。事实的确如此,对管理岗位的工人而言,在获得职位信息时,通过弱关系获得信息的可能性(27.8%)要大于通过强关系获得信息的可能性(16.7%)。弱关系,或熟人关系,是我们连接外部世界的桥梁。这些人和我们在不同的地方活动,因此,我们能够从他们那里获取到从密友处无法获得的信息。
弱关系是我们触碰外部世界的触角,因为弱关系是新的信息的主要来源。弱关系形成的网络应该是图中相似的分形结构。
共振、从众、趋同
例如,1999年,在麦迪逊广场花园,当传奇冰球运动员韦恩·格雷茨基(WayneGretzky)从纽约流浪者队退役时,观众鼓掌向他致敬,起初无组织的鼓掌最终自发地变成同步的掌声。这种自发而神奇的同步鼓掌,是自组织现象的绝佳例子。自组织现象遵循着物理学家和数学家深入研究过的严格定律,某些种类的萤火虫也遵循这些定律。在东南亚,常有数百万萤火虫聚集在高大的红树林里,周期性地发光。突然,所有的萤火虫开始同时发光,同时变暗,将灯塔一样的树冠变成一个巨大的脉冲式电灯泡,几公里外都能看到。这种奇妙的趋同现象在自然界中非常普遍。例如,正是趋同现象让数千个心脏起搏细胞一起工作,使长期共同生活的女性具有趋同的月经周期。
动物界的自组织现象,我相信植物界也很容易产生这种现象。那非生物呢?
团聚系数
实际情况是,我们都是某个节点簇的一部分,同一个节点簇里的人相互认识。因此,我的两个好朋友必然也相互认识。为了找到社会聚团特性的证据,并让数学家和物理学家接受,我们需要度量聚团性。为此,瓦茨和斯托加茨引入了一个被称为聚团系数的量。假如你有4个好朋友。如果他们彼此也是朋友,两两之间存在一个链接,那么总共存在6个朋友链接。也有可能,你的一些朋友彼此不是朋友,那么他们之间的朋友链接数小于6,可能是4。在这种情况下,你的朋友圈的聚团系数是0.66,计算方式为:用你的朋友之间的实际朋友链接数4,除以他们之间最多能够形成的朋友链接数6。
如果弱关系如此重要,那么可以想到,一个团簇中拥有更多外部弱关系的节点将是这个团簇中非常重要的节点。而一个拥有更多弱关系的团簇也将能更快速地获取和更新外部信息资源。
聚团系数,一种形容朋友圈相互熟识的系数
数学家的团聚
我和维谢克、洛瓦兹、内达、舒伯特以及郑浩雄一起,用1991—1998年发表的论文,将这些数学家们连接在一起,形成了一个高度交织的网络。在该网络中,70975位数学家通过超过200000篇合作发表论文的链接连接在一起。假如数学家们是随机选择合作者的,根据埃尔德什和莱利的理论,最终形成的随机网络的聚团系数将非常小,大约为10–5。然而,我们的计算表明,实际合作网络中的聚团系数要高约10000倍,这证明了数学家们不是随机选择合作者的。相反,他们组成了一个高度聚团的网络,这种情形和格兰诺维特观察到的人类社会基本相似。
这里的计算应该是基于每篇论文只包含两个不同的人,则一篇论文产生一个链接,共20万个链接。而70975个数学家最多能形成70975*70974/2≈25亿,则聚团系数为20万/25亿=0.00008,即10^-5的量级。 而真实的是一万倍,即10^–1的量级,说明有效链接数约为2.5亿,假设每篇论文的人数都相同,且同一篇论文的作者相互熟识,再假设每个作者发表的总论文数相同且每次只与不同的人合作,那么,20万篇论文共70975个数学家,每篇论文评论约有3个不同的作者。也就是一个团簇至少有3个节点,三条有效链接,20万个团簇才60个团簇内链接,更多的链接来自于团簇与团簇之间,也就是一个作者与其他作者的合作。按照2.5亿个链接估算下来,平均每个节点簇需要贡献有1258个链接,假设每篇文章有10个作者,则平均每个作者需要合作发表约120篇文章。
聚团,复杂网络的普遍性质
少量链接的作用
一个能够真实反映当今社会的模型,一定允许远距离链接的存在。在前面描述的聚团模型中,我们很容易实现这一目标,只需要在一些随机选择的节点间添加少量的链接即可。也就是说,在圈子上任意选择两个节点,在它们之间添加一条新的链接。如此一来,被选中的两个节点间的距离便降到1,而它们的直接邻居之间的距离也大大缩短了。如果添加很多这样的随机链接,便能让所有节点间的距离都缩短。
真实的网络结构中也应该有“关键链接”这样与“关键节点”同等重要的概念存在。有的节点可能虽然链接数少,但链接的距离很远,那它也可能成为缩短节点距离的关键节点之一,也将成为网络信息流通时的瓶颈。在构建网络的过程中,这样拥有长链接的节点也应该具有更多的链接数才能更加高效的分流。

该模型是埃尔德什和莱利的完全随机世界和正则栅格的优美折中:完全随机世界是小世界,却排斥朋友圈;正规栅格虽然具有高的聚团性,节点之间却相距很远。
随机小世界是节点平均拥有链接,没有聚团的现象;正规栅格每个局部都是聚团(朋友圈),但从一个聚团只能到达周围的聚团。
第二部分:复杂网络的本质
枢纽节点
就网络而言,多少不是关键。网络的真正中心位置属于那些在多个大圈子里都有位置的节点。
枢纽节点是指网络中少数连接度非常高的节点。
枢纽节点是网络中非常关键得节点,它具有非常多的链接,也将承担非常多的流量。当然,链接多但都很短的节点一定意义上应该不算是枢纽节点。关键是这个节点要链接很多距离远的其它节点才能成为大的枢纽节点。
连接者
连接者,拥有大量链接的节点
连接者是社会网络中极其重要的元素,他们引领潮流趋势、促成重要交易、传播流行时尚并帮助推广餐馆。他们是社会的连线,于轻描淡写间把不同种族、不同教育水平、不同社会背景的人联系在一起。当格拉德威尔发现连接者时,他认为自己找到了一种人类独有的特质。
超级连接者
万维网上的上述现象和人类社会类似。人类社会中,少数连接者的朋友之多超乎寻常;万维网中,少数连接数非常高的节点主导着万维网的结构,它们被称为枢纽节点。雅虎或亚马逊这样的枢纽节点的可见度非常之高,无论在哪里,我们都能看到指向这些节点的链接。但在万维网中,还有很多不受欢迎或者很少被注意到的节点,它们通过少数枢纽节点连在一起。
自身特性很强的节点不一定就是最关键的节点,因为特性太强的节点一般只会链接非常高的节点,而与低端的节点相距太远。最关键的节点应该是那些既跟高端节点簇有很多链接,也与许多高端节点簇有很多链接。比如以城市为例,北京的链接中心位置可能比武汉的要低,虽然北京是首都。
科学家能够研究的大多数复杂网络中都存在枢纽节点。枢纽节点无处不在,是复杂互联世界中的普适组件。
是什么让一个节点成为枢纽节点的呢?随机性还是必然性?
实际上,我们已经发现枢纽节点不是我们这个相互联系的宇宙中的偶然现象。相反,枢纽节点服从严格的数学规律,
幂律分布
幂律分布是一条没有峰,且不断递减的曲线,它最突出的特征是大量微小事件和少数非常重大的事件并存
一个大的头部和长长的尾部,二八定律,马太效应,长尾理论都是幂律分布的现实体现。
幂律最突出的特征不是有很多小事件,而是大量微小事件和少数非常重大的事件并存。但这些非常重大的事件绝对不可能出现在钟形曲线中
无尺度网络
无尺度网络是遵循幂律度分布的网络。网络中大多数节点只有很少几个链接,它们通过少数几个高度连接的枢纽节点连接在一起。在形状上,无尺度网络很像航空交通系统,很多小机场通过少数几个主要的交通枢纽连接在一起。
在随机网络中,分布的峰意味着绝大多数节点拥有同样数目的链接,链接数偏离平均数的节点极其罕见。因此,随机网络的节点连接度具有特征尺度,该特征尺度由平均节点体现,并由度分布的峰确定。相比而言,幂律度分布没有峰,这意味着,真实网络没有诸如特征节点这样的现象。
幂律分布迫使我们放弃了尺度或者特征节点的想法。在连续的层级中,无法找到一个能够代表所有节点特性的节点。在这些网络中不存在固有的尺度。这就是我的研究组把拥有幂律度分布的网络称为“无尺度”的原因。在意识到自然界大多数复杂网络符合幂律度分布之后,“无尺度网络”一词迅速渗透到和复杂网络相关的大多数学科中。

公路系统更像是规则网格网络,有聚团性但缺乏长连接。航空路线图则可以在三维尺度进行链接,缩短节点之间的距离。有选择性了,就容易产生枢纽节点,而且像是正反馈一样,链接越多就有更多节点想连入其中。
随机网络和幂律度分布描述的网络之间最突出的视觉和结构差异,可以通过对比美国的公路图和航空线路图清晰地看出。
幂律分布预言,每个无尺度网络中都有一些大的枢纽节点,是它们从根本上确定着网络的拓扑。
在完全随机的系统中,幂律极少出现。物理学家已经明白,幂律通常标志着从无序到有序的过渡。
先树立典型再逐渐调整成规则有序结构的过渡。物理相变的前奏
幂律与物理
随着物理学家仔细研究不同的系统中有序是如何从无序中涌现出来的,越来越多的幂律在相变过程中被发现。无论是液体加热后变成气体,还是铅在足够低的温度下变成超导体,物理学家从中都发现了幂律。这种从无序到有序的相变开始展现出令人惊奇的数学一致性。但问题是,没有人知道这背后的原因。为什么液体、磁体和超导体在一些临界点不见了,开始遵循相同的幂律呢?这些不同的系统之间的高度相似背后隐藏着什么呢?幂律到底和什么相关呢?
从无序状态涌现出有序,总有幂律的出现,但原因是什么?推动力是什么?
威尔逊发展了卡达诺夫提出的尺度想法,并将其变成一种强大的理论,称为“重整化”。他研究方法的出发点是尺度不变性:假定在临界点附近,物理定律在所有尺度上以相同的方式适用,尺度从单个原子变化为包含数百万行为一致原子的盒子。通过给出尺度不变形的严格数学基础,每当接近从无序到有序的临界点时,威尔逊的理论总能推导出幂律。威尔逊的重整化理论不仅解释了幂律,而且首次预测出那两个缺失的临界指数的值。他给相变金字塔添上了最后一块石头,这一成就让他赢得了1982年的诺贝尔物理学奖。
临界点附近,节点独立行动变为节点簇的统一行动,从无序逐渐变为有序。
自然与幂律
自然界往往厌恶幂律。在常见的系统中,量遵循钟形曲线,而且相关性按照指数率迅速衰减。但是,当系统被迫发生相变时,所有这一切都改变了。于是,幂律出现了——这是自然界给出的明白无误的迹象,表明混沌正在让位于有序。相变理论清清楚楚地告诉我们,从无序到有序的道路,是自组织在强有力地推动,并通过幂律铺就。它还告诉我们,幂律不仅是刻画系统行为的另一种方式,更是复杂系统自组织所独有的特性。
幂律是自组织行为将正态分布的无序状态打破变为有序过程必然出现的中间桥梁
他这里所指的双对数是科学家们从实验数据中发现幂律时常用的坐标系
双对数坐标系可以将幂函数曲线转变为直线,对于拟合分析十分直观
普遍性理解的所有重要发现。他这里所指的双对数是科学家们从实验数据中发现幂律时常用的坐标系。实际上,在20世纪80年代和90年代,在物理学家、生物学家、生态学家、材料科学家、数学家和经济学家看到自组织存在的地方,就有幂律和普遍性出现
无尺度模型
真实网络由两个定律支配着:生长机制和偏好连接。每个网络都是从一个小的核开始,通过添加新的节点而增长。然后,这些新节点在决定连向哪里时,会倾向选择那些拥有更多链接的节点。无尺度模型将生长机制和偏好连接结合在一起,首次解释了真实网络中观测到的无尺度幂律。
生长机制
尽管种类多样,但大多数真实网络具有共同的基本特征:生长机制。
网络是动态生长起来的,不是预先布置好节点再开始链接的,这确实是非常重要的一个思维转变
好莱坞内外的人都知道一个看似矛盾的观点:为了得到好的角色,你需要先出名,而想出名又需要先得到好的角色。
如何切入这个正反馈循环是非常关键的。所以,首先需要创造大的外部环境,然后需要找到一个生长核。这是我们想要做的事能否进入正反馈循环的关键。
我们发现,真实网络由两个定律支配着:生长机制和偏好连接。每个网络都是从一个小的核开始,通过添加新的节点而增长。然后,这些新节点在决定连向哪里时,会倾向于选择那些拥有更多链接的节点。
支配真实网络的两大定律,生长机制和偏好连接。这里面我个人觉得要分开来看,并且必须添加一个“网络所处环境适宜”的条件。生长机制的出现是决定了不平等连接的前提条件,而偏好连接也是一种行为。只有生长核与外部环境适宜时生长机制才能起作用,只有连接行为不受限时偏好连接才能正常进行。那问题来了,如果改变生长机制或者偏好连接受限会出现什么?另外,生长机制是否决定了新节点的数量将是指数型增加但枢纽节点却是幂律变化?
A.生长机制:每个阶段,我们向网络中添加一个新节点。该步骤强调网络每次增加一个节点。B.偏好连接:我们假定每个新节点和已经存在的节点之间形成两个链接。选择给定节点的概率正比于该节点拥有的链接数。也就是说,如果有两个节点可供选择,其中一个节点的链接数是另一个的两倍,链接数多的节点被选到的概率也是另一个节点的两倍。

这个无尺度模型包含的两个基本假设:生长机制和偏好连接的假设要注意,特别是偏好连接的假设是新节点的连接选择是与已有节点的链接数量的线性正比关系。这里的线性很值得考究。新节点在选择连接其它节点时为什么不会也是幂律分布呢?即有更多链接数量的节点被选中的概率是幂次倍于数量少的节点的。我甚至觉得这样更靠谱,因为真实网络的形成既然都符合幂律分布,那这里面的行为符合幂律分布而不是线性分布的可能性更大。
生长机制让资历老的节点具有明显的优势,让它们拥有最多的链接
让网络模型有了时间轴
偏好连接引入了富者愈富的现象,帮助连接度较高的节点得到更多的链接,而后来者的链接数会相应地减少。
一定还要注意,选择的概率这个关键性操作,如果不是概率而是百分百决策,那这个网络模型只会产生两个连接所有节点的超级枢纽。而为什么有选择概率,这就非常值得深究了。也是上面我说的偏好连接为什么是线性而不是其它函数关系?这个概率函数的极端一个是y=1, 即形成两个超级枢纽;一个是y=random即只有生长机制没有偏好连接,所有连接都是随机的。但真实网络肯定是取中间状态的,偏好一词决定了这样的网络应该是有一定推动力的,不一定是人为的,但一定是环境中的资源驱动的,比如热量,能量,利益。这个选择概率函数究竟是什么样的呢?非常之好奇
连续介质理论
富者愈富现象自然导致了真实网络中观察到的幂律。事实上,我们进行的计算机模拟表明,对于任意的k,具有k个链接的节点数目遵循幂律分布。刻画幂律分布的参数,即度指数,其精确值也不再神秘。使用数学工具——这里是指我们提出的连续介质理论(continuum theory),便能用解析方法计算出度指数的值。实际上,根据偏好连接,每个节点吸引新链接的速率正比于它目前拥有的链接数。借助这个简单的观察,我们能够提出一个简单的方程来预测节点随着网络增长所能够获得的链接数。这个办法使我们能够用解析方法计算出度分布,并证实度分布的确遵循幂律[插图]-3。" />。
为什么是线性
假设节点随着年龄增加逐渐丧失吸引链接的能力,门德斯和多罗戈夫切夫指出,逐渐老化没有破坏幂律,只是改变了度指数,从而改变了枢纽节点的个数。来自波士顿大学的保罗·克拉皮夫斯基(Paul Krapivsky)和希德·雷德纳,与来自墨西哥的弗兰索瓦·列夫拉兹(FrancoisLeyvraz)一起泛化偏好连接。他们认为,与给定节点连接的概率不仅是简单地和该节点拥有的链接数成正比,而是可以遵循更复杂的函数。他们发现,这样的扩展会破坏掉刻画网络的幂律。
有趣,可研究的点确实不少。但没想到刚才提出的问题,即偏好选择函数的泛化研究结果竟然是会破坏网络的幂律分布。为什么?为什么非得是线性?
这在几年前是无法想象的。我们知道了,内部链接、重连、节点和链接的删除与老化、非线性因素以及很多其他影响网络拓扑的过程,都可以无缝地整合到一个令人吃惊的网络演化理论架构中,无尺度模型是它的一个特例。
在上一章的末尾,我们提出了一个重要的问题:幂律的出现是否意味着真实网络是从无序到有序的相变的结果?我们得出的答案非常简单:网络不是处于从随机状态到有序状态的途中。网络也不是处于随机和混沌的边缘。相反,无尺度拓扑预示着,某种组织原则在网络形成过程的每个阶段都发挥着作用。这一点都不神奇,因为生长机制和偏好连接可以解释自然界所见网络的基本特征。无论网络变得多么大、多么复杂,只要偏好连接和生长机制出现,网络都将保持由枢纽节点主导的无尺度拓扑。
所以,这些真实网络不是在发生相变的临界态,而是一个动态稳定态?为什么这么特殊呢?是因为始终有一个持续的驱动力存在吗?还是说,这个网络从始至终都是这个态,而且有别于其它系统?
适应度模型
适应度模型在无尺度模型的基础上引入了竞争因素。
相当于考虑了环境中的同质个体间的环境,外部环境使得每个节点变得不同。
有些节点虽然出现得很晚,却能在很短的时间内攫取所有链接。其他节点虽然出现得早,却没有获得很多链接,未能利用其先发优势成为枢纽节点。如果我们想要解释在大多数网络中看到的激烈竞争,就不得不承认每个节点都是不同的。
要让很多节点愿意打断老节点,重连新节点,并吸引新节点的链接。这三个动作应该分开来实现。
乘积高的节点,因为这些节点更有吸引力。如果两个节点拥有相同的链接数,适应度高的节点会更快获得链接。如果两个节点具有相同的适应度,较老的节点依然具有优势。
这里应该是适应度的符号显示问题吧,按照描述,假如一个节点的适应度α0表示,有k0个链接,那么改节点被新节点连接的概率P=(k0α0)/∑(kn*αn)
比安科尼的计算首先证实了我们的猜想:适应度的出现使得先发者不再一定是最后的胜者。相反,适应度主导一切,制造和打破枢纽节点。在无尺度模型中,网络中节点的连接度按照时间的平方根增长。而适应度模型则具有截然不同的行为。它告诉我们,节点依然按照幂律t β获得链接。但是,反映节点获得新链接速度的动态指数β对于每个节点是不同的,和节点的适应度成正比。
指数关系也是有人参与的组织中一大重要数学关系。
比安科尼进行了简单的数学变换[插图],用适应度代替能量,为适应度模型中的每个节点赋予一个能级。突然间,这些计算就具有了出人意料的意义:我们看到了爱因斯坦80年前发现凝聚态时碰到的情形。这也许只是偶然,而且无足轻重。但是,在适应度模型和玻色气体之间的确存在严格的数学映射。按照这样的映射,网络中的每个节点对应玻色气体中的一个能级。节点适应度越大,它对应的能级越低。网络中的链接变成了气体中的粒子,每个粒子被赋予一个给定的能级。向网络中添加新节点,如同向玻色气体中添加新的能级;向网络中添加新链接,等同于向气体中注入新的玻色粒子。在这个映射中,复杂网络就像巨大的量子气体,它的链接就像亚原子粒子。
节点更像是一个资源位置,与能级相对应;链接必须与节点相连且是具有选择权的一方,与亚原子粒子对应。
实际上,几十年前提出的用于描述量子气体的数学工具使我们能够看到,在不考虑链接和节点性质的情况下,网络的行为和拓扑是由适应度分布的形状决定的。然而,从万维网到好莱坞,虽然每个系统的适应度分布都不同,但比安科尼的计算结果表明,所有网络按照拓扑可以分成两个可能的类别。在大多数网络中,竞争对于网络拓扑没有明显的影响。但是,在某些网络中,胜者占有所有的链接,这是玻色—爱因斯坦凝聚的明显标志。在第一类网络中,对于链接的竞争虽然激烈,无尺度拓扑却依然存在。这些网络表现出适者愈富的行为,这意味着,适应度最高的节点最终会成为最大的枢纽节点。然而,胜者的领先优势并不是很明显。最大的枢纽节点后面紧跟着几个小一些的枢纽节点,它们拥有的链接数和适应度最大的节点所拥有的链接数相差无几。在任何时刻,我们都有一个节点间的层级结构,这些节点的度分布遵循幂律。因此,在大多数复杂网络中,幂律和竞争链接并不矛盾,二者可以和平相处。在第二类网络中,胜者通吃。这意味着,适应度最大的节点占有所有链接,其他节点几乎没有链接。这样的网络具有星形拓扑,即所有节点都和一个枢纽节点相连。在这样的中心辐射形网络中,唯一的枢纽节点和系统中的其他节点存在巨大的差异。因此,胜者通吃的网络和我们前面碰到的无尺度网络截然不同。在这种网络中,单个枢纽节点和很多微小节点并存。这是一个非常重要的区别。
生态系统的高度容错性是由高度互联的复杂网络保障的。大自然似乎努力通过互联提高健壮性。对网络结构的这一普遍选择,或许不仅仅是巧合。
健壮性与脆弱性都根源于无尺度网络的结构不均匀性。虽然无尺度网络面对故障时并不脆弱,因为故障更多地影响小节点,但这种前所未有的容错性也让它付出了代价,即面对攻击时的脆弱性,因为攻击更多地针对枢纽节点。因此,无尺度网络的结构背后隐藏着阿喀琉斯之踵,即面对故障的健壮性和面对攻击的脆弱性交织在一起。
大多数具有高度容错性的系统有一个共性:其功能是由高度互联的复杂网络保障的。细胞的健壮性隐藏在精巧的调控和代谢网络中;社会的韧性源于错综复杂的社会关系网络;经济的稳定性依靠金融和监管机构构成的灵敏网络;生态系统的生命力来自巧妙设计的物种相互作用网络。大自然似乎努力通过互联获得健壮性。网络结构的这一普遍选择,或许不仅仅是巧合。
随机网络上的故障是一个逆相变的例子:存在一个临界的错误阈值,在阈值之下系统相对完整,在阈值之上网络就会分裂成碎片。
逆相变过程,(正反合思考)
我们很快就发现,我们观察到的现象并不是互联网独有的。在无尺度模型生成的网络上进行的计算机模拟实验发现,任意无尺度网络都可以随机删除大部分节点而不会引发网络分裂。毋庸置疑,对故障的健壮性是无尺度网络不同于随机网络的特有属性。
鲁棒性强是无尺度网络的本质属性
类似地,在无尺度网络中,故障主要影响大量的小节点。因此,故障不会导致网络分裂。即使随机删除的节点恰好是一个枢纽节点也不会造成毁灭性后果,因为若干个大的枢纽节点构成的连续层级仍然会保持网络的完整性。拓扑健壮性根源于无尺度网络的结构不均匀性:故障更多地影响小节点。
因为枢纽节点的分布是幂律分布的,按照帕累托定律,20%的节点承担了80%的链接任务,所以即使随机删除了80%的节点,网络自然不会碎裂,因为,删除的更多是小节点。
一方面,他们的计算解释了一个广为人知的结果:随机网络在被删除的节点达到一个临界值后会分裂成碎片。另一方面,他们发现,度指数小于或等于3的无尺度网络不存在这样一个临界值。有趣的是,我们感兴趣的大部分网络,包括互联网和细胞网络在内,都是度指数小于3的无尺度网络。因此,这些网络只有在所有节点都被删除后才会崩溃,也就是说,实际上永远不会崩溃。
度指数大于3的网络或许因为幂律分布的头部太大,也就是枢纽节点相对承担了过多的链接,所以一旦到达临界值,系统就碎裂了。但为什么刚好是3呢,这个论文得看看。
如果骇客成功地攻击了互联网最大的一些枢纽节点,其潜在破坏可能是难以估量的。这并不是互联网协议的错误设计或缺陷所造成的。这种面对攻击的脆弱性是所有无尺度网络的固有属性。
脆弱性和健壮性都是固有属性,这种无尺度网络有利也有弊。解决方法可能就是降低度指数,也就是增加大的枢纽节点数量。
无尺度网络在面临攻击时的反应类似于随机网络面临故障时的反应。但有一个重要的区别,在无尺度网络中并不需要删除很多节点才能达到这一临界点。让少数几个枢纽节点失效就可以使无尺度网络迅速分裂成碎片。
帕累托定律的那20%
可见,保护一个处于枢纽位置的物种,可以显著地改变海岸的经济和生态。
毁坏的对立面就是保护,既然枢纽节点是弱点,那就针对性的保护枢纽节点
级联故障
绝大多数级联事件都不是瞬间爆发的,故障可以在毫无察觉的情况下“潜伏”很长一段时间才开始爆发。然而,尝试降低这些级联事件的发生频率会导致不可避免的结果,发生的级联反应将会有更大的破坏性。除了以上几点,我们对级联故障的理解是非常有限的。拓扑健壮性是网络的结构特性,而级联故障是复杂系统的动态属性,这是一个尚未探索的领域。如果说还有一些尚未发现的定律在控制着级联故障,我也毫不惊讶。这些定律的发现将对互联网、市场营销等很多领域产生深远影响。
级联故障是一个枢纽节点毁坏时其承担的流量会分配给相应层级的其它节点,可能导致其它节点因过载而接连奔溃的故障。
健壮性和脆弱性是静态属性,级联故障则是动态属性
第三部分:复杂网络的影响
意见领袖的力量
辉瑞公司的研究表明,创新由创新者传播到枢纽节点,然后从枢纽节点将信息沿着大量的链接传播出去,传达给特定社会群体或职业圈子里的多数人。
创新的传递,新事物的传递
理解方面,最重要的概念性进步可能是,认识到了时尚与病毒传播的必备条件是传播率要超过临
要么超过阈值指数型增长,要么低于阈值快速消亡
病毒的传播
在无尺度网络上,传染阈值奇迹般地消失了!这就是说,即便病毒不那么具有传染性,仍然能够传播和存活。这颠覆了过去五十年关于扩散的研究积累下的所有结论,无尺度网络上传播的病毒根本没有碰到任何阈值,它们是不可阻挡的。
互联网背后的网络已经变得极其分布式、非中心化和本地化,以至于像绘制互联网地图这样普通的任务都变得不可能完成了。
在建模互联网时,我们必须同时考虑生长机制、偏好连接、距离依赖和潜在分形结构的相互作用。
寄生计算的实现表明,我们能够让千里之外的计算机为我们进行计算。互联网这一根本上的脆弱性,带来了一连串的计算、伦理和法律问题。要是有人改进了我们的寄生计算方法,使其变得足够高效,并开始大规模使用这种计算,后果会怎样呢?谁拥有这种通过互联网让所有人使用的计算资源呢?这是否意味着互联网电脑的诞生?沿着这条路走下去,会不会形成新的智能生命呢?
各种分布式资源的掌控能力是非常恐怖的,超级计算机不同,这种寄生计算可以牺牲一些速度来进行超大量的计算,而且成本极其低廉。
出现这一结果主要是因为万维网是有向网络,而这是由一些技术方面的原因决定的。换句话说,对于一个给定的URL,我们只能朝一个方向前进。
链接导航的单向性,即有的链接是有方向的,从A页面可以跳转到B页面,但B页面不一定有链接可以跳转到A页面。

有向性最重要的影响结果是万维网并非一个单一匀质的网络。实际上,万维网分裂成四块主要的大陆(见图12—1),若想实现导航,我们要在每块大陆上遵循不同的交通规则。
中央核心是可以相互链接的网络,这里的网络虽然不一定是双向的,但通过有限次点击能到达任意的界面。这个区域应该主要是以搜索引擎为中心组建起来的网络。IN大陆是那些只有自己能自己链接中央核心,但中央核心是无法访问它们的部分。这部分主要是搜索引擎无法到达的页面,它们的URL不可知。OUT大陆是那些自身允许被链接进去,但没有链接指向核心的部分,比如公司的宣传网页。还有一些孤岛区域,它们不连接到中央核心,也不允许中央核心检索到它。这个部分主要是一些暗网,内部网络等。
但问题是,网上有超过10亿个页面,我们能在这么巨大的万维网上准确找到社区吗?
这样的互联网社区是由共同爱好的人群组成的,它们是一个抽象的小世界节点簇。在产品定位时如果能找到这样的社区,将能够产生很高的经济价值。而关键问题是如何定位和识别这样的社区?文中说到一种方法是依据一个社区的核心页面相互之间的链接远多于其它的链接,但这个算法是NP完全问题。所以还是没有很好解决。我有一个想法是,既然称为一个社群,那它最主要的特点是这个领域的信息会在这个社区内高效的分享和点击。那相比统计链接数,更好的方法是像通过刺激人体的一个感受器部位观察大脑哪个片区有反应一样。通过跟踪一个特定的领悟内资讯,在推出后哪些节点被激活并成为信息的传递节点,就像被激活了一样。通过多次跟踪类似的过程便可以逐渐筛选和提取出真正的核心社群。比如跟踪多篇关于相机的推文如何在朋友圈传播,便能绘制出对相机感兴趣的用户画像。
代码或软件是网络空间的砖和泥浆;架构则是我们使用代码构建出的事物。
行列中。毕竟,不可见的站点占大多数。因此,万维网的大规模拓扑结构——即它真实的架构,给万维网上我们的行为和可见性施加了更严重的限制,远超过政府或产业仅通过更改代码所能达到的程度。
自组织的系统都是有层级结构的,比如细胞到组织到系统到个体。上一层级远非多个低层级个体简单凑在一起,它们的上一层级在功能上会发生质的变化。不能用管理代码的思维去管理架构,它们属于两个不同的层次结构。
我们了解到网上世界比任何人预计的都要大得多,并且它的增长速度也比我们所愿相信的更快。令人失望的是,我们还发现它极少被绘制下来,少到远低于我们能接受的程度。两年前,6/10的页面不能被任何搜索引擎访问到。如果这个趋势可信,如今搜索引擎能看到的万维网的范围就更小了。不过,好的一面是竞争迫使搜索引擎工作得越来越好。但我们绝不能只看到小枝小节,而忽视全局:不管搜索引擎之间竞争程度如何,万维网只会更大。
信息爆炸后,远非搜索引擎前面的几个页面能展示完的。随着人工智能技术的日益增强,我们越来越只能获得我们自己喜欢的信息,看到与自己观点相似的信息,我们反而越来越狭隘。这里有一个想法,如果我做一个搜索引擎,我会在搜索结果页面同时并列展示两列同一个关键词下非常不同的结果。一列展示那些我们喜好的,观点相似的结果,一列展示那些与我们观点十分不同但也是有其他很多人相信的观点。这样至少能让我们时刻记得我们只是活在一个小世界里,还有更多的群体,更多不同的观点。
如果想理解生命并最终战胜疾病,我们必须从网络的角度思考问题。
网络,这里应该与系统等同起来。这里不得不提面对很多疾病时中医的系统观是强于西医的。
基因组计划带来了新的认识:生命系统的行为不能分解为各个组成分子的行为。
本书开头提到的还原论的问题,科学家们拆解了宇宙却无法再次拼接。
《科学》杂志上的一篇划时代的文章对人类基因组计划总结如下:“不存在‘好’基因或‘坏’基因,只存在不同水平的网络。”
研究系统和网络的范式跟研究一般科学问题似乎必然要使用不同的科学范式。这种范式一旦被发现,对理解互联网信息,生命系统,社群组织等都会有决定性改变。
细胞网络
无尺度模型的一个关键预言是:拥有大量链接的节点,往往都是早期加入网络的节点。对于新陈代谢网络而言,连接度最高的分子应该是细胞中最“老”的分子。
有这样的预言的主要原因可能是基于生长机制和偏好连接。
蛋白质相互作用网络的无尺度性质是所有生物体的共同属性。
如果说网络思维模式会在某个领域引发革命的话,我相信一定是生物学领域
经济网络
在经济网络中,随着网络增长,枢纽节点必须变得越来越大。为了满足枢纽节点对链接的渴求,商业网络中的节点学会了吞并小节点,这是一种在其他网络中从未出现过的新方式。
生长机制,偏好连接之后是否会出现一个新的规则,比如叫做同类合并?
公司网络,从树形结构到网状结构
突然想到,常用的思维导图里面应该再加一个“网络”模板。里面包含节点,有方向的链接,节点根据链接数量自动改变面积。
大量只有少数链接的节点伴随着这些枢纽节点,形成我们熟悉的层级,很多小节点通过少数大的枢纽节点连接在一起,这是无尺度网络的特征。
这又是分形结构的特征
层次化的模块性揭示了枢纽节点的新作用:枢纽节点维持模块间的通信。
正是这种层次化模块性使得多任务有了可能:每个模块内部的稠密链接有助于具体任务的高效完成,枢纽节点协调多个并行功能之间的通信。当同一个模块同时面临多个任务时,瓶颈和减速是不可避免的。计算机依赖单个中央处理器,这是它的主要瓶颈。当我们的大脑皮层需要处理多个任务时,我们的处理速度也会变慢。
聚团系数呈现幂律分布得到层次化模块结构的网络特点,从而转变了枢纽节点的连接作用更多的是模块间的通信作用,从而解释了网络系统的多任务处理能力。
网络是描述任何复杂系统的前提,这表明,复杂性理论不可避免地要站在网络理论的肩膀上。