巴拉巴西网络科学
上QQ阅读APP看书,第一时间看更新

2.4 度分布

随机网络中,有些节点有许多链接,有些节点只有少量链接,甚至没有链接(图2-3)。这种差异可以通过度分布pk来刻画,pk表示一个随机选择的节点其度为k的概率。这一节中,我们将推导出随机网络的度分布pk并讨论其性质。

二项分布

随机网络中,一个节点i恰好有k个链接的概率是下面三项的乘积[15]

(1)k个链接出现的概率,即pk

(2)剩下(N-1-k)个链接不出现的概率,即(1-p)N-1-k

(3)节点iN-1个可能存在的链接中选出k个,选择方式的总数为:

因此,随机网络的度分布服从二项分布:

二项分布的形状取决于网络大小N和链接概率p图2-4)。根据二项分布(边栏2.3)的性质,我们可以计算出网络的平均度——公式2.3,也可以计算出度分布的二阶矩和方差σk图2-4)。

图2-4 二项度分布和泊松度分布

随机网络度分布的精确形式是二项分布(左半部分)。当N时,二项分布可以很好地近似为泊松分布(右半部分)。由于二者在描述同一个分布,它们有着相同的性质,只不过表述这些性质的参数不同:二项分布取决于pN,而泊松分布只有一个参数。正是泊松分布的这种简单性使其更受青睐。

泊松分布

大部分真实网络是稀疏的,意味着这些网络的平均度远小于网络大小——N表1-1)。极限情况下,公式2.7中的度分布可以近似为如下泊松分布(进阶阅读2.A

公式2.8和公式2.7通常被称为随机网络的度分布。

公式2.7中的二项分布和公式2.8中的泊松分布是在描述同一个量,因此它们有相似的性质(图2-4):

● 这两个分布都在附近有一个峰值。增加p的值会使网络变得稠密,平均度和度分布的峰值会右移。

● 分布的宽度(离散度)也由p控制。网络越稠密,分布越宽,节点度的差异也越大。

使用泊松形式(公式2.8)的度分布时需要注意:

● 随机网络度分布的精确形式是二项分布(公式2.7)。因此,公式2.8只是在N的极限情况下对公式2.7的近似。由于大多数真实网络都是稀疏的,上述近似所需的条件通常会被满足。

● 泊松形式的优势是,像σk等网络关键特性的形式更简单(图2-4),仅依赖于这一个参数。

● 公式2.8中的泊松分布不显式地依赖节点数目N。因此,公式2.8告诉我们,平均度相同但大小不同的随机网络,其度分布几乎一样。

综上所述,虽然泊松分布只是随机网络度分布的一种近似,但其形式简单,便于分析,因此在刻画随机网络的度分布pk时,人们更倾向于使用泊松形式。本书中,除非特别指出,我们将使用泊松形式(公式2.8)来刻画随机网络的度分布。泊松形式度分布的一个关键特征是,其性质与网络大小无关,仅依赖于平均度这一个参数(图2-5)。

图2-5 度分布与网络大小无关

平均度=50,大小分别为N=102N=103N=104的三个随机网络的度分布。

小网络:二项分布

对于小网络(N=102),由于不满足泊松近似的条件N,该网络的度分布明显偏离泊松分布(公式2.8)。因此,小网络的度分布需要使用精确的二项分布形式(公式2.7)(绿线)。

大网络:泊松分布

对于大网络(N=103N=104),其度分布与灰线所示的泊松分布(公式2.8)相差无几。因此,当网络大小N很大时,度分布和网络大小无关。为了避免随机性带来的噪声,图中所示的结果是在1000个独立生成的随机网络上平均得到的。