Skip to content

Hyper: Popularity versus similarity in growing network

George Xiu edited this page Jan 24, 2018 · 2 revisions
  • PA 模型:偏好依附
    • 偏好依附可以解释生成网络中的一些scaling现象。
    • related to:node fitness; ranking; optimization; 随机游走; duplication...
  • Similarity is another dimension of attraction!

模型梗概:一个双曲圆盘模型

  • 开始圆盘是空的
  • 对于每个时刻$t\geq1$, 新的结点$t$以一个随机的角度$\theta_t$加入圆盘
  • 连结与其最近(最小化$s\theta_{st}$)的$m$个点

模型解析:$m$参量是点的平均度:$\bar{k}=2m$. 与PA模型的对比:度分布$\Pi(k)$与PA模型服从相同的幂律分布:$\gamma \approx 2$。区别在于,本模型有空间异质性,即对于不同的结点,其度分布会非常不同(与地理位置有关)。

对聚集系数和幂律指数的调整

popularity fading

模型中,点离圆盘中心越近,它的流行度就越高 我们使点在加入圆盘之后还有远离的趋势:$r_s(t)=\beta r_s+(1-\beta)r_t$,其中$r_s=\ln s,r_t=\ln t$这个修正等同于将优化的双曲距离改成$s^\beta \theta_{st}$. 或者$s^b\theta_{st}^a,\beta=\frac{b}{a}$. 它将幂律系数变成了$\gamma= 1+\frac{1}{\beta}\geq2$ $\beta=1$:结点不移动;$\beta=0$:结点移动速度最快,都距离圆心$r_t$的位置上,图形就是在一个圆周上生成的图案。对任何的$\gamma=1+1/\beta$,PA现象都会出现,因为吸附概率$\Pi(k)$使$k$的线性函数:$\Pi(k)~k+m(\gamma-2)$,与PA是相同的。

减弱clustering

只需要使得结点可以与与其更远的结点连接就好了。 连结m个的结点也就是划定一个区域(半径)$R_t~r_t$. 我们可以由平均度分布导出它的精确表达式。如果新结点与已知结点以概率$p(x_{st})=\frac{1}{1+e^{(x_{st}-R_t)/T}}$,其中$T$是系统的温度,$x_{st}$是双曲距离。那么clustering就是温度$T$的减函数。$T\rightarrow\infty,p\rightarrow1;T\rightarrow0,p\rightarrow0.$聚集效应从$T=1$处变成了0.

similarity是不是改变了真实网络的结构和形态?

利用互联网的一些历史切片、E.coli metabolic、信任网络。我们将这些网络映射到双曲空间,这种映射会导出所有的参数,我们也就可以计算两两的双曲距离了。 我们另作一种实验:为了导出偏好依附,新的结点不以真实网络中的方式连接,而是依照偏好依附的方式来连接。 我们发现,文中的生成方式比PA生成有效多了。。

我们可以总结一下模型的优点了:

  • 简单,放之四海皆准
  • 与真实网络很像
  • 可以演化出偏好依附现象
  • 在各种度量下,与真实网络生成的图都很像
  • 可以直接导出一种生成机制

复杂的其他机制都可以抽象成similarity,所以非常省事。

方法总结

这个部分主要是:如何根据毗邻矩阵推断$(r_i,\theta_i)$?