小乐给大家谈谈知识社交网络,以及社交知识库应用的知识点,希望对你所遇到的问题有所帮助。
知识社交网络(社交知识库)
知识社交网络(社交知识库)
知识社交网络(社交知识库)
1、一个具体的网络可抽象为一个由(vertex或node)V和边(edge)E组成的图 G=(V, E),数记为 n=|V|,边数记为 m=|E|。
2、PageRank的核心思想是,被大量高质量网页引用的网页也是高质量网页,如某个网页被大量其他网页,特别是其他高质量网页引用,那么它的排名就高。
3、定向量是N个网页的排名,矩阵是网页之间链接的数目,如 a mn 表示第m个网页指向第n个网页的链接数,我们需要在已知A的情况下求得B。
4、设 B i 是第i次迭代的结果,那么初始设每个网页的排名都是 1/N,那么通过上式可以求得B 1 ,再不断迭代求得B 2 , B 3 , ...。
5、可以证明 B i 会收敛,无限趋近于B,一般需要10次的迭代就可收敛。
6、由于很多网页间并没有链接,所以矩阵A会比较稀疏,计算需要进行平滑处理,即将上式换为其中α为一较小常数,I为单位矩阵。
7、igraph可以用 g.pagerank() 计算PageRank值。
8、社区是图中的小,同一社区内之间的连接很紧密,而社区与社区之间的连接比较稀疏。
9、而所谓社区发现就是在一个图中发现若干个社区使得各社区的顶点构成V的一个 覆盖 。
10、若任意两个社区的顶点的交集为空,则称C为非重叠社区,否则为重叠社区。
11、边介数 :网络中经过每条边的最短路径的数目。
12、igraph可以用 g.edge_betweenness() 计算PageRank值一种启发式的社区发现算法,先将每一个作为一个的社区,然后分别计算各个加入其他社区后的模块度增量,从中选出模块度的一个邻居,合并为一个社区。
13、LPA算法不需要预先知识,而且时间复杂度接近于 O(n),适合处理海量数据下的社区划分。
14、其中m表示图里的边数;k v 和 k w 分别表示v和w的度;δ vw 表示两个是否在同一个社区,是则为1不是则为0;A vw 为网络的邻接矩阵,为1表示两个在同一社区,为-1则表示不在同一个社区。
15、模块度的取值范围为 [-1/2, 1),越高说明网络的社区划分得越好。
本文到这结束,希望上面文章对大家有所帮助。