- 初始化分类,将网络结构G分为K簇
-
使用排序模型计算每个簇下attribute objects节点概率分布:
- 其中C表示簇,K表示簇的个数,t表示循环的次数
- x表示簇Ck下某个节点在该簇下的概率分布,这个概率分
布使用排序模型计算获得
- 假设用d表示论文类,为该模型下的target object,那么对于
任意的d,其在某个簇中的概率分布定义为:
- 其中x为与di有链接关系的attribute objects,Tx为节点x的分类,
W为边的权重(这里先不做详细描述)
-
计算target object在每个簇下的后验概率,并调整簇中
target object的分布
- 算法主要针对target objects进行聚类
- 计算概率:
- 其中k代表不同的簇,论文中使用Maximizes log-likelihood得到最大似
然目标函数,使用EM算法得到最优的p(k)
- 这样每一个target object节点d都可以用一个K维的向量表示:
- 聚类中心用该簇下所有target objexts的mean vector来表示,通过计算
向量间的相似度更新簇中的主节点
-
计算稳定簇中每个attribute objects的后验概率
- 输出target objects所属的簇(领域)
- 输出在每个簇下(领域),attribute objects的分布情况,用于该领域下的排序