1. 初始化分类,将网络结构G分为K簇
  2. 使用排序模型计算每个簇下attribute objects节点概率分布:
    1. 其中C表示簇,K表示簇的个数,t表示循环的次数
    2. x表示簇Ck下某个节点在该簇下的概率分布,这个概率分 布使用排序模型计算获得
    3. 假设用d表示论文类,为该模型下的target object,那么对于 任意的d,其在某个簇中的概率分布定义为:
    4. 其中x为与di有链接关系的attribute objects,Tx为节点x的分类, W为边的权重(这里先不做详细描述)
  3. 计算target object在每个簇下的后验概率,并调整簇中 target object的分布
    1. 算法主要针对target objects进行聚类
    2. 计算概率:
    3. 其中k代表不同的簇,论文中使用Maximizes log-likelihood得到最大似 然目标函数,使用EM算法得到最优的p(k)
    4. 这样每一个target object节点d都可以用一个K维的向量表示:
    5. 聚类中心用该簇下所有target objexts的mean vector来表示,通过计算 向量间的相似度更新簇中的主节点
  4. 计算稳定簇中每个attribute objects的后验概率
    1. 输出target objects所属的簇(领域)
    2. 输出在每个簇下(领域),attribute objects的分布情况,用于该领域下的排序