结构决定功能,节点类型决定分析目的
自由主题
基本功能
1快速了解前人的研究成果,有哪些代表人物和经典著作,高效从海量文献中筛选出最经典、最有代表性的作品,避免大海捞针,错失重点
实用组合
共引词频+术语组合
转折点(关键点)
研究前沿
学科进展+发展态势
term/keyword/cited
核心文献
3迅速了解该研究领域的热点
这个主题的学者都在研究什么
什么是这个主题下最关注的点
运行视图简介
准备工作
下载安装
wos数据下载
1save to other format
2full records and cited reference
3plain text
基本术语的了解
burst检测:突发主题
引文年环:代表文章的引文历史,颜色代表年份,厚度与该时间区内引文数量成正比
threshold
中介中心性【紫】:衡量文章重要性的数字指标,数值越大,文章越重要
N:表示节点数,E表示连线数
S:同质性,值越大,同质性越高,代表某个聚类内部同质性
Q:模块度,值越大,聚类效果越好
数据导入注意事项
输出txt格式,并以download_1-500命名
建立四个文件夹,将数据导入input,并全选复制input文件夹里的全部文本,剪切复制到data
图谱的研究前沿是怎么确定啊?我看的文章有的是直接把关键节点(转折点(有紫色外圈的节点)看做研究前沿,这样对吗?分析研究前沿时term type选择noun phrases还是burst terms?Node Type选择Cited reference
1. Cited References
2. 生成网络
3. Citation Burst (需按2次)红色为被引burst,是前沿的‘脚印’。Sigma最高的节点为重要地区留下的脚印。
4. 生成聚类。在Cluster Explorer里,选则右侧列表中脚印所在的聚类(参考#3)。这时中间列表所显视的论文可视为一组前沿文献。
选择进行分析的类型
合作
作者
机构
institute获得机构分布及机构之间的关系
国家
共现
主题
关键词
学科
共引
文献
作者
期刊
耦合
文献
基金
参数的设置
时间切片
网络类型
关联强度
阈值选择
修剪方式
剪枝方法
最小生成树 (MST)
寻径( PathFinder)
图谱类型
聚类视图(默认)
时间线视图(鱼眼图)
时区视图
双图叠加
地理叠加
Go
网络聚类
参数判读
视图显示
提炼标签词
TF*IDF加权算法
对数似然率算法
交互信息算法
图谱分析与解读
1结构:是否能看到自然聚类(未经聚类算法而能直观判定的组合),是否包括转折点(有紫色外圈的节点),通过算法能得到几个聚类?每个节点大小代表它的总被引次数。大圈则总被引高。
2时间:每个自然聚类是否有主导颜色(出现时间相对集中),是否有明显的热点(节点年轮中出现红色年轮,即被引频率是否曾经或仍在急速增加)?通过各个年轮的色彩可判断被引时间分布。时间线显示将每一聚类按时间顺序排列,相邻聚类常常对应相关主题(聚类间共引)。聚类之间的知识流向也可从时间(色彩)上看到(由冷色到暖色)。
3内容:每个聚类的影响(被引时涉及的主题,摘要,和关键词)和几种不同算法所选出的最有代表性的名词短语?
4指标:每个聚类是否具有足够的相似性(silhouette值是否足够大,太小则无明确主题可言),整个聚类是否有足够节点(太少则很可能全都出自同一篇文献的参考文献,因而缺乏普遍意义)?
疑问
1 图谱如何得出哪些文章是经典文献,哪些是研究前沿,谁是开山鼻祖
2共被引,关键词共现有何潜在含义
3什么样的图谱比较理想化
4该软件适合哪些情景,人物思想类论文适合吗
为什么我的数据运行视图中经常出现criteria,space,还有nodes和links在某些时间段内为零呢?如何解决?
5何种类型的目的适合何种分析,哪些分析没有意义
知网导入的数据需要去重吗?
易混淆概念的界定
施引文献和被引文献
共引和共被引
知网节
同被引文献:与本文同时被引用的文献
共引文献:与本文有相同参考文献的文献
二级文献:本文参考文献的参考文献
引证文献:引用了你当前查看文献的文献
论文写作时,是否可以借助软件辅助确认关键词,
共引:两篇文献同时被一篇以上文献共同引用,以引用他们文献数量作为共引强度
如何实现聚类视图的颜色差异化
关键词共词分析,何种情况下需要进行聚类,
为什么我每次辛苦得来的图谱,保存为.viz格式却无法打开
目标
任意主题随时快速都能得出它的学科基础,研究前沿,开山鼻祖,发展趋势,经典著作
撰写论文
自由主题
自由主题