科學知識圖譜:工具、方法與應用
王大阜
買這商品的人也買了...
-
$857量化投資 : 策略與技術
-
$580$458 -
$354$336 -
$564Visual Studio Code 權威指南
-
$426零基礎學機器學習
-
$403現代自然語言生成
-
$680$612 -
$980$774 -
$680$537 -
$520$411 -
$650$507 -
$768$730 -
$449知識圖譜 — 面向科技文獻的構建技術與應用實踐
-
$650$429 -
$700$462 -
$1,608$1,528 -
$414$393 -
$505內容理解:技術、演算法與實踐
-
$594$564 -
$505LangChain 入門指南:構建高可復用、可擴展的 LLM 應用程序
-
$560$442 -
$620$409 -
$426深度對話GPT-4提示工程實戰
-
$860$774 -
$680$530
相關主題
商品描述
本書旨在講述科學知識圖譜中常用的工具及其應用。本書首先介紹知識圖譜基礎知識,智慧圖書館領域中文獻題錄數據的採集和預處理操作,然後介紹文獻計量分析工具CiteSpace、VOSviewer、HistCite、Bibliometrix與SATI的應用,以及多元統計分析工具SPSS和社會網絡分析工具UCINET的應用,最後闡述LDA(Latent Dirichlet Allocation,隱狄利克雷分配)主題模型的應用。
本書適合科研人員、科研管理者和科學知識圖譜愛好者閱讀。
作者簡介
王大阜,中国矿业大学图书馆工程师,从事校园网数据中心和信息化的建设与运维工作十余年,在运维、软件开发以及网络安全管理等方面具有丰富的实践经验,并从事过“网页开发”“C#程序设计”两门课程的教学工作。研究方向包括科学知识图谱、机器学习及网络安全,已发表论文数篇,主持一项江苏省高校哲学社会科学研究项目,参与研究一项江苏省高校哲学社会科学研究项目,参与研究一项国家社会科学基金项目。
目錄大綱
目 錄
第 1章 科學知識圖譜概述 1
1.1 知識圖譜的概念 1
1.1.1 科學知識圖譜 2
1.1.2 語義知識圖譜 3
1.2 科學知識圖譜的研究方法 6
1.3 科學知識圖譜的研究意義 7
1.3.1 學科分析研究 7
1.3.2 科研合作網絡分析 8
1.3.3 學科建設評估 9
1.4 科學知識圖譜的繪制與解讀流程 10
1.5 科學知識圖譜工具 11
1.6 本章小結 12
第 2章 數據採集與預處理 13
2.1 數據庫簡介 13
2.1.1 三大數據庫 13
2.1.2 OA數據庫 14
2.1.3 其他數據庫 15
2.2 數據採集 15
2.2.1 CNKI數據採集 16
2.2.2 CSSCI數據採集 20
2.2.3 WOS數據採集 22
2.3 數據預處理 24
2.3.1 WOS題錄格式說明 25
2.3.2 數據預處理前期準備 27
2.3.3 數據預處理操作 28
2.3.4 數據轉換存在的問題 30
2.3.5 工具演示說明 32
2.4 本章小結 33
第3章 文獻計量分析工具的應用 34
3.1 文獻計量分析理論方法 34
3.1.1 引文分析 34
3.1.2 共詞分析 37
3.2 CiteSpace 38
3.2.1 CiteSpace簡介 38
3.2.2 CiteSpace概念模型 38
3.2.3 下載與運行CiteSpace 39
3.2.4 設置參數 41
3.2.5 新建項目與可視化 45
3.2.6 共詞網絡可視化視圖 47
3.2.7 科研合作網絡圖譜 56
3.2.8 共被引網絡 59
3.2.9 保存圖譜 63
3.3 VOSviewer 65
3.3.1 VOSviewer簡介 65
3.3.2 下載與運行VOSviewer 66
3.3.3 知識單元合並及刪除 67
3.3.4 創建圖譜 67
3.3.5 可視化視圖 74
3.3.6 中文文獻可視化圖譜 74
3.3.7 外文文獻可視化圖譜 91
3.3.8 保存圖譜 97
3.4 HistCite 99
3.4.1 HistCite簡介 99
3.4.2 下載與運行HistCite 99
3.4.3 HistCite界面 100
3.4.4 繪制引文時序圖 102
3.5 Bibliometrix 104
3.5.1 Bibliometrix簡介 104
3.5.2 下載與運行Bibliometrix 106
3.5.3 Bibliometrix的部分功能 108
3.6 SATI 112
3.6.1 SATI簡介 112
3.6.2 SATI的部分功能 115
3.7 本章小結 117
第4章 多元統計分析工具SPSS的應用 119
4.1 多元統計分析理論方法 119
4.1.1 因子分析 119
4.1.2 聚類分析 120
4.1.3 多維尺度分析 121
4.1.4 戰略坐標分析 122
4.2 BICOMB 123
4.2.1 BICOMB簡介 123
4.2.2 下載與運行BICOMB 123
4.2.3 使用BICOMB 124
4.3 SPSS 130
4.3.1 SPSS簡介 130
4.3.2 SPSS距離分析的應用 131
4.3.3 SPSS因子分析的應用 134
4.3.4 SPSS聚類分析的應用 140
4.3.5 SPSS多維尺度分析的應用 144
4.3.6 戰略坐標分析的應用 146
4.4 本章小結 149
第5章 社會網絡分析工具UCINET的應用 150
5.1 社會網絡分析理論方法 150
5.1.1 中心度 151
5.1.2 凝聚子群 155
5.1.3 網絡密度 156
5.2 UCINET 156
5.2.1 UCINET簡介 156
5.2.2 數據輸入/輸出 157
5.2.3 層次聚類 158
5.2.4 中心度計算 160
5.2.5 共詞網絡可視化圖譜 161
5.2.6 國內合作網絡可視化圖譜 164
5.2.7 保存圖譜 169
5.3 本章小結 170
第6章 LDA主題模型的應用 171
6.1 NLP理論方法 171
6.1.1 語料庫 171
6.1.2 分詞 172
6.1.3 特徵工程 173
6.1.4 文本表示方法 173
6.1.5 LDA主題模型 175
6.2 開源NLP工具包 176
6.3 Python集成開發環境 177
6.4 分詞處理 179
6.4.1 分詞工具 179
6.4.2 自定義詞典 180
6.5 詞袋模型示例 180
6.5.1 詞頻統計 180
6.5.2 TF-IDF統計 181
6.6 主題分析應用 182
6.6.1 數據準備 182
6.6.2 LDA主題模型的相關參數 182
6.6.3 程序代碼 183
6.6.4 主題輸出與可視化 184
6.6.5 熱點主題解讀 186
6.6.6 主題演化歷程 187
6.7 本章小結 189
附錄A 文獻計量分析的常用術語 190
附錄B 基本科學指標 191
附錄C 知網題錄數據格式轉換代碼 192
附錄D CSSCI題錄數據格式轉換代碼 194