KNIME 視覺化數據分析

雒玉璽 等

  • 出版商: 電子工業
  • 出版日期: 2023-02-01
  • 售價: $636
  • 貴賓價: 9.5$604
  • 語言: 簡體中文
  • 頁數: 292
  • ISBN: 7121449552
  • ISBN-13: 9787121449550
  • 相關分類: Data Science
  • 立即出貨 (庫存 < 4)

買這商品的人也買了...

商品描述

本書與讀者一同探討和思考數據分析的基本概念、需求、方案等問題,並以 KNIME 為工具,展示 數據分析的具體流程。 本書對 KNIME 中的眾多節點進行了介紹,對各節點的難度和重要性進行了標記,以便新手更快地 學習,對節點的覆蓋性說明和一些高級內容,會讓讀者更深入地瞭解和使用KNIME。 對所有日常有數據分析需求的讀者來說,本書能幫助其輕松應對大部分常見的數據分析問題,是一本 不可多得的 KNIME 使用參考書。 按照當今的流行術語來說,KNIME 是一款通用型的低代碼(low code)數據分析軟件,也就是 說,它的主要操作方式通過"拖拉曳”就能完成。 本書適合所有日常有數據分析需求的讀者,能幫助其輕松應對大部分常見的數據分析問題。

目錄大綱

第1章 數據分析方法論 1
1.1 基本要求與基礎概念 1
1.1.1 目標讀者 1
1.1.2 楔子 2
1.1.3 釐清誰是數據的所有者 2
1.1.4 成為科學家還是工程師 3
1.2 方法論 4
1.2.1 你的問題是什麽 4
1.2.2 問題的解空間 5
1.2.3 科學方法 6
1.2.4 “然後呢” 7
1.2.5 CRISP-DM數據挖掘的跨行業標準流程 9
1.3 後續內容 10
第2章 KNIME使用基礎 12
2.1 權衡數據分析的需求與解決方案 12
2.1.1 制定實施方案 12
2.1.2 案例:一次關於工具選型的聊天 15
2.2 KNIME簡介、生態圈和資源 18
2.2.1 KNIME簡介 18
2.2.2 當我們提到KNIME時,具體是指什麽 20
2.2.3 KNIME 的相關資源 21
2.3 安裝KNIME及其擴展 22
2.3.1 安裝KNIME分析平臺 22
2.3.2 啟動KNIME 24
2.3.3 安裝KNIME擴展 25
2.3.4 卸載KNIME擴展 26
2.4 KNIME的使用 26
2.4.1 關於KNIME界面 26
2.4.2 KNIME使用簡介 29
2.4.3 導入和導出現有工作流 30
2.4.4 例子服務器及Hub的使用 31
2.5 遇到問題怎麽辦 34
第3章 KNIME數據分析基礎 36
3.1 數據來源及輪廓 36
3.1.1 瞭解原始數據來源 36
3.1.2 瞭解輪廓,進行探索性分析 36
3.1.3 一個好例子 37
3.1.4 房價例子 38
3.2 電腦如何處理表格數據 39
3.2.1 基礎數據操作 39
3.2.2 展示示例數據 39
3.2.3 具體的小問題 39
3.3 基礎操作之讀取數據源 41
3.3.1 讀取文件 41
3.3.2 讀取數據庫 43
3.3.3 導入之前的數據 43
3.4 基礎操作之挑選(select)操作 44
3.4.1 瞭解完備概念 44
3.4.2 你會幾種編程語言 45
3.4.3 回顧之前的問題 45
3.4.4 SQL中的挑選操作 46
3.4.5 KNIME中的挑選操作 47
3.5 基礎操作之CASE、group by和join 49
3.5.1 條件操作、缺失值和排序 50
3.5.2 分組操作——group by 51
3.5.3 子查詢——subquery 51
3.5.4 連接操作——join 52
3.5.5 使用KNIME完成之前的問題 52
3.6 瞭解KNIME中的重要概念 56
3.6.1 瞭解路徑 56
3.6.2 瞭解節點基礎 59
第4章 KNIME基礎節點——數據訪問類型 64
4.1 IO節點集合 65
4.1.1 Read(讀)目錄下的節點 66
4.1.2 File Folder Utility(文件、文件夾工具)目錄下的節點 68
4.1.3 Other(其他)目錄下的節點 69
4.1.4 文件處理節點的補充說明 70
4.2 DB節點集合 70
4.2.1 Connection(連接)目錄下的節點 71
4.2.2 獲取數據的兩種模式 73
4.2.3 Query(查詢)目錄下的節點 75
4.2.4 Read/Write(讀/寫)目錄下的節點 77
4.2.5 Utility(工具)目錄下的節點 78
4.3 JSON、XML類型 78
4.3.1 JSON格式介紹與解析 79
4.3.2 XML格式介紹與解析 83
4.3.3 JSON與XML的相應節點 84
4.4 Web相關節點 85
4.5 NoSQL相關節點 85
4.6 網絡數據訪問 86
4.6.1 網絡數據簡要說明 86
4.6.2 使用GET/POST Request 節點 89
4.6.3 其他 91
第5章 KNIME基礎節點——轉換類型 92
5.1 Column(列)處理節點集合 93
5.1.1 Binning(分桶)目錄下的節點 93
5.1.2 Convert & Replace(轉換 & 替換)目錄下的節點 96
5.1.3 Filter(過濾)目錄下的節點 101
5.1.4 Split & Combine(分割與組合)目錄下的節點 101
5.1.5 Transform(轉換)目錄下的節點 103
5.1.6 其他的列處理節點 106
5.2 Row(行)處理節點集合 107
5.2.1 Filter(過濾)目錄下的節點 107
5.2.2 Transform(轉換)目錄下的節點 110
5.2.3 GroupBy(分組聚合)節點 112
5.2.4 Pivoting(轉軸或透視)節點 116
5.2.5 其他行處理節點 119
5.3 Table(表)處理節點集合 121
5.4 PMML節點集合 121
5.5 時間數據類型相關操作 124
第6章 KNIME基礎節點——分析和數據挖掘類型 128
6.1 機器學習簡述 128
6.1.1 監督學習和非監督學習 128
6.1.2 基本概念和約定 129
6.1.3 模型選擇、超參優化及錯誤分析 132
6.2 Analytics節點集合 133
6.2.1 學習器(Learner)和預測器(Predictor) 134
6.2.2 Feature Selection(特徵選擇)節點 135
6.2.3 Scoring(記分)目錄下的節點 136
6.2.4 Statistics(統計)類節點 136
6.2.5 Distance Calculation(距離計算)類節點 137
6.3 探索性數據分析(EDA)練習 137
6.3.1 泰坦尼克號 137
6.3.2 數據探索 138
6.3.3 對原始數據進行粗略觀察 138
6.3.4 進一步觀察數據 143
6.4 簡單的機器學習練習——使用KNIME中的決策樹算法 147
第7章 進階話題——流變量與控制循環結構 152
7.1 流變量從入門到精通 152
7.1.1 瞭解流變量 152
7.1.2 生成流變量 153
7.1.3 使用流變量 156
7.1.4 流變量的操作 160
7.1.5 流變量的特別使用方式 164
7.2 循環(Loop)結構 164
7.2.1 兩種Loop End(循環結束)節點 166
7.2.2 遞歸循環 168
7.2.3 循環的調試 170
7.2.4 和流變量有關的循環 171
7.2.5 其他循環 172
7.3 分支(Switches)結構 175
7.3.1 IF Switch節點 176
7.3.2 Java IF(Table)節點 177
7.3.3 CASE Switch類節點 177
7.3.4 Empty Table Switch(空表切換)節點 178
7.3.5 其他說明 179
7.4 錯誤處理 179
7.4.1 Try…Catch結構 179
7.4.2 舉例:循環中的Try ... Catch結構 183
7.4.3 其他 184
第8章 進階話題——數據可視化、模塊化與編程節點 185
8.1 數據可視化 185
8.1.1 數據可視化簡介 185
8.1.2 KNIME中的可視化節點簡介 188
8.1.3 以折線圖(Line Plot)為例介紹可視化相關節點 189
8.1.4 其他可視化圖表 195
8.1.5 通用可視化節點——Generic JavaScript View 195
8.2 模塊化 197
8.2.1 KNIME 模塊化簡史 198
8.2.2 元節點(Metanode) 199
8.2.3 組件(Component) 201
8.2.4 其他建議 207
8.3 生成報告 208
8.4 Java相關節點 213
8.4.1 Java Snippet(simple)節點 213
8.4.2 Java Snippet Row Filter(Java行過濾器)節點 216
8.4.3 Java Snippet節點 217
8.5 Python相關節點 221
8.5.1 Python環境配置 222
8.5.2 KNIME中的Python 226
8.5.3 Python相關節點介紹 229
8.5.4 與Jupyter交互 231
8.5.5 Conda的常用命令 234
第9章 高級話題 235
9.1 可復現性與測試 235
9.2 深度學習介紹 238
9.2.1 基於Keras的深度學習 239
9.2.2 基於TensorFlow 2的深度學習 242
9.2.3 使用現有模型進行預測 244
9.2.4 使用深度學習的其他方式 246
9.3 時間序列分析介紹 247
9.3.1 想要預測什麽 247
9.3.2 時間圖(Time Plot) 249
9.3.3 季節圖(Seasonal Plot) 249
9.3.4 季節性子圖(Seasonal Subseries Plot) 251
9.3.5 箱形圖(Box Plot) 252
9.3.6 散點圖(Scatter Plot) 253
9.3.7 滯後圖(Lag Plot) 254
9.3.8 自相關圖(Auto Correlation Plot)與偏自相關圖(Partial autocorrelation
function Plot) 255
9.3.9 時間序列的組成 257
9.3.10 時間序列的預處理 258
9.3.11 趨勢(Trend)成分 260
9.3.12 季節性(Seasonal)成分 261
9.3.13 周期性(Cyclic)成分 263
9.3.14 經典的統計學方法 263
9.4 擴展開發介紹 264
9.5 (機器學習的)集成部署(Integrated Deployment) 271
9.5.1 概述 271
9.5.2 使用舉例 272
9.6 KNIME Server、Executor與Edge簡介 276
9.6.1 架構簡介 276
9.6.2 功能簡介 278