大數據管理與應用
丁晟春,吳鵬,孫煬煬,徐車
- 出版商: 清華大學
- 出版日期: 2026-04-01
- 售價: $354
- 語言: 簡體中文
- 頁數: 283
- ISBN: 7302712263
- ISBN-13: 9787302712268
-
相關分類:
大數據 Big-data
下單後立即進貨 (約4週~6週)
相關主題
商品描述
"本書主要介紹大數據管理與應用的通識入門知識,以“建立知識體系、掌握基本方法、學會基礎實踐、了解前沿應用”為原則,為讀者深入學習大數據管理方法和大數據應用技術奠定基礎。本書系統介紹大數據基本概念及其特征、數據預處理方法、存儲技術、大數據分析和挖掘方法、可視化展示方法;探討大數據驅動下的管理模式變革及實踐案例、數據質量管理體系、大數據開放共享。本書將系統全面的理論方法介紹與豐富翔實的實踐應用相結合,幫助讀者樹立大數據思維意識,學習大數據管理與應用的知識體系和方法,提升大數據管理與應用實踐能力。 本書可作為大數據管理與應用相關專業的教材,也可作為大數據領域的專業人員、研究人員以及對大數據感興趣的初學者的參考書。 "
目錄大綱
目錄
第1章大數據簡介/1
1.1何為大數據2
1.1.1大數據時代的到來2
1.1.2大數據的來源與發展4
1.1.3大數據定義7
1.1.4大數據的分類8
1.2世界各國大數據發展戰略9
1.2.1中國大數據發展戰略9
1.2.2國外主要國家大數據發展戰略14
1.3大數據特征15
1.3.1大數據的結構化15
1.3.2大數據的5V特點16
1.3.3大數據的3S/3I特點21
1.4大數據全生命周期22
1.5大數據對經濟社會發展的影響24
1.5.1大數據引發的社會變革24
1.5.2大數據引發的經濟變革25
1.5.3大數據引發的個人生活方式變化27
1.6大數據的戰略意義與面臨的挑戰27
1.6.1大數據的戰略意義27
1.6.2大數據發展面臨的挑戰28
課後習題29
第2章大數據的獲取/30
2.1大數據獲取概述31
2.1.1大數據的獲取來源31
2.1.2大數據獲取的概念和類型31
2.2網絡爬蟲32
2.2.1網絡爬蟲的概念與類型32
2.2.2網絡爬蟲的基本爬取方式33
2.2.3網絡爬蟲的爬取策略332.2.4數據解析35
2.3互聯網數據獲取方法40
2.3.1網絡爬蟲框架40
2.3.2采集器軟件45
2.3.3其他互聯網數據獲取方法47
2.4離線數據獲取方法47
2.4.1傳感器47
2.4.2系統日誌48
2.5實踐案例: “無人潛水器”專利數據采集49
2.5.1采集目標49
2.5.2使用Python網絡爬蟲49
2.5.3使用網絡爬蟲框架54
2.5.4使用采集器軟件57
課後習題64
第3章大數據預處理/66
3.1大數據預處理概述67
3.1.1數據存在的問題67
3.1.2數據預處理的主要任務67
3.2數據清洗68
3.2.1缺失值處理68
3.2.2重復值處理68
3.2.3異常值處理69
3.2.4邏輯錯誤清洗70
3.3數據集成71
3.3.1實體統一問題71
3.3.2數據冗余問題72
3.3.3數據沖突問題73
3.4數據變換74
3.4.1簡單函數變換74
3.4.2數據標準化75
3.4.3數據離散化76
3.4.4數據編碼77
3.5數據歸約77
3.5.1數量歸約77
3.5.2維度歸約77
3.6實踐案例: 專利情報數據預處理78
3.6.1數據清洗78
3.6.2數據集成80
3.6.3數據變換80
3.6.4數據歸約82
課後習題83
第4章大數據存儲技術/85
4.1大數據存儲概述86
4.1.1大數據存儲的關鍵問題與面臨的挑戰86
4.1.2大數據存儲方式87
4.2基於文件系統的數據存儲88
4.2.1基於文件系統的數據存儲的特點與優勢88
4.2.2分布式文件系統89
4.2.3Hadoop分布式文件系統90
4.3基於關系數據庫的數據存儲91
4.3.1什麼是關系數據庫91
4.3.2基於關系數據庫的數據存儲的特點與優勢92
4.3.3MySQL數據庫93
4.4NoSQL數據存儲94
4.4.1NoSQL數據存儲的特點與優勢94
4.4.2鍵值數據庫95
4.4.3列族數據庫95
4.4.4文檔數據庫96
4.4.5圖形數據庫96
4.4.6關系數據庫與非關系數據庫的比較97
4.5新一代大數據存儲技術97
4.5.1雲存儲技術97
4.5.2NewSQL99
4.6實踐案例: Neo4j導入藥材供應鏈數據102
4.6.1Neo4j安裝102
4.6.2Neo4j啟動104
4.6.3Cypher基本語句106
4.6.4藥材供應鏈數據下載與介紹109
4.6.5圖數據庫構建與可視化111
附錄117
課後習題118
第5章大數據分析與挖掘方法/120
5.1大數據分析與挖掘方法概述121
5.1.1大數據分析與數據挖掘的含義121
5.1.2大數據分析與挖掘的發展趨勢121
5.2大數據分析的類型122
5.2.1描述性分析122
5.2.2診斷性分析127
5.2.3預測性分析128
5.2.4規範性分析129
5.3大數據分析與挖掘的經典模型130
5.3.1分類算法130
5.3.2聚類算法133
5.3.3回歸分析算法136
5.3.4關聯規則挖掘算法138
5.4大數據分析與挖掘的現代模型140
5.4.1神經網絡140
5.4.2深度學習142
5.4.3強化學習144
5.4.4大模型147
5.5大數據分析與挖掘的應用場景148
5.5.1文本數據分析148
5.5.2圖像數據分析151
5.5.3音頻數據分析153
5.5.4其他非結構化數據分析155
5.6實踐案例: 基於某社交平臺的推文內容分析156
5.7實踐案例: 基於水下無人潛水器技術專利的Kmeans聚類分析158
課後習題160
第6章大數據可視化展示/161
6.1數據可視化概述162
6.1.1什麼是數據可視化162
6.1.2數據可視化的發展162
6.1.3大數據可視化的分類163
6.2數據可視化基礎166
6.2.1數據可視化的基本流程166
6.2.2數據可視化設計原則167
6.2.3大數據可視化的圖表類型168
6.3大數據可視化方法應用171
6.3.1時間數據可視化171
6.3.2關系數據可視化172
6.3.3文本數據可視化173
6.3.4比例數據可視化175
6.4大數據可視化工具與軟件175
6.4.1常見的大數據可視化技術175
6.4.2ECharts180
6.4.3D3.js187
6.5實踐案例: 基於某社交平臺帖子數據的可視化190
6.5.1可視化實現思路190
6.5.2時間數據可視化192
6.5.3關系數據可視化199
6.5.4文本數據可視化200
6.5.5比例數據可視化201
課後習題203
第7章大數據驅動的管理變革/204
7.1大數據驅動的管理變革概述205
7.1.1大數據時代管理面臨的問題和挑戰205
7.1.2大數據時代管理變革的整體架構206
7.1.3大數據時代管理變革的不同階段207
7.2大數據時代的管理思維變革208
7.2.1經驗主義與數據主義208
7.2.2自上而下管理與協同參與管理209
7.2.3人工決策與智能決策211
7.3大數據時代的組織結構變革212
7.3.1組織結構變革框架212
7.3.2組織結構類型213
7.3.3組織結構變革方法214
7.4大數據時代的運營模式變革215
7.4.1研發模式變革215
7.4.2生產模式變革216
7.4.3營銷模式變革217
7.5大數據時代的管理決策變革218
7.5.1傳統管理決策範式218
7.5.2大數據驅動的管理決策範式轉變219
7.5.3大數據驅動的管理決策框架222
7.5.4不同類型數據的管理決策223
7.6大數據時代的管理決策應用227
7.6.1商務大數據決策應用227
7.6.2交通大數據決策應用230
7.6.3醫療大數據決策應用235
課後習題240
第8章數據質量管理/242
8.1數據質量管理概述243
8.1.1數據質量的基本概念243
8.1.2影響數據質量的因素247
8.1.3數據質量管理的流程248
8.2數據質量管理技術與工具249
8.2.1數據質量管理技術249
8.2.2數據質量管理工具251
8.3數據質量評估方法252
8.3.1定性評估方法252
8.3.2定量評估方法254
8.3.3綜合評估方法255
8.4數據質量提升方法259
8.4.1事前數據質量提升方法260
8.4.2事中數據質量提升方法261
8.4.3事後數據質量提升方法262
8.5實踐案例: 社交媒體平臺數據質量評估263
8.5.1數據源及數據集說明263
8.5.2數據質量維度264
8.5.3數據質量評估265
8.5.4數據質量評估結果266
課後習題267
第9章大數據開放共享/268
9.1大數據開放共享的定義和框架269
9.1.1大數據開放共享的定義269
9.1.2大數據開放共享的多元主體269
9.1.3大數據開放共享流程框架270
9.1.4大數據開放共享流程271
9.2大數據開放共享技術和工具272
9.2.1大數據開放共享的技術272
9.2.2大數據開放共享的工具274
9.3大數據開放共享風險分析與安全防護274
9.3.1大數據開放共享風險分析274
9.3.2大數據開放共享安全體系設計275
9.4目前大數據開放共享面臨的挑戰276
9.4.1大數據開放共享的隱私風險276
9.4.2大數據開放共享標準規範問題277
9.4.3公益性與收益模式間的平衡問題277
9.5政府數據開放共享應用277
9.5.1政府數據開放共享277
9.5.2實踐案例: 貴州省政府數據開放共享應用278
課後習題281
參考文獻/282







