應用數據分析:原理與應用 Applied Data Analytics - Principles and Applications

Johnson I. Agbinya 聶長海

  • 出版商: 機械工業
  • 出版日期: 2021-09-01
  • 定價: $474
  • 售價: 7.5$356
  • 語言: 簡體中文
  • 頁數: 232
  • 裝訂: 平裝
  • ISBN: 7111690443
  • ISBN-13: 9787111690443
  • 相關分類: 資料科學
  • 立即出貨 (庫存 < 3)

商品描述

需要進行分析且在某些情況下需要實時處理的數據大量出現,例如醫學應用中的X射線圖像、網絡安全數據、
犯罪數據、電信和股票市場數據、健康記錄、商業分析數據等,這迫使人們探索處理超大量數據的快速算法。
包括R、RapidMiner和Weka在內的應用程序和平台為分析提供了基礎,
但這些平台的使用者往往很少關注或根本不關注對數據結果有很大影響的底層數學和處理過程,
導致無法解釋結果或糾正錯誤,甚至無法發現錯誤。
本書試圖通過提供一些大數據分析中較受歡迎的技術來彌補這一差距。
當使用廣泛可用的開源和商業化計算平台、語言和可視化系統進行大數據分析時,本書相當有用。
與這些平台結合在一起,本書提供了處理大數據所需的一整套工具,可以快速實現和應用。
 本書對機器學習基礎、深度學習、人工智能、統計和演化學習的綜合概念進行了充分的解釋,
提供了相關的應用程序,適合本科生、研究生和大數據分析愛好者閱讀。
 本書可以緩解人們對數據分析相關數學知識的恐懼,並有助於開發人工智能、
環境傳感器數據建模和分析、健康信息學、商業數據分析、物聯網數據及深度學習應用。

作者簡介

聶長海,南京大學計算機科學與技術系及南京大學軟件新技術國家重點實驗室教授,博士生導師,研究方向為軟件測試新技術,特別是組合測試技術,已在國內外一級學報和學術會議上發表論文70多篇。主持完成過國家863項目和多項國家自然科學基金項目。參與的項目獲得過多項省部級以上科研獎勵,獲得過多項軟件著作權和發明專利。教學上多次主講過操作系統、模糊數學、離散數學、軟件工程、算法設計與分析和軟件測試等十多門課程,基本覆蓋了工科數學和計算機科學的主幹課程。結合十多年來在軟件測試領域教學和科研實踐,2013年出版《軟件測試的概念與方法》,該書是OO本專注於系統全面地介紹各種軟件測試概念、理論和方法的教材。

目錄大綱

目錄
譯者序
前言
致謝
關於作者
貢獻者名單
縮略語
第1章 馬爾可夫鍊及其應用
1.1 簡介
1.2 定義
1.2.1 狀態空間
1.2.2 軌跡
1.3 使用馬爾可夫鏈的預測
1.3.1 初始狀態
1.3.2 長期概率
1.4 馬爾可夫鏈的應用
第2章 隱馬爾可夫建模
2.1 隱馬爾可夫建模表示法
2.2 釋放概率
2.3 隱馬爾可夫模型
2.3.1 建立HMM
2.3.2 圖形形式的HMM
2.4 HMM中的三大問題
2.4.1 表示法
2.4.2 問題1的解決方案:似然估計
2.5 狀態轉移表
2.5.1 輸入符號表
2.5.2 輸出符號表
2.6 問題3的解決方案:找到最佳HMM
2.7 練習
第3章 卡爾曼濾波器入門
3.1 簡介
3.2 標量形式
3.3 矩陣形式
3.3.1 狀態變量的模型
3.3.2 狀態的高斯表示
3.4 狀態矩陣
3.4.1 對像在單個方向上移動的狀態矩陣
3.4.2 二維運動對象的狀態矩陣
3.4.3 在三維空間中移動的對象
3.5 帶有噪聲的卡爾曼濾波器模型
參考文獻
第4章 卡爾曼濾波器II
4.1 簡介
4.2 卡爾曼濾波器中的處理步驟
4.2.1 協方差矩陣
4.2.2 協方差矩陣的計算方法
4.2.3 卡爾曼濾波器中的迭代
第5章 遺傳算法
5.1 簡介
5.2 遺傳算法的步驟
5.3 遺傳算法的相關術語
5.4 適應度函數
5.5 選擇
5.5.1 輪盤賭
5.5.2 交叉
5.6 最大化單個變量的函數
5.7 連續遺傳算法
5.7.1 地形圖的最低海拔
5.7.2 遺傳算法在傳感器溫度記錄中的應用
參考文獻
第6章 計算圖的微積分
6.1 簡介
6.2 複合表達式
6.3 計算偏導數
6.4 積分計算
6.4.1 梯形法則
6.4.2 辛普森法則
6.5 多徑複合導數
第7章 支持向量機
7.1 簡介
7.2 支持向量機的數學基礎
7.2.1 超平面簡介
7.2.2 平行超平面
7.2.3 兩平行平面之間的距離
7.3 支持向量機問題
7.3.1 問題定義
7.3.2 線性可分情況
7.4 最佳超平面的定位(素數問題)
7.4.1 確定邊界
7.4.2 點xi與分離超平面的距離
7.4.3 求解最佳超平面問題
7.5 拉格朗日優化函數
7.5.1 單約束優化
7.5.2 多約束優化
7.5.3 Karush-Kuhn-Tucker條件
7.6 SVM優化問題
7.6.1 原始SVM優化問題
7.6.2 對偶優化問題
7.7 線性SVM數據
7.7.1 鬆弛變量
7.7.2 使用核的非線性數據分類
參考文獻
第8章 人工神經網絡
8.1 簡介
8.2 神經元
第9章 神經網絡訓練
9.1 簡介
9.2 神經網絡架構
9.3 反向傳播模型
9.4 帶有計算圖的反向傳播示例
9.5 反向傳播
9.6 神經網絡實用訓練
9.6.1 前向傳播
9.6.2 反向傳播
9.7 權重方法的初始化
9.7.1 Xavier初始化
9.7.2 批處理標準化
9.8 結論
參考文獻
第10章 循環神經網絡
10.1 簡介
10.2 實例
10.3 原理
第11章 卷積神經網絡
11.1 簡介
11.2 卷積矩陣
11.3 卷積核
11.4 卷積神經網絡術語
11.4.1 概念和超參數
11.4.2 CNN處理階段
11.4.3 池化層
11.4.4 全連接層
11.5 CNN設計原則
11.6 結論
參考文獻
第12章 主成分分析
12.1 簡介
12.2 定義
12.3 主成分計算
12.3.1 使用向量投影的PCA
12.3.2 使用協方差矩陣進行PCA計算
12.3.3 使用奇異值分解的PCA
12.3.4 PCA的應用
參考文獻
第13章 矩母函數
13.1 隨機變量的矩
13.1.1 隨機變量的中心矩
13.1.2 矩特性
13.2 一元矩母函數
13.3 矩母函數的級數表示
13.3.1 概率質量函數的性質
13.3.2 概率分佈函數f(x)的性質
13.4 離散隨機變量的矩母函數
13.4.1 伯努利隨機變量
13.4.2 二項隨機變量
13.4.3 幾何隨機變量
13.4.4 泊松隨機變量
13.5 連續隨機變量的矩母函數
13.5.1 指數分佈
13.5.2 正態分佈
13.5.3 伽馬分佈
13.6 矩母函數的性質
13.7 多元矩母函數
13.8 矩母函數的應用
第14章 特徵函數
14.1 簡介
14.2 離散單隨機變量的特徵函數
14.2.1 泊松隨機變量的特徵函數
14.2.2 二項隨機變量的特徵函數
14.2.3 連續隨機變量的特徵函數
第15章 概率生成函數
15.1 簡介
15.2 離散概率生成函數
15.2.1 概率生成函數的性質
15.2.2 伯努利隨機變量的概率生成函數
15.2.3 二項隨機變量的概率生成函數
15.2.4 泊松隨機變量的概率生成函數
15.2.5 幾何隨機變量的概率生成函數
15.2.6 負二項隨機變量的概率生成函數
15.3 概率生成函數在數據分析中的應用
15.3.1 離散事件應用
15.3.2 傳染病建模