非平衡數據集分析及其應用

李鳳蓮

  • 出版商: 電子工業
  • 出版日期: 2022-01-01
  • 定價: $414
  • 售價: 8.5$352
  • 語言: 簡體中文
  • 頁數: 232
  • ISBN: 7121428903
  • ISBN-13: 9787121428906
  • 已絕版

商品描述

本書主要介紹非平衡數據集的特點及針對非平衡數據集常用的預測方法,主要從數據層面、特徵層面和算法層面對非平衡數據集分類預測方法進行詳細說明。全書共11章。其中,第1章為緒論,第2章從數據層面介紹基於採樣技術的非平衡數據集常用分析方法,第3章從特徵層面介紹常用的非平衡數據集分析方法,第4~11章主要介紹算法層面的各種針對非平衡數據集的預測模型。本書可供電子信息工程、通信工程、電子科學與技術、電腦科學與技術、統計學、智能信息處理等相關專業高年級本科生、從事相關課題研究的碩士研究生與博士研究生及相關行業從事數據分析的科研人員研究參考。

目錄大綱

第1章 緒論 1.1非平衡數據集簡介 1.2非平衡數據集的特點 1.3非平衡數據集研究現狀 1.3.1基於數據層面的採樣技術研究現狀 1.3.2基於特徵層面的分類模型研究現狀 1.3.3基於算法層面的分類模型研究現狀 1.4非平衡數據集分類預測模型構建難點 1.5非平衡數據集分類性能的評價準則 參考文獻 第2章 基於採樣技術的非平衡數據集分類預測方法 2.1常用採樣技術 2.2基於欠採樣方法的非平衡數據集預測 2.2.1基於聚類的欠採樣方法 2.2.2去冗餘欠採樣方法 2.3基於聚類融合去冗餘的改進欠採樣方法 2.3.1相似度冗餘系數 2.3.2聚類算法 2.3.3基於聚類融合去冗餘的改進欠採樣方法原理 2.4基於聚類融合去冗餘的改進欠採樣方法實現及性能分析 2.4.1算法實現 2.4.2基於聚類融合去冗餘的改進欠採樣方法性能分析 2.4.3實驗結果與分析 2.5基於聚類融合去冗餘的改進欠採樣算法實現源碼 2.6本章小結 參考文獻 第3章 基於特徵層面的非平衡數據集預測 3.1非平衡數據集的特徵選擇 3.1.1非平衡數據集下的綜合概率比特徵選擇 3.1.2面向非平衡數據集的鄰居詞正負特徵選擇 3.2用於非平衡數據集的深度學習方法 3.2.1針對非平衡數據集的神經網絡與最小最大概率機模型 3.2.2生成式對抗網絡用於非平衡數據集分類問題 3.3本章小結 參考文獻 第4章 決策樹模型 4.1決策樹基礎知識 4.1.1基本概念 4.1.2建樹過程 4.1.3規則提取 4.1.4剪枝技術 4.1.5信息熵 4.2已有單決策樹簡介 4.2.1決策樹算法性能對比 4.2.2 ID3算法 4.2.3 C4.5算法 4.2.4 CART算法 4.2.5 SLIQ算法 4.2.6 SPRINT算法 4.3隨機森林算法 4.3.1隨機森林算法原理 4.3.2隨機森林算法的實現 4.4決策樹算法性能比較 4.4.1不同決策樹算法節點分裂指標對比及分析 4.4.2決策樹算法存在的問題 4.5基於混合策略的決策樹預測模型 4.5.1混合屬性選擇策略 4.5.2混合屬性選擇策略分類性能分析 4.6基於混合策略的決策樹預測模型代碼實現 4.7本章小結 參考文獻 第5章 基於代價敏感理論的決策樹模型 5.1代價敏感理論 5.1.1代價敏感基本理論 5.1.2代價函數 5.2代價敏感理論優化的經典單決策樹預測模型 5.2.1 CS-ID3決策樹 5.2.2 IDX決策樹 5.2.3 CS-C4.5決策樹 5.3基於代價敏感的屬性選擇混合策略單決策樹模型 5.3.1基於代價敏感理論的屬性選擇混合策略 5.3.2 CHDT算法性能驗證 5.4基於不同根節點信息的代價敏感屬性選擇混合策略多決策樹模型 5.4.1基於不同根節點信息的代價敏感屬性選擇混合策略多決策樹 5.4.2 CHAIRF算法性能驗證 5.5代價敏感混合屬性選擇策略單決策樹模型在煤礦安全預警中的應用 5.5.1基於代價敏感混合屬性選擇策略單決策樹CHDT模型構建 5.5.2 CHDT模型用於煤礦突水預測性能分析 5.6 CHAIRF多決策樹模型的分佈式實現 5.6.1 Hadoop環境配置及搭建 5.6.2決策樹準確率與算法計算時間研究 5.6.3 CHAIRF算法分佈式編程模型設計及實現 5.6.4多線程分佈式CHAIRF算法 5.7本章小結 參考文獻 第6章 強化學習獎懲機制優化的決策樹模型 6.1強化學習理論基礎 6.2基於強化學習的累積回報屬性選擇方法 6.2.1提出動機與基本思想 6.2.2屬性選擇策略 6.2.3實驗及結果分析 6.3基於同分佈隨機採樣的改進集成森林算法基本理論 6.3.1同分佈隨機採樣法 6.3.2基於同分佈隨機採樣的改進集成森林算法 6.3.3實驗及結果分析 6.4基於強化學習累積回報機制的多決策樹推薦模型 6.4.1決策樹推薦模型構建 6.4.2實驗及結果分析 6.5本章小結 參考文獻 第7章 基於深度強化學習的腦卒中非平衡數據集分類預測模型 7.1深度強化學習 7.1.1深度強化學習研究進展綜述 7.1.2深度Q網絡基本理論 7.2面向非平衡數據集的深度強化學習分類預測模型構建 7.2.1非平衡數據集分類預測問題到馬爾可夫決策過程的映射 7.2.2非平衡數據集分類預測問題DQN的訓練 7.2.3非平衡數據集分類預測模型訓練 7.3實驗方案 7.4實驗結果與分析 7.5本章小結 參考文獻 第8章 非平衡模糊支持向量機分類預測模型 8.1模糊支持向量機相關理論 8.1.1統計學原理 8.1.2支持向量機理論 8.1.3模糊支持向量機 8.2一種改進的模糊隸屬度函數確定方法 8.2.1模糊隸屬度函數構造方法 8.2.2改進的模糊隸屬度函數確定方法 8.3非平衡模糊支持向量機 8.3.1非平衡調節因子 8.3.2非平衡模糊支持向量機 8.3.3實驗與結果分析 8.4模糊支持向量機在腦卒中TCD數據分類中的應用 8.4.1腦卒中TCD數據及特點分析 8.4.2基於非平衡模糊支持向量機的TCD數據分類 8.5本章小結 參考文獻 第9章 基於極限學習機的非平衡數據集分類預測研究 9.1人工神經網絡 9.1.1神經網絡結構 9.1.2單隱含層前饋神經網絡 9.2極限學習機 9.2.1極限學習機ELM基礎理論 9.2.2加權極限學習機W-ELM 9.3蝙蝠算法優化的極限學習機模型 9.3.1蝙蝠算法原理 9.3.2 BA-ELM分類模型原理 9.3.3算法流程 9.3.4蝙蝠算法優化極限學習機的腦卒中TCD數據分類 9.4本章小結 參考文獻 第10章 基於優化核極限學習機的非平衡數據集分類預測模型 10.1基於時變慣性權重的改進蝙蝠算法 10.1.1基於時變慣性權重的改進蝙蝠算法原理 10.1.2改進蝙蝠算法性能測試 10.2改進蝙蝠算法優化核極限學習機 10.2.1核極限學習機KELM 10.2.2改進蝙蝠算法優化參數流程 10.2.3 IBA-KELM模型運行流程 10.3優化核極限學習機性能驗證 10.3.1基於公共數據集的IBA-KELM模型預測性能驗證 10.3.2優化的核極限學習機用於腦卒中TCD數據分類 10.4最大化G-means的代價調整極限學習機模型 10.4.1基本原理 10.4.2 MG-CCR-ELM模型運行流程 10.5最大化G-means的代價調整極限學習機性能驗證 10.5.1公共數據集測試 10.5.2腦卒中TCD數據分類預測 10.6本章小結 參考文獻 第11章 聚類算法用於非平衡數據集分析 11.1聚類算法介紹 11.1.1聚類算法分類 11.1.2聚類算法研究現狀 11.2 FCM及其改進算法簡介 11.2.1 FCM算法 11.2.2 LFCM算法 11.2.3 EW-LFCM算法 11.3基於迭代信息熵權的改進LFCM算法 11.3.1 IEW-LFCM算法原理 11.3.2 IEW-LFCM算法流程 11.3.3實驗及結果分析 11.3.4非平衡數據集聚類性能 11.4本章小結 參考文獻 附錄A 專業術語縮寫英漢對照表