並行演算法設計與性能優化 并行算法设计与性能优化

劉文志

下單後立即進貨 (約4週~6週)

買這商品的人也買了...

相關主題

商品描述

 

<內容簡介>

《並行演算法設計與性能優化》是「並行計算與性能優化」系列的第1本,主要講解了並行計算的核心理論、演算法設計和實踐,以及代碼的性能優化;第2本和第3本則涵蓋了並行編程方法與優化實踐、科學計算與企業級應用的並行優化等重要主題,這些內容被許多頂級開發人員視為「不傳之秘」。本書作者劉文志是國內頂尖的並行計算專家,曾任英偉達並行計算工程師和百度在線高級研發工程師,在該領域的經驗和修為極為深厚,他毫不吝嗇地將自己多年的積累呈現在這3本書中,得到了百度深度學習研究院「傑出科學家」吳韌的高度評價和強烈推薦。
本書結合大量示例和偽代碼,詳細介紹了單核代碼的性能優化和向量化技術,在現代多核處理器上如何設計並行演算法,以及基於GPU和移動處理器(ARM)的代碼性能優化與並行化。

 

<章節目錄>

前言
第1章 緒論
  1.1 並行和向量化的作用
  1.2 為什麼要並行或向量化
  1.3 為什麼向量化或並行難
  1.4 並行的替代方法
  1.5 進程、線程與處理器
  1.6 並行硬件平臺
  1.7 向量化和多核技術不是萬能的
  1.8 本章小結
第2章 現代處理器特性
  2.1 指令級並行
    2.1.1 指令流水線
    2.1.2 亂序執行
    2.1.3 指令多發射
    2.1.4 分支預測
    2.1.5 VLIW
  2.2 向量化並行
    2.2.1 SIMD
    2.2.2 SIMT
  2.3 線程級並行
    2.3.1 內核線程和用戶線程
    2.3.2 多線程編程庫
    2.3.3 多核上多線程並行要註意的問題
    2.3.4 多線程程序在多核和單核上運行的不同
  2.4 緩存
    2.4.1 緩存層次結構
    2.4.2 緩存一致性
    2.4.3 緩衝不命中
    2.4.4 寫緩存
    2.4.5 越過緩存
    2.4.6 硬件預取
    2.4.7 緩存結構
    2.4.8 映射策略
  2.5 虛擬存儲器和
  2.6 NUMA技術
  2.7 本章小結
第3章 演算法性能和程序性能的度量與分析
  3.1 演算法分析的性能度量標準
    3.1.1 時間複雜度與空間複雜度
    3.1.2 實現複雜度
  3.2 程序和指令的性能度量標準
  3.3 程序性能優化的度量標準
    3.3.1 加速比與並行效率
    3.3.2 Amdahl定律和Gustafson定律
  3.4 程序性能分析實用工具
  3.5 本章小結
第4章 串行代碼性能優化
  4.1 系統級別
  4.2 應用級別

  ……
第5章 依賴分析
第6章 並行編程模型及環境
第7章 並行演算法設計方法
第8章 並行演算法缺陷
第9章 並行編程模式實踐
第10章 如何並行遺留代碼
第11章 超級並行
第12章 並行演算法設計的一般準則
附錄A 整型數據與浮點數據