大數據演算法 Algorithms for Big Data
Moran Feldman 譯祝全亮 孫琳
- 出版商: 北京航空航天大學
- 出版日期: 2024-05-01
- 定價: $774
- 售價: 7.9 折 $611
- 語言: 簡體中文
- 頁數: 300
- 裝訂: 平裝
- ISBN: 7512442904
- ISBN-13: 9787512442900
-
相關分類:
大數據 Big-data
- 此書翻譯自: Algorithms for Big Data
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
可靠度工程概論, 6/e (精裝本)$400$360 -
IC封裝製程與 CAE應用, 4/e$470$423 -
$458精通 Linux 內核開發 (Mastering Linux Kernel Development) -
數碼相機中的圖像傳感器和信號處理$270$257 -
$422算法設計與分析 — 基於計算教學論的解析 -
實用 IC 封裝, 2/e$550$495 -
$611數據科學:基本概念、技術及應用 -
$455算法詳解(捲4)——NP-Hard問題算法 -
$1,010集成電路封裝可靠性技術 -
$250矩陣論及其應用 -
$305算法設計與實踐 -
$283大模型入門:技術原理與實戰應用 -
$352Linux實戰——從入門到精通 -
$505電網可靠度評估—模型與方法 -
$469推薦系統全連結設計:原始理解與業務實踐 -
$454矽谷 Python 工程師面試指南:資料結構、演算法與系統設計 -
$611數據驅動的進化優化 -
$356量子機器學習理論與實戰 -
$469AIGC 大語言模型輕鬆學: 從個人應用到企業實踐 -
$473基於機器學習的個性化推薦算法及應用 -
多模態大模型:算法、應用與微調$714$678 -
集成學習實戰$768$730 -
$469基於深度學習的圖像處理與實踐 -
$356大模型導論 -
$407機器視覺偵測與辨識技術及應用 基於深度學習
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
網絡的出現使人們第一次能夠存取大量的資料。
例如,社群網絡Facebook中的友誼圖和網絡網站之間的連結圖。
這兩幅圖都包含超過10億個節點,代表巨大的資料集。
如果要使用這些資料集,就必須對其進行處理和分析。
然而,僅僅是它們的大小就使得這種處理非常具有挑戰性。
特別是,為處理中等規模的資料集而開發的經典演算法和技術,在面對如此大的資料集時往往需要超出常規的時間和空間。
此外,在某些情況下,儲存整個資料集甚至是不可行的,因此,必須在資料集的各個部分對其進行處理,然後很快丟棄每部分。
上述挑戰推動了加工處理「大數據」(海量資料)的新工具和新技術的發展。
在本書中,我們對這項工作採取了計算機科學理論的觀點。
特別是,我們將研究旨在捕捉“大數據”計算帶來的挑戰的計算模型,以及為應對這些挑戰而開發的實際解決方案的特性。
我們將透過調查一些經典的演算法結果,包括許多最先進的結果,來瞭解這些計算模型中的每一個模型。
本書的設計有兩個相互矛盾的目標,如下所示:
(1)試圖在大數據背景下,給出計算機科學理論工作的一個大概的工作原理。
(2)力求做到有足夠的細節,使讀者能夠參與所涵蓋主題的研究工作。
目錄大綱
第1章 資料流演算法簡介……………………………………………………………… 1
1.1 資料流模型 …………………………………………………………………… 1
1.2 評估資料流演算法 ……………………………………………………………… 5
1.3 文獻說明(Bibliographic Notes)……………………………………………… 6
練習解析……………………………………………………………………………… 6
第2章 基本機率與尾界……………………………………………………………… 9
2.1 離散機率空間 ……………………………………………………………… 9
2.2 隨機變量…………………………………………………………………… 13
2.3 指標與二項分佈…………………………………………………………… 19
2.4 尾 界………………………………………………………………………… 20
練習解析 ………………………………………………………………………… 25
第3章 估計算法 …………………………………………………………………… 35
3.1 估計流長度的莫裡斯演算法…………………………………………… 35
3.2 改善估計…………………………………………………………………… 39
3.3 結束語………………………………………………………………………… 44
3.4 文獻說明…………………………………………………………………… 44
練習解析 ………………………………………………………………………… 45
第4章 蓄水池採樣演算法 ……………………………………………………………… 51
4.1 均勻抽樣…………………………………………………………………… 51
4.2 近似中位數和分位數………………………………………………………… 53
4.3 加權抽樣…………………………………………………………………… 56
4.4 文獻說明…………………………………………………………………… 58
練習解析 ………………………………………………………………………… 59
第5章 成對獨立的雜湊函數 ……………………………………………………… 65
5.1 成對雜湊函數族…………………………………………………………… 65
5.2 成對獨立哈希族的簡單構造……………………………………………… 66
5.3 成對獨立哈希族和k 向獨立哈希族的高階構造 ……………………… 68
5.4 文獻說明…………………………………………………………………… 71
練習解析 ………………………………………………………………………… 71
第6章 計算不同代幣的數量 ………………………………………………………… 75
6.1 AMS演算法 ………………………………………………………………… 75
6.2 一種改良的演算法……………………………………………………………… 78
6.3 不可能的結果……………………………………………………………… 82
6.4 文獻說明…………………………………………………………………… 84
練習解析 ………………………………………………………………………… 85
第7章 Sketches …………………………………………………………………… 92
7.1 資料流模型的一般化………………………………………………… 92
7.2 最小計數Sketches ………………………………………………………… 95
7.3 計算Sketches ……………………………………………………………… 100
7.4 線性Sketches …………………………………………………………… 105
7.5 文獻說明 …………………………………………………………………… 106
練習解析………………………………………………………………………… 107
第8章 圖形資料流演算法……………………………………………………………… 114
8.1 概 述 …………………………………………………………………… 114
8.2 最大權匹配 ……………………………………………………………… 117
8.3 三角形計數 ……………………………………………………………… 125
8.4 文獻說明 ………………………………………………………………… 128
練習解析………………………………………………………………………… 129
第9章 滑動視窗模型……………………………………………………………… 135
9.1 概 述 …………………………………………………………………… 135
9.2 滑動視窗模型中的圖連通性 ……………………………………………… 137
9.3 平滑直方圖 ……………………………………………………………… 141
9.4 文獻說明 ………………………………………………………………… 147
練習解析………………………………………………………………………… 148
第10章 次線性時間演算法簡介 …………………………………………………… 154
10.1 簡單的例子……………………………………………………………… 154
10.2 估計直徑…………………………………………………………………… 156
10.3 查詢複雜性……………………………………………………………… 158
10.4 文獻說明………………………………………………………………… 158
練習解析………………………………………………………………………… 159
第11章 性能測試 …………………………………………………………………… 161
11.1 屬性測試演算法………………………………………………………… 161
11.2 測試n 個數字的清單是否重複 …………………………………… 163
11.3 列表模型和被排序列表的測試………………………………………… 166
11.4 半平面的像素模型及其檢定……………………………………………… 169
11.5 結束語…………………………………………………………………… 173
11.6 文獻說明…………………………………………………………………… 174
練習解析………………………………………………………………………… 175
第12章 有界度圖的演算法 ………………………………………………………… 182
12.1 計算連接組件數量……………………………………………………… 182
12.2 最小權生成樹…………………………………………………………… 186
12.3 最小頂點覆蓋…………………………………………………………… 188
12.4 測試圖形是否連通……………………………………………………… 196
12.5 文獻說明…………………………………………………………………… 200
練習解析………………………………………………………………………… 201
第13章 稠密圖的一種演算法 ………………………………………………………… 211
13.1 模 型…………………………………………………………………… 211
13.2 二部性檢定演算法………………………………………………………… 212
13.3 減少要檢查的分區數…………………………………………………… 214
13.4 取消假設………………………………………………………………… 217
13.5 文獻說明………………………………………………………………… 222
練習解析………………………………………………………………………… 222
第14章 布林函數的演算法 ………………………………………………………… 227
14.1 模 型…………………………………………………………………… 227
14.2 測試線性度……………………………………………………………… 228
14.3 單調性檢定……………………………………………………………… 232
14.4 文獻說明………………………………………………………………… 238
練習解析………………………………………………………………………… 239
第15章 Map-Reduce概述………………………………………………………… 243
15.1 關於 Map-Reduce的一些細節 ………………………………………… 244
15.2 Map-Reduce的理論模型 ……………………………………………… 247
15.3 績效指標…………………………………………………………… 249
15.4 不同的理論模型………………………………………………………… 251
15.5 文獻說明………………………………………………………………… 252
練習解析………………………………………………………………………… 253
第16章 列表的演算法 ……………………………………………………………… 256
16.1 計算 Word頻率………………………………………………………… 256
16.2 字首和…………………………………………………………………… 259
16.3 索 引…………………………………………………………………… 263
16.4 文獻說明…………………………………………………………………… 264
練習解析………………………………………………………………………… 264
第17章 圖演算法 …………………………………………………………………… 273
17.1 最小權重生成樹………………………………………………………… 273
17.2 三角形列表……………………………………………………………… 279
17.3 文獻說明…………………………………………………………………… 282
練習解析………………………………………………………………………… 283
第18章 局部敏感哈希 ……………………………………………………………… 289
18.1 主 旨…………………………………………………………………… 289
18.2 局部敏感雜湊函數族的範例……………………………………………… 291
18.3 放大局部敏感雜湊函數族……………………………………………… 293
18.4 文獻說明………………………………………………………………… 295
練習解析………………………………………………………………………… 296
