DolphinDB 從入門到精通之數據分析

周小華

  • 出版商: 人民郵電
  • 出版日期: 2024-09-01
  • 定價: $594
  • 售價: 8.5$505
  • 語言: 簡體中文
  • 頁數: 418
  • ISBN: 7115650195
  • ISBN-13: 9787115650191
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

  • DolphinDB 從入門到精通之數據分析-preview-1
  • DolphinDB 從入門到精通之數據分析-preview-2
DolphinDB 從入門到精通之數據分析-preview-1

商品描述

DolphinDB不僅支持海量數據的高效存儲與查詢,更開創性地提供了功能完備的編程語言以支持復雜分析,以及高吞吐、低延時、開發便捷的流數據分析框架,是計算能力最強的數據庫系統之一。本書從入門概念開始介紹,到實踐應用分析,講解深入淺出、易於理解,是一本具有實踐意義的數據分析工具書。本書介紹瞭如何使用 DolphinDB這一集存儲和高性能計算的數據庫系統進行數據分析實踐,提供了大量金融和物聯網等場景的實踐案例,讀者可以通過借鑒和修改案例中的解決方案,將它們應用於自己的數據分析系統之中。即使是零基礎的讀者,也能通過學習本書,快速上手實踐。

作者簡介

周小华:

1 教育背景: 上海交通大学取得本科和硕士学位,在美国Drexel大学获得信息科学和技术博士学位

2 工作经历与社会活动: 博士毕业后,在美国 LYZ 基金、巴克莱资本、摩根史丹利从事程序化交易策略和高频交易系统的研发,是金融大数据存储,检索、分析和建模方面的资深专家。2016年归国成立浙江智臾科技有限公司 主要从事文本检索、数据挖掘和大数据方向的研究。2016年回国创立智臾科技,研发的高性能分布式时序数据库 DolphinDB 已经广泛应用于头部的券商、公募基金、私募基金和银行,成为量化金融重要的基础设施。 浙江省千人计划人才

3 出版作品: 在相关领域的国际顶级期刊和顶级学术会议(TKDE,SIGIR,SIGKDD,CIKM 等)发表论文30余篇。

目錄大綱

1、 編程入門

1.1導論

1.2數據類型

1.3運算符

1.4編程語句

1.5函數

 

2、 數據結構

2.1概述

2.2向量

2.3元組

2.4 array vector(數組向量)

2.5 columnar tuple(列式元組)

2.6 矩陣

2.7 表

2.8 字典

 

3、 數據清洗

3.1信息統計

3.2缺失值處理

3.3異常值處理

3.4重復值處理

3.5離散化處理

3.6數據類型轉換

3.7 數據查找和取數

3.8表格數據增刪改

3.9數據整合

3.10數據對齊

3.11數據重組

3.12數據重排列和抽樣

3.13時序數據處理

3.14字符串操作

 

4、 窗口計算

4.1 窗口計算的分類

4.2 滾動窗口

4.3滑動窗口

4.4其他窗口

4.5窗口計算對數據的處理邏輯及更多場景小結

 

5、 函數式編程

5.1優越性

5.2基礎概念

5.3純函數

5.4高階函數

5.5部分應用

5.6函數元編程

5.7模塊和函數視圖

6、 SQL 編程

6.1 SQL特點

6.2 SQL拓展語法

6.3 元編程

6.4 SQL解析和執行

6.5 SQL優化

6.6 SQL優化案例

 

7、 流計算

7.1基礎概念

7.2流數據引擎

7.3數據回放

7.4流批一體

7.5總結與比較

 

8、 數據可視化

8.1 VSCode 插件 / GUI

8.2 DashBoard

8.3 第三方平臺

 

9、 並行計算 & 分佈式計算

9.1並行計算

9.2分佈式集群架構

9.3分佈式計算

9.4性能調優

 

10、 數據導入導出

10.1文本文件CSV

10.2 HDF5

10.3 Parquet

10.4 binary Record

10.5 MySQL

10.6 Oracle

10.7 MQ(以Kafka為例)

 

11、 JIT

11.1支持性

11.2迭代計算

11.3流計算

12、 統計分析和優化

12.1概率統計

12.2概率分佈

12.3隨機數生成

12.4回歸

12.5假設檢驗

12.6優化器

 

13、 機器學習/GPU/AI

13.1機器學習

13.2深度學習

13.3 GPU支持

 

14、 DolphinDB 與其他數據分析工具的集成與兼容

14.1 Excel集成

14.2 Python集成與兼容

附錄