Excel + Python 輕松掌握數據分析

曹化宇

  • 出版商: 人民郵電
  • 出版日期: 2023-12-01
  • 售價: $539
  • 貴賓價: 9.5$512
  • 語言: 簡體中文
  • 頁數: 383
  • ISBN: 7115623813
  • ISBN-13: 9787115623812
  • 相關分類: ExcelData Science
  • 立即出貨

  • Excel + Python 輕松掌握數據分析-preview-1
  • Excel + Python 輕松掌握數據分析-preview-2
Excel + Python 輕松掌握數據分析-preview-1

買這商品的人也買了...

商品描述

本書重點介紹了目前處理數據非常有效的工具——Excel、Python和數據庫的應用知識。本書通過一則完整的故事討論瞭如何以Python編程為中心,結合Excel和數據庫的特點,並以基礎統計學貫穿其中,幫助讀者深入地瞭解數據分析的相關知識。在本書中,首先,討論瞭如何使用Excel整理數據,以及Excel中數學和統計函數的應用;其次,探討了與Python編程相關的數據分析內容,包括在Python中進行數據統計工作,以及各種格式數據的轉換等;然後,討論SQLite和MySQL數據庫的應用,並介紹瞭如何使用Python操作數據庫;最後,介紹瞭如何綜合使用Excel、數據庫和Python編程等工具打造自動化的數據處理中心。

本書架構清晰,內容深入淺出,案例豐富,適合需要進行數據處理和統計分析的職場人士、電腦愛好者等閱讀。

作者簡介

曹化宇,独立软件开发人,拥有20余年软件开发经验,从事Windows、.NET Framework、Android等应用开发,精通Web项目开发。编写的图书有《网站全栈开发指南:HTML+CSS+JavaScript+PHP》《网站全栈开发指南:HTML+CSS+JavaScript+ASP.NET》《Java与Android移动应用开发:技术、方法与实践》《C#开发实用指南:方法与实践》《Objective-C和Sprite Kit游戏开发从入门到精通》《构建高质量的C#代码》等。

目錄大綱

第 1章 網店開業——初識數據 1

1.1 清點庫存——獲取原始數據 1

1.2 數據標準化——整理Excel 數據 2

1.2.1 二維表 3

1.2.2 數據完整性與正確性 5

1.2.3 拆分數據——分列與 公式 7

1.2.4 數據類型和顯示格式 11

1.2.5 分而治之,按需組合 12

1.3 認識數據 14

1.3.1 定量數據和定性數據 14

1.3.2 絕對量與相對量 14

1.4 尋找“大客戶”——排序 16

1.5 數據挑著看——篩選 17

1.6 數據交換——Excel和CSV 19

第 2章 銷量的起伏——數據背後的 故事 25

2.1 銷售數據如何——簡單的統計 25

2.1.1 算術平均數 26

2.1.2 幾何平均數 27

2.1.3 眾數 30

2.1.4 最小值和最大值 32

2.1.5 中位數、四分位數和 百分位數 33

2.1.6 方差和標準差 35

2.1.7 標準分 36

2.1.8 分類匯總 38

2.1.9 數據透視表 41

2.2 學看統計圖 43

2.2.1 折線圖 43

2.2.2 餅圖 45

2.2.3 條形圖 46

2.3 銷量下降——是時候認真 分析數據了 47

2.3.1 轉化率——訪問量和 銷量 48

2.3.2 訪問量-購買量=? 50

第3章 凌晨3點——又加班了 51

3.1 多銷售渠道的煩惱 51

3.2 日報表、月報表、 年度報表等 53

第4章 強大的信息處理工具—— Python編程 54

4.1 創建Python環境 54

4.1.1 Visual Studio 54

4.1.2 代碼文件的編碼問題 56

4.1.3 使用指定版本的Python 58

4.1.4 設置Path環境變量 59

4.1.5 命令行窗口 61

4.1.6 Python命令行環境 62

4.2 編寫Python代碼 64

4.3 功能實現者——函數和lambda 表達式 66

4.3.1 函數 66

4.3.2 可調用類型 71

4.3.3 lambda表達式 73

4.4 “對象”是主角——面向對象 編程 74

4.4.1 類與對象 74

4.4.2 繼承 80

4.4.3 “魔術方法” 82

4.4.4 with語句 84

4.4.5 類成員和靜態方法 87

4.5 模塊化管理 91

4.6 向左還是向右——代碼流程 控制 96

4.6.1 條件判斷和if語句 96

4.6.2 循環語句 100

4.6.3 match語句 103

4.7 處理運行錯誤 104

第5章 更靈活的計算——在Python 中處理數據 108

5.1 不一樣的算術運算 108

5.2 隨機數 110

5.3 序列 112

5.3.1 列表 113

5.3.2 元組 121

5.3.3 數列 123

5.4 字典 124

5.5 集合 128

5.6 更自由的排列—— sorted() 函數 129

5.7 數學計算—— math模塊 131

5.8 統計資源—— statistics模塊 132

5.8.1 使用Fraction類處理 分數 132

5.8.2 算術平均數 133

5.8.3 幾何平均數 133

5.8.4 眾數 134

5.8.5 中位數 134

5.8.6 方差和標準差 135

5.9 計算百分位數 136

5.10 計算標準分數 139

5.11 按中文拼音排序 139

5.12 日期和時間 142

5.12.1 datetime類 142

5.12.2 時間間隔 143

5.12.3 時區 144

5.12.4 時間戳 144

5.12.5 日期和時間的推算 145

5.12.6 格式轉換 146

第6章 “超能熊貓”來幫忙—— pandas應用 149

6.1 Series對象 149

6.2 排序 152

6.3 統計方法 154

第7章 二維表模型—— DataFrame  158

7.1 DataFrame對象 158

7.2 讀取數據 160

7.2.1 iloc和loc屬性 160

7.2.2 讀取列 163

7.2.3 讀取行 164

7.3 排序 168

7.4 按條件查詢數據 170

7.5 處理空值數據 173

7.6 處理重復數據 174

7.7 數據旋轉 177

7.8 數據合並 178

7.9 數據連接 181

7.10 統計方法 182

7.11 分組 183

7.12 透視表 185

第8章 圖形更直觀——pandas 繪制統計圖 188

8.1 部分與整體的比例——餅圖 189

8.2 數據的關系與分佈——散點圖與 氣泡圖 193

8.3 趨勢——折線圖 197

8.4 更直觀的對比——條形圖 202

8.5 數據的“距”——箱線圖 209

第9章 數據中轉站——數據格式 轉換 211

9.1 xlwt模塊寫入Excel 211

9.2 xlrd模塊讀取Excel 215

9.3 openpyxl模塊讀寫Excel 217

9.4 pandas模塊讀寫Excel 220

9.5 csv模塊讀寫CSV數據 223

9.6 pandas模塊讀寫CSV數據 227

第 10章 強大的數據倉庫—— SQLite數據庫 229

10.1 使用DB Browser for SQLite 229

10.2 數據類型 230

10.3 數據表 230

10.3.1 創建表 230

10.3.2 表的關聯——主鍵、唯一 約束和外鍵 232

10.3.3 添加字段 234

10.3.4 刪除表 235

10.3.5 sqlite_master系統表 235

10.3.6 索引 236

10.4 導入CSV數據 236

10.5 查詢與視圖 237

10.5.1 查詢條件 238

10.5.2 排序 240

10.5.3 分組與統計 242

10.5.4 連接 243

10.5.5 聯合 245

10.5.6 limit和offset關鍵字 247

10.5.7 exists語句 248

10.5.8 case語句 248

10.5.9 視圖 249

10.5.10 將查詢結果 保存到表 251

10.5.11 將數據保存到CSV 文件 252

10.6 添加數據 252

10.7 修改數據 254

10.8 刪除數據 255

10.9 日期和時間的處理方式 255

第 11章 Python操作SQLite 261

11.1 應用基礎 261

11.1.1 執行SQL語句 262

11.1.2 讀取查詢結果 263

11.1.3 創建tSqlite類 263

11.2 查詢單值 265

11.3 查詢單條記錄 266

11.4 查詢多條記錄 267

11.5 查詢單列數據 270

11.6 添加數據 271

11.7 修改數據 273

11.8 刪除數據 274

11.9 擴展操作 275

11.9.1 自定義函數 275

11.9.2 聚合函數 277

11.9.3 排序規則 280

11.10 pandas讀取和寫入SQLite數據 282

第 12章 更大、更快、更強——MySQL數據庫 285

12.1 MySQL安裝與配置 285

12.2 使用HeidiSQL 289

12.3 常用數據類型 291

12.4 數據表 292

12.4.1 創建表 292

12.4.2 主鍵、唯一值和外鍵約束 294

12.4.3 修改字段定義 295

12.4.4 復製表結構 296

12.4.5 表的重命名(表的移動) 297

12.4.6 刪除表 298

12.4.7 索引 298

12.5 導入CSV數據 298

12.6 查詢和視圖 302

12.6.1 查詢條件與排序 302

12.6.2 分組與統計 307

12.6.3 連接 307

12.6.4 聯合 308

12.6.5 limit和offset關鍵字 310

12.6.6 exists語句 311

12.6.7 case語句 311

12.6.8 視圖 312

12.6.9 查詢結果保存到表 312

12.6.10 查詢結果導出CSV 313

12.7 數據添加、修改和刪除 314

12.7.1 添加數據 314

12.7.2 修改數據 315

12.7.3 刪除數據 315

12.8 常用函數與功能 315

12.8.1 統計與數學計算 315

12.8.2 文本操作 316

12.8.3 日期和時間 317

12.8.4 if()和ifnull()函數 320

12.8.5 判斷對象是否存在 320

12.9 存儲過程 321

第 13章 Python操作MySQL 323

13.1 應用基礎 323

13.1.1 連接數據庫 323

13.1.2 執行SQL並讀取查詢結果 324

13.1.3 使用參數傳遞數據 325

13.2 創建tMySql類 325

13.3 查詢單值 327

13.4 查詢單條記錄 328

13.5 查詢多條記錄 329

13.6 查詢單列數據 331

13.7 添加記錄 332

13.8 修改數據 335

13.9 刪除記錄 336

13.10 pandas讀取和寫入MySQL數據 337

第 14章 數據一籮筐——打造數據中心 339

14.1 創建數據中心 339

14.2 批量導入數據 341

14.2.1 標準化數據 341

14.2.2 導入Excel數據 342

14.3 定時導入 343

14.4 處理網絡數據 349

14.4.1 HTML表格 349

14.4.2 JSON 352

14.5 從圖像中識別數據OCR) 353

14.5.1 圖像識別——EasyOCR 354

14.5.2 裁剪圖片 356

14.5.3 保存到“數據中心” 359

第 15章 更深入的數據分析 365

15.1 客戶的抱怨——處理文本信息 365

15.1.1 字符串處理 366

15.1.2 正則表達式 368

15.2 關於服裝的信息 373

15.3 “購買指數”——產品推薦算法 374

第 16章 早上八點,一杯咖啡,一份報表 378

16.1 自動生成報表 378

16.1.1 數據計算 378

16.1.2 生成Excel報表 379

16.2 繼續前進 383