智能分析:ChatGPT+Excel+Python超強組合玩轉數據分析

童大謙

  • 出版商: 電子工業
  • 出版日期: 2023-12-01
  • 售價: $534
  • 貴賓價: 9.5$507
  • 語言: 簡體中文
  • 頁數: 296
  • ISBN: 7121466201
  • ISBN-13: 9787121466205
  • 相關分類: ChatGPTExcelData Science
  • 立即出貨

買這商品的人也買了...

商品描述

寫作本書的目的是希望讓不懂編程的讀者也能使用ChatGPT生成代碼,輕松實現Excel數據處理自動化,讓讀者從零基礎成為高手;讓懂編程的讀者也能收獲良多,快速提升工作效率。書中用ChatGPT自動生成代碼,實現了Excel數據處理自動化的絕大部分內容,包括數據導入和導出、數據整理、數據預處理、數據統計分析、數據可視化和與Excel工作表交互等。書中針對數據處理的每個問題都提供了示例,結合示例實踐了提示詞的編寫技巧,並對與表達、數據、輸出、效率和語言等相關的主題進行了探討和總結。書中的代碼是使用pandas、xlwings和OpenPyXL編寫的,這也是目前通過編程方式處理Excel數據最優的工具組合。本書適合任何對ChatGPT和Excel數據處理感興趣的讀者閱讀,包括職場辦公人員、數據分析人員、大學生、科研人員和程序員等。

目錄大綱

第1章 概述 1
1.1 Excel和Python數據處理簡介 1
1.1.1 Excel數據處理 1
1.1.2 使用Python處理數據 2
1.1.3 pandas、xlwings和OpenPyXL組合的優勢 2
1.1.4 DataFrame和Series 3
1.1.5 Python及各種包的安裝 4
1.1.6 Python IDLE編程環境 5
1.2 ChatGPT及其操作基礎 7
1.2.1 ChatGPT簡介 7
1.2.2 得到想要的答案:提示詞簡介 7
1.2.3 使用ChatGPT生成代碼 9
1.2.4 面向問題重構與提示詞模板 11
1.2.5 使用ChatGPT進行數據分析的主要思想和步驟小結 11
1.3 提示詞的編寫技巧 12
1.3.1 基本技巧 12
1.3.2 數據相關 12
1.3.3 表達相關 13
1.3.4 輸出相關 14
1.3.5 效率相關 14
1.3.6 語言相關 15
1.4 怎樣使用本書 16
1.4.1 不同讀者怎樣使用本書 16
1.4.2 在使用提示詞時可能遇到的問題及解決辦法 16

第2章 使用ChatGPT+pandas實現數據導入和導出 18
2.1 使用ChatGPT+pandas導入Excel文件中的數據 18
2.1.1 導入Excel文件中的全部數據 18
2.1.2 導入Excel文件中的部分數據 20
2.2 使用ChatGPT+pandas將數據寫入Excel文件中 21
2.3 使用ChatGPT+pandas實現CSV文件中數據的導入和導出 23
2.4 將數據保存到新工作簿的工作表中 25
2.5 將數據保存到同一工作簿的新工作表中 27
2.6 局部區域數據的導入和導出(與xlwings交互) 31
2.7 局部區域數據的導入和導出(與OpenPyXL交互) 33

第3章 使用ChatGPT+pandas實現單個文件數據的整理 36
3.1 使用ChatGPT+pandas實現列操作 36
3.1.1 直接添加一個新列 36
3.1.2 利用已有列數據通過簡單計算得到新列 38
3.1.3 利用已有列數據通過轉換得到新列 39
3.1.4 利用已有列數據通過統計得到新列 42
3.1.5 根據簡單條件得到新列 45
3.1.6 根據多級條件得到新列 46
3.1.7 根據多列數據組成的條件得到新列 48
3.1.8 根據條件得到新列(mask方法) 50
3.1.9 根據條件得到新列(where方法) 51
3.1.10 插入列 53
3.1.11 修改單個列的列名 54
3.1.12 修改多個列的列名 56
3.1.13 給所有列名添加前綴和後綴 57
3.1.14 修改列數據的數據類型 59
3.1.15 修改列數據 61
3.1.16 修改列數據的格式 63
3.1.17 將列中的字符串數據修改為數字 65
3.1.18 根據條件修改數據 67
3.1.19 刪除列 68
3.2 使用ChatGPT+pandas實現行操作 70
3.2.1 直接添加一個新行 70
3.2.2 利用已有行數據通過計算得到新行 72
3.2.3 插入行 74
3.2.4 修改行名 76
3.2.5 修改行數據 78
3.2.6 刪除行 79
3.3 使用ChatGPT+pandas實現值操作 81
3.3.1 修改單個值 81
3.3.2 修改局部區域中的值 82
3.3.3 修改所有值 84
3.4 使用ChatGPT+pandas實現數據查詢 86
3.4.1 單條件查詢 86
3.4.2 多條件查詢 88
3.5 使用ChatGPT+pandas實現數據排序 89
3.5.1 單條件排序 89
3.5.2 多條件排序 91
3.5.3 提取前3名數據 92
3.6 使用ChatGPT+pandas實現數據篩選 94
3.6.1 單條件篩選 94
3.6.2 多條件篩選 96
3.7 使用ChatGPT+pandas實現數據排名 97
3.7.1 中國式排名 97
3.7.2 美國式排名 99

第4章 使用ChatGPT+pandas實現多個文件數據的整理 102
4.1 使用ChatGPT+pandas拆分數據 102
4.1.1 簡單拆分——垂直 102
4.1.2 簡單拆分——水平 104
4.1.3 根據變量的值將數據拆分到不同工作簿中 105
4.2 使用ChatGPT+pandas合並數據 107
4.2.1 合並不同工作表中的數據 107
4.2.2 合並不同工作簿中的數據 112
4.3 使用ChatGPT+pandas拼接數據 114
4.4 使用ChatGPT+pandas連接數據 116
4.5 使用ChatGPT+pandas追加數據 118

第5章 使用ChatGPT+pandas實現文本數據的整理 120
5.1 使用ChatGPT+pandas提取子文本 120
5.2 使用ChatGPT+pandas改變文本大小寫 122
5.3 使用ChatGPT+pandas實現分列 124
5.3.1 使用單一分隔符進行分列 124
5.3.2 使用多種分隔符進行分列 126
5.3.3 按照固定寬度進行分列 128
5.4 使用ChatGPT+pandas合並文本 129
5.5 使用ChatGPT+pandas查找和替換子文本 132
5.6 使用ChatGPT+pandas輸出文本的格式 133

第6章 使用ChatGPT+pandas實現日期時間數據的整理 136
6.1 使用ChatGPT+pandas實現時間點數據的整理 136
6.1.1 從給定的日期時間中提取單位對應的數字 136
6.1.2 計算給定日期是星期幾 138
6.2 使用ChatGPT+pandas實現時間段數據的整理 140
6.2.1 計算兩個日期之間的間隔天數 140
6.2.2 已知起始日期和間隔天數計算終止日期 142

第7章 使用ChatGPT+pandas實現時間序列數據的整理 144
7.1 時間序列數據 144
7.1.1 創建時間序列數據 144
7.1.2 從文件中導入時間序列數據 146
7.2 使用ChatGPT+pandas實現時間序列數據的常見處理 148
7.2.1 數據查詢 148
7.2.2 數據篩選 149
7.2.3 數據轉換 150
7.2.4 數據匯總 152
7.3 使用ChatGPT+pandas實現時間序列數據偏移 153
7.3.1 日期時間偏移 153
7.3.2 工作日偏移 154
7.4 使用ChatGPT+pandas實現時間序列數據平滑 156
7.5 使用ChatGPT+pandas實現時間序列數據重採樣 158

第8章 使用ChatGPT+pandas實現分類數據的整理 160
8.1 分類數據 160
8.1.1 創建分類數據 160
8.1.2 設置分類值 162
8.1.3 對分類數據進行排序 163
8.2 使用ChatGPT+pandas處理分類數據 164
8.2.1 查詢分類 165
8.2.2 增加分類值 166
8.2.3 修改分類值 167
8.2.4 刪除分類值 168

第9章 使用ChatGPT+pandas實現數據預處理 170
9.1 使用ChatGPT+pandas處理重復數據 170
9.1.1 整行數據重復的處理 170
9.1.2 指定數據重復的處理 172
9.2 使用ChatGPT+pandas處理缺失值 173
9.2.1 發現缺失值 174
9.2.2 刪除缺失值 176
9.2.3 填充缺失值 177
9.3 使用ChatGPT+pandas處理異常值 179
9.3.1 發現異常值 179
9.3.2 刪除異常值 182
9.3.3 替換異常值 184
9.4 使用ChatGPT+pandas實現數據轉換 185
9.4.1 數據標準化 186
9.4.2 數據歸一化 187
?
第10章 使用ChatGPT+pandas實現統計分析 190
10.1 使用ChatGPT+pandas實現描述性統計 190
10.1.1 描述數據集中趨勢 190
10.1.2 描述數據離中趨勢 192
10.1.3 描述數據分佈形狀 194
10.2 使用ChatGPT+pandas實現分組統計 195
10.2.1 分組描述性統計 195
10.2.2 分組提取首次數據和末次數據 197
10.2.3 多條件匯總 199
10.2.4 分組按條件統計 201
10.3 使用ChatGPT+pandas實現頻數分析 202
10.4 使用ChatGPT+pandas實現數據透視表 204
10.4.1 創建數據透視表 204
10.4.2 設置數據透視表中值的輸出格式 206
10.4.3 處理數據透視表中的缺失值 208
10.4.4 設置數據透視表的聚合函數 210
10.4.5 為數據透視表添加行匯總和列匯總 213
10.4.6 設置數據透視表中數據的顯示方式 215
10.4.7 對數據透視表中的數據進行排序 217
10.4.8 聚合函數為連接字符串 219

第11章 使用ChatGPT實現與Excel工作表相關的設置 223
11.1 使用ChatGPT+xlwings設置Excel工作表 223
11.1.1 設置邊框 223
11.1.2 設置背景色 227
11.1.3 設置字體 229
11.1.4 設置對齊方式 231
11.1.5 單元格合並和取消合並 233
11.2 使用ChatGPT+OpenPyXL設置Excel工作表 235
11.2.1 設置邊框 235
11.2.2 設置背景色 238
11.2.3 設置字體 239
11.2.4 設置對齊方式 241
11.2.5 單元格合並和取消合並 242

第12章 使用ChatGPT實現數據可視化 244
12.1 使用ChatGPT+xlwings實現數據可視化 244
12.1.1 條形圖 244
12.1.2 餅圖 247
12.2 使用ChatGPT+OpenPyXL實現數據可 視化 249
12.2.1 條形圖 249
12.2.2 餅圖 251
12.3 使用ChatGPT+Matplotlib實現數據可視化 252
12.3.1 條形圖 253
12.3.2 餅圖 254

第13章 Python語法基礎 256
13.1 常量和變量 256
13.1.1 常量 256
13.1.2 變量及其聲明、賦值和刪除 256
13.1.3 變量的數據類型 257
13.2 數字 257
13.2.1 整型數字 257
13.2.2 浮點型數字 258
13.3 字符串 258
13.3.1 創建字符串 258
13.3.2 索引和切片 258
13.3.3 字符串的長度和大小寫 259
13.3.4 字符串的分割、連接和刪除 259
13.4 列表 260
13.4.1 創建列表 260
13.4.2 添加列表元素 261
13.4.3 索引和切片 261
13.4.4 刪除列表元素 262
13.5 元組 262
13.5.1 元組的創建和刪除 263
13.5.2 索引和切片 263
13.6 字典 263
13.6.1 字典的創建 263
13.6.2 字典元素的增、刪、改、查 264
13.7 表達式 265
13.7.1 算術運算符 265
13.7.2 關系運算符 265
13.7.3 邏輯運算符 266
13.8 流程控制 266
13.8.1 判斷結構 266
13.8.2 循環結構——for循環 268
13.8.3 循環結構——while循環 268
13.9 函數 269
13.9.1 內部函數 269
13.9.2 標準模塊函數和第三方模塊 函數 269
13.9.3 自定義函數 269

第14章 pandas基礎 271
14.1 NumPy數組 271
14.1.1 創建NumPy數組 271
14.1.2 索引和切片 274
14.2 Series 275
14.2.1 創建Series對象 275
14.2.2 Series對象的描述 276
14.2.3 索引和切片 277
14.2.4 布爾索引 279
14.3 DataFrame 279
14.3.1 創建DataFrame對象 280
14.3.2 DataFrame對象的描述 281
14.3.3 索引和切片 282
14.3.4 布爾索引 285