圖解大模型底層邏輯:大模型是怎麼跑起來的

張治政

  • 出版商: 北京大學
  • 出版日期: 2026-04-01
  • 售價: $954
  • 語言: 簡體中文
  • 頁數: 408
  • ISBN: 7301369638
  • ISBN-13: 9787301369630
  • 相關分類: Large language model
  • 下單後立即進貨 (約4週~6週)

買這商品的人也買了...

商品描述

本書分為兩大部分,從理論到實踐、從基礎原理到前沿技術, 解析了大模型的構建、訓練、部署 與應用的整個流程。 部分介紹大模型的基礎概念,包括大模型的定義、發展歷程和構建所需的軟硬件技術棧,重點講解神經網絡、訓練優化及模型調優的基本原理。第二部分聚焦大模型的內在邏輯和實際應用, 涵蓋推理、記憶、數據管道、多模態處理、硬件加速以及部署和維護等,同時以基於MoE的DeepSeek多模態大模型為案例,展示從項目架構設計到在線服務的全流程。全書內容嚴謹而生動,既涵蓋了大模型開發的全 流程技術細節,又不乏對大模型歷史演變和未來趨勢的前瞻性探討,是探索大模型底層邏輯與實現技術的指南。本書適合具備Python基礎開發能力、並希望進一步深入學 模型開發、模型優化和部署應用的讀者;同時,對於證券、保險、銀行等行業的從業人員以及高校師生來說,也是一本兼具理論深度與實戰指導的理 想參考書和教學輔導材料。