Google AI 創作術: 靈感 x 圖像 x 設計 x 音樂 x 影片的工作流

洪錦魁著

預覽內頁

出版商: 深智
出版日期: 2026-05-26
定價: $620
售價: 7.9 折 $489
語言: 繁體中文
頁數: 320
ISBN: 6267889300
ISBN-13: 9786267889305
相關分類: AI Coding

尚未上市，歡迎預購

商品描述

Google AI 創作術

靈感 x 圖像 x 設計 x 音樂 x 影片的工作流

☆★☆從靈感到作品☆★☆

☆★☆一次掌握 Google AI 創作整合流程☆★☆

AI 工具越來越多，創作看似變得更簡單。但當你真正開始使用時，可能也會發現：

★生成圖片很容易，做出一致風格很難。

★生成影片很快速，做出完整敘事很難。

★生成音樂很新鮮，但讓聲音與畫面真正搭配很難。

問題不在工具不夠強，而在於你還沒有一套清楚的創作工作流。

《Google AI 創作術：靈感 x 圖像 x 設計 x 音樂 x 影片的工作流》帶你從創作的最前端開始，先用 Gemini 釐清主題、受眾、風格與文案結構，再進一步將想法轉換為圖像、設計、影片與音樂，最後整合成可以發表的完整作品。

本書不是把工具一個一個分開介紹，而是把它們串成一條真正可執行的創作流程。你將學會：

◎ 用 Gemini把想法變成創作藍圖

在動手生成之前，先釐清主題、方向、風格與內容結構，讓創作不再只是反覆試錯。

◎ 用 Nano Banana Pro讓圖像從好看變成好用

從第一張圖片開始，進一步掌握風格控制、局部編修、角色一致性與多圖融合，讓圖像成為可延伸的視覺資產。

◎ 用 Stitch把圖像與內容變成版面設計

學會用文字描述網站與 App 版型，快速建立網頁、介面與互動原型。

◎ 用 Veo 與 Flow讓畫面變成有節奏的影片

從文字生成影片、圖片延伸影片，到分鏡設計、多段影片串接與流程控制，建立真正的影片敘事能力。

◎ 用 Lyria為作品設計聲音與情緒

從文字、圖像與影片生成音樂，讓聲音不再只是背景，而是作品情緒的一部分。

◎ 用 Google Vids完成最後整合輸出

把影片、音樂、標題與內容整合起來，讓素材成為可以觀看、分享與發表的作品。

◎ 這本書適合

想用 AI 創作圖像、影片與音樂的內容創作者。

想建立個人品牌視覺的講師、作者、設計師與行銷人。

想學會 Google AI 工具整合應用的初學者。

想把靈感變成作品，而不只是產生零散素材的創作者。

AI 時代的創作者，不只是會使用工具的人，而是能夠規劃流程、控制結果、完成作品的人。

從一個想法開始，

把靈感變成圖像，

把圖像變成設計，

把設計變成影片，

再用音樂完成情緒。

這就是 Google AI 創作術。

作者簡介

洪錦魁

畢業於明志工專（現今明志科技大學），跳級留學美國University of Mississippi計算機系研究所。

2023~2025年連續3年獲選博客來「年度十大華文作家」，多年來唯一獲選的電腦書籍作者。也是一位跨越電腦作業系統與科技時代的電腦專家，著作等身的作家，下列是他在各時期的代表作品。

► DOS時代：「IBM PC組合語言、Basic、C、C++、Pascal、資料結構」。

► Windows時代：「Windows Programming 使用C、Visual Basic」。

► Internet時代：「網頁設計使用HTML」。

► 大數據時代：「R 語言邁向Big Data之路、Python王者歸來」。

► AI時代：「機器學習數學、微積分 + Python實作」、「AI視覺、AI之眼」。

► 通用AI時代：「ChatGPT、Gemini、Copilot、無料AI、AI職場、AI行銷、AI影片、AI賺錢術、AI 學習術、AI 生活術、NotebookLM - 打造AI『第二大腦』」。

► Vibe Coding 時代：「寫程式的 AI 戰友、Vibe Coding - ChatGPT x Codex」。

► 國內第 1 本「多模態 AI - ChatGPT 5」、「Nano Banana 藝術宇宙」作者。

► 國內第 1 本「AI 健康養生長壽書」、「AI 思維 – 原子習慣」作者。

作品曾被翻譯為簡體中文、馬來西亞文，英文，近年來作品則是在北京清華大學和台灣深智同步發行。

他的多本著作皆曾登上天瓏、博客來、Momo電腦書類，不同時期暢銷排行榜第1 名，他的著作特色是，所有程式語法或是功能解說會依特性分類，同時以實用的程式範例做說明，不賣弄學問，讓整本書淺顯易懂，讀者可以由他的著作事半功倍輕鬆掌握相關知識。

目錄大綱

▌第1 章創作的起點 - 用 Gemini 建立創作藍圖
1-1 為什麼多數人做不出作品
1-1-1 沒有主題：不知道自己要做什麼
1-1-2 沒有風格：產出無法保持一致
1-1-3 沒有結構：內容零散，難以發展
1-2 Gemini：你的創作大腦
1-3 用 Gemini 規劃創作文案
1-3-1 從主題開始（Idea）
1-3-2 建立文案結構（Structure）
1-3-3 定義風格與情緒（Direction）
1-3-4 Gemini 生成給AI 繪圖工具的Prompt
1-4 創作藍圖的價值（為什麼要先想清楚）
1-4-1 沒有藍圖的創作：反覆生成
1-4-2 有藍圖的創作：穩定產出
1-4-3 藍圖讓創作變簡單

▌第2 章快速生成圖像 - 用Gemini 建立第一張作品
2-1 為什麼從 Gemini 的「建立圖像」開始
2-2 Gemini 建立圖像（基本操作）
2-2-1 理解圖像風格（選擇的基礎）
2-2-2 圖像生成的兩個關鍵問題
2-2-3 建立圖像的基本流程（實際操作）
2-2-4 生成結果的基本判斷
2-3 從創作藍圖到圖像（關鍵轉換）
2-3-1 將藍圖轉換為圖像描述
2-3-2 圖像結果的問題分析與修正（讓畫面更精準）
2-4 從生成到創作

▌第3 章讓圖變有用- 情境化圖像創作與Prompt 設計
3-1 圖像不是作品，而是「用途」
3-2 傳達型圖像創作 - 讓人看懂
3-2-1 書內插圖 - 概念轉具體
3-2-2 教學圖解 - 流程與步驟
3-2-3 資訊圖 - 整體理解
3-2-4 心智圖 - 結構化思考
3-3 吸引型圖像創作 - 讓人停下來
3-3-1 書籍封面 - 建立第一印象
3-3-2 行銷海報 - 快速抓住注意
3-3-3 社群貼文 - 建立情緒與互動
3-3-4 網頁 Banner - 引導視線與行動
3-4 敘事型圖像創作 - 讓人記住
3-4-1 漫畫 - 用角色呈現概念
3-4-2 情境插圖 - 讓讀者進入畫面
3-4-3 教學故事圖 - 呈現過程與轉變
3-4-4 品牌角色視覺 - 建立記憶與辨識

▌第4 章進階圖像創作 - 風格x 編修x 控制
4-1 圖像創作的進階關鍵 - 從生成到控制
4-1-1 為什麼「生成」不等於「創作」
4-1-2 Nano Banana Pro - 圖像控制引擎與三大核心能力
4-2 風格控制 - 決定圖像的方向
4-2-1 三大常見風格 - 快速分類
4-2-2 風格是策略，不是裝飾
4-2-3 風格穩定的關鍵
4-2-4 風格可以被轉換
4-3 Image-to-Image - 圖像創作的核心能力
4-3-1 什麼是 Image-to-Image，從「重來」到「延續」
4-3-2 局部修改 - 精準調整，而不是全部重來
4-3-3 角色一致性 - 讓同一人物持續存在
4-3-4 多圖融合 - 從單一素材到創意組合
4-4 世界知識加成 - AI 隱藏能力

▌第5 章圖像策略 - 建立個人與品牌視覺
5-1 圖像的價值升級 - 從作品到品牌
5-1-1 為什麼單張圖片沒有長期價值
5-1-2 什麼是「視覺資產」
5-1-3 品牌視覺的核心概念
5-2 視覺一致性設計 - 建立你的圖像語言
5-2-1 一致性的三大元素 - 色彩 x 風格 x 構圖
5-2-2 如何用 AI 維持一致性 - 從設定到延續
5-3 AI 品牌風格建立 - 從個人到系統
5-3-1 什麼是 AI 品牌風格
5-3-2 建立你的風格 Prompt - 從描述到標準化
5-3-3 角色與視覺 IP 建立 - 讓圖像被記住
5-4 應用實戰 - 社群 x 書封 x 廣告圖
5-4-1 社群圖像 - 吸引注意與建立互動
5-4-2 書封設計 - 建立第一印象與品牌識別
5-4-3 廣告與 Banner - 引導視線與促進行動
5-4-4 多版本輸出 - 一套素材，延伸多種應用
5-5 本章小結 - 從圖像到品牌

▌第6 章 AI 版面設計 - Stitch
6-1 進入Google Stitch
6-1-1 應用程式或網頁
6-1-2 運作模式
6-1-3 Start Live Mode(Preview)
6-1-4 附加內容
6-2 用Stitch 設計網頁版型
6-2-1 設計個人品牌 / 專家網站（Personal Branding）
6-2-2 上傳圖像與編輯圖像
6-2-3 將網頁文字改成中文
6-2-4 編輯文字
6-2-5 Stitch 主工具列
6-2-5 查看程式碼
6-2-6 建立新專案
6-2-7 課程學習平台/ 產品介紹頁 - 網站設計實例
6-3 用 Stitch 設計多頁式 App - 從畫面到互動流程
6-3-1 設計「多頁式AI 學習平台App」
6-3-2 請將英文版App 轉成中文
6-3-3 連結與預覽即時原型
6-4 Stitch 設計流程回顧 - 從版型設計走向原型思維

▌第7 章 AI 影片創作核心 - Veo 模型
7-1 影片的本質 - 為什麼「影片 = 敘事」
7-1-1 從圖片到影片的差別
7-1-2 影片的三個核心元素
7-1-3 AI 影片創作的關鍵轉換
7-2 Veo 模型概念 - 能力與限制
7-2-1 Veo 的核心能力
7-2-2 Veo 的限制
7-2-3 最佳使用情境
7-3 Text → Video：從文字生成影片
7-3-1 進入Gemini 的影片創作環境
7-3-2 Text → Video 的基本 Prompt 結構
7-3-3 實例示範 - 從描述到影片生成
7-4 Image → Video：從圖片延伸影片
7-4-1 為什麼 Image → Video 很重要
7-4-2 實例示範 - 讓圖片產生「自然動態」
7-5 從畫面生成到影片敘事

▌第8 章影片流程控制 - Flow 與結構設計
8-1 Flow 是什麼：從生成到流程的轉變
8-1-1 為什麼單一影片生成不夠用
8-1-2 Flow 的核心概念：影片是流程，不是結果
8-1-3 Flow 在創作流程中的位置
8-2 分鏡（Storyboard）： AI 影片的關鍵能力
8-2-1 什麼是分鏡（Storyboard）
8-2-2 如何設計一段影片的分鏡結構
8-2-3 從文字到分鏡的轉換技巧
8-3 多段影片生成與串接
8-3-1 建立多個影片片段
8-3-2 影片串接與順序控制
8-3-3 風格一致性的維持技巧
8-4 Flow 創作設計：完整影片案例
8-4-1 主題設定與創意發想 - 實戰案例：奈米香蕉人
8-4-2 分鏡設計與腳本建立
8-4-3 影片生成與 Flow 組裝 - 4 段 Prompt 完整實作
8-5 Flow 實作：奈米香蕉人
8-5-1 進入Flow
8-5-2 建立第一張場景圖片
8-5-3 建立Scene 1 - 角色登場
8-5-4 建立Scene 2 – 能力展現
8-5-5 建立Scene 3 – 生活互動
8-5-6 建立Scene 4 – 成果展示
8-5-7 故事延伸與調整
8-6 延伸創作方向：讀者可發展的主題

▌第9 章 AI 音樂與情緒設計 - Lyria 與聲音創作
9-1 為什麼創作需要「聲音與音樂」
9-1-1 聲音如何改變觀眾的感受
9-1-2 沒有音樂的作品為什麼不完整
9-1-3 聲音在創作流程中的位置
9-2 Lyria 是什麼：從使用音樂到創作音樂
9-2-1 Lyria 的核心能力與定位
9-2-2 音樂生成的基本邏輯
9-2-3 Lyria 的使用情境與創作限制
9-3 Gemini 創作音樂環境
9-3-1 進入Gemini 創作音樂環境
9-3-2 Gemini「創作音樂」環境中的音樂圖片功能說明
9-3-3 音樂風格圖片的使用策略：從自由生成到精準控制
9-4 從文字生成音樂（Text → Music）
9-4-1 音樂 Prompt 的基本結構（音樂 x 歌曲雙應用）
9-4-2 範例實作：不同情境的音樂與歌曲生成
9-5 從圖像生成音樂（Image → Music）
9-5-1 圖像如何被轉換為音樂
9-5-2 範例實作：同一角色，不同場景的音樂設計
9-5-3 風格一致性的維持技巧（從畫面到聲音）
9-6 影片配樂設計：從分析到音樂生成
9-6-1 用 Gemini 分析影片情緒
9-6-2 從影片分析轉為音樂 Prompt（奈米香蕉人實戰）
9-6-3 直接以影片生成音樂（快速模式與精準模式的取捨）
9-7 音樂風格與情緒控制（讓聲音成為創作能力）
9-7-1 常見音樂風格分類（建立創作語言）
9-7-2 情緒控制三大元素（節奏 x 音色 x 強弱）
9-7-3 建立「聲音風格」（從創作到品牌）

▌第10 章影片與音樂整合 - Google Vids 應用
10-1 Google Vids 是什麼
10-1-1 為什麼說它是「實驗性工具」
10-1-2 核心功能（本章會用到的部分）
10-1-3 與傳統剪輯工具的差異
10-1-4 小結
10-2 進入Google Vids 工作環境
10-3 上傳影片
10-4 影片嵌入音訊
10-5 建立影片標題
10-6 儲存與下載影片

Google AI 創作術: 靈感 x 圖像 x 設計 x 音樂 x 影片的工作流

洪錦魁 著

商品描述

作者簡介

目錄大綱

類似商品

洪錦魁著