Google AI 創作術: 靈感 x 圖像 x 設計 x 音樂 x 影片的工作流
洪錦魁 著
商品描述
Google AI 創作術
靈感 x 圖像 x 設計 x 音樂 x 影片的工作流
☆★☆從靈感到作品☆★☆
☆★☆一次掌握 Google AI 創作整合流程☆★☆
AI 工具越來越多,創作看似變得更簡單。但當你真正開始使用時,可能也會發現:
★生成圖片很容易,做出一致風格很難。
★生成影片很快速,做出完整敘事很難。
★生成音樂很新鮮,但讓聲音與畫面真正搭配很難。
問題不在工具不夠強,而在於你還沒有一套清楚的創作工作流。
《Google AI 創作術:靈感 x 圖像 x 設計 x 音樂 x 影片的工作流》帶你從創作的最前端開始,先用 Gemini 釐清主題、受眾、風格與文案結構,再進一步將想法轉換為圖像、設計、影片與音樂,最後整合成可以發表的完整作品。
本書不是把工具一個一個分開介紹,而是把它們串成一條真正可執行的創作流程。你將學會:
◎ 用 Gemini把想法變成創作藍圖
在動手生成之前,先釐清主題、方向、風格與內容結構,讓創作不再只是反覆試錯。
◎ 用 Nano Banana Pro讓圖像從好看變成好用
從第一張圖片開始,進一步掌握風格控制、局部編修、角色一致性與多圖融合,讓圖像成為可延伸的視覺資產。
◎ 用 Stitch把圖像與內容變成版面設計
學會用文字描述網站與 App 版型,快速建立網頁、介面與互動原型。
◎ 用 Veo 與 Flow讓畫面變成有節奏的影片
從文字生成影片、圖片延伸影片,到分鏡設計、多段影片串接與流程控制,建立真正的影片敘事能力。
◎ 用 Lyria為作品設計聲音與情緒
從文字、圖像與影片生成音樂,讓聲音不再只是背景,而是作品情緒的一部分。
◎ 用 Google Vids完成最後整合輸出
把影片、音樂、標題與內容整合起來,讓素材成為可以觀看、分享與發表的作品。
◎ 這本書適合
想用 AI 創作圖像、影片與音樂的內容創作者。
想建立個人品牌視覺的講師、作者、設計師與行銷人。
想學會 Google AI 工具整合應用的初學者。
想把靈感變成作品,而不只是產生零散素材的創作者。
AI 時代的創作者,不只是會使用工具的人,而是能夠規劃流程、控制結果、完成作品的人。
從一個想法開始,
把靈感變成圖像,
把圖像變成設計,
把設計變成影片,
再用音樂完成情緒。
這就是 Google AI 創作術。
作者簡介
洪錦魁
畢業於明志工專(現今明志科技大學),跳級留學美國University of Mississippi計算機系研究所。
2023~2025年連續3年獲選博客來「年度十大華文作家」,多年來唯一獲選的電腦書籍作者。也是一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家,下列是他在各時期的代表作品。
► DOS時代:「IBM PC組合語言、Basic、C、C++、Pascal、資料結構」。
► Windows時代:「Windows Programming 使用C、Visual Basic」。
► Internet時代:「網頁設計使用HTML」。
► 大數據時代:「R 語言邁向Big Data之路、Python王者歸來」。
► AI時代:「機器學習數學、微積分 + Python實作」、「AI視覺、AI之眼」。
► 通用AI時代:「ChatGPT、Gemini、Copilot、無料AI、AI職場、AI行銷、AI影片、AI賺錢術、AI 學習術、AI 生活術、NotebookLM - 打造AI『第二大腦』」。
► Vibe Coding 時代:「寫程式的 AI 戰友、Vibe Coding - ChatGPT x Codex」。
► 國內第 1 本「多模態 AI - ChatGPT 5」、「Nano Banana 藝術宇宙」作者。
► 國內第 1 本「AI 健康養生長壽書」、「AI 思維 – 原子習慣」作者。
作品曾被翻譯為簡體中文、馬來西亞文,英文,近年來作品則是在北京清華大學和台灣深智同步發行。
他的多本著作皆曾登上天瓏、博客來、Momo電腦書類,不同時期暢銷排行榜第1 名,他的著作特色是,所有程式語法或是功能解說會依特性分類,同時以實用的程式範例做說明,不賣弄學問,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。
目錄大綱
▌第1 章 創作的起點 - 用 Gemini 建立創作藍圖
1-1 為什麼多數人做不出作品
1-1-1 沒有主題:不知道自己要做什麼
1-1-2 沒有風格:產出無法保持一致
1-1-3 沒有結構:內容零散,難以發展
1-2 Gemini:你的創作大腦
1-3 用 Gemini 規劃創作文案
1-3-1 從主題開始(Idea)
1-3-2 建立文案結構(Structure)
1-3-3 定義風格與情緒(Direction)
1-3-4 Gemini 生成給AI 繪圖工具的Prompt
1-4 創作藍圖的價值(為什麼要先想清楚)
1-4-1 沒有藍圖的創作:反覆生成
1-4-2 有藍圖的創作:穩定產出
1-4-3 藍圖讓創作變簡單
▌第2 章 快速生成圖像 - 用Gemini 建立第一張作品
2-1 為什麼從 Gemini 的「建立圖像」開始
2-2 Gemini 建立圖像(基本操作)
2-2-1 理解圖像風格(選擇的基礎)
2-2-2 圖像生成的兩個關鍵問題
2-2-3 建立圖像的基本流程(實際操作)
2-2-4 生成結果的基本判斷
2-3 從創作藍圖到圖像(關鍵轉換)
2-3-1 將藍圖轉換為圖像描述
2-3-2 圖像結果的問題分析與修正(讓畫面更精準)
2-4 從生成到創作
▌第3 章 讓圖變有用- 情境化圖像創作與Prompt 設計
3-1 圖像不是作品,而是「用途」
3-2 傳達型圖像創作 - 讓人看懂
3-2-1 書內插圖 - 概念轉具體
3-2-2 教學圖解 - 流程與步驟
3-2-3 資訊圖 - 整體理解
3-2-4 心智圖 - 結構化思考
3-3 吸引型圖像創作 - 讓人停下來
3-3-1 書籍封面 - 建立第一印象
3-3-2 行銷海報 - 快速抓住注意
3-3-3 社群貼文 - 建立情緒與互動
3-3-4 網頁 Banner - 引導視線與行動
3-4 敘事型圖像創作 - 讓人記住
3-4-1 漫畫 - 用角色呈現概念
3-4-2 情境插圖 - 讓讀者進入畫面
3-4-3 教學故事圖 - 呈現過程與轉變
3-4-4 品牌角色視覺 - 建立記憶與辨識
▌第4 章 進階圖像創作 - 風格x 編修x 控制
4-1 圖像創作的進階關鍵 - 從生成到控制
4-1-1 為什麼「生成」不等於「創作」
4-1-2 Nano Banana Pro - 圖像控制引擎與三大核心能力
4-2 風格控制 - 決定圖像的方向
4-2-1 三大常見風格 - 快速分類
4-2-2 風格是策略,不是裝飾
4-2-3 風格穩定的關鍵
4-2-4 風格可以被轉換
4-3 Image-to-Image - 圖像創作的核心能力
4-3-1 什麼是 Image-to-Image,從「重來」到「延續」
4-3-2 局部修改 - 精準調整,而不是全部重來
4-3-3 角色一致性 - 讓同一人物持續存在
4-3-4 多圖融合 - 從單一素材到創意組合
4-4 世界知識加成 - AI 隱藏能力
▌第5 章 圖像策略 - 建立個人與品牌視覺
5-1 圖像的價值升級 - 從作品到品牌
5-1-1 為什麼單張圖片沒有長期價值
5-1-2 什麼是「視覺資產」
5-1-3 品牌視覺的核心概念
5-2 視覺一致性設計 - 建立你的圖像語言
5-2-1 一致性的三大元素 - 色彩 x 風格 x 構圖
5-2-2 如何用 AI 維持一致性 - 從設定到延續
5-3 AI 品牌風格建立 - 從個人到系統
5-3-1 什麼是 AI 品牌風格
5-3-2 建立你的風格 Prompt - 從描述到標準化
5-3-3 角色與視覺 IP 建立 - 讓圖像被記住
5-4 應用實戰 - 社群 x 書封 x 廣告圖
5-4-1 社群圖像 - 吸引注意與建立互動
5-4-2 書封設計 - 建立第一印象與品牌識別
5-4-3 廣告與 Banner - 引導視線與促進行動
5-4-4 多版本輸出 - 一套素材,延伸多種應用
5-5 本章小結 - 從圖像到品牌
▌第6 章 AI 版面設計 - Stitch
6-1 進入Google Stitch
6-1-1 應用程式或網頁
6-1-2 運作模式
6-1-3 Start Live Mode(Preview)
6-1-4 附加內容
6-2 用Stitch 設計網頁版型
6-2-1 設計個人品牌 / 專家網站(Personal Branding)
6-2-2 上傳圖像與編輯圖像
6-2-3 將網頁文字改成中文
6-2-4 編輯文字
6-2-5 Stitch 主工具列
6-2-5 查看程式碼
6-2-6 建立新專案
6-2-7 課程學習平台/ 產品介紹頁 - 網站設計實例
6-3 用 Stitch 設計多頁式 App - 從畫面到互動流程
6-3-1 設計「多頁式AI 學習平台App」
6-3-2 請將英文版App 轉成中文
6-3-3 連結與預覽即時原型
6-4 Stitch 設計流程回顧 - 從版型設計走向原型思維
▌第7 章 AI 影片創作核心 - Veo 模型
7-1 影片的本質 - 為什麼「影片 = 敘事」
7-1-1 從圖片到影片的差別
7-1-2 影片的三個核心元素
7-1-3 AI 影片創作的關鍵轉換
7-2 Veo 模型概念 - 能力與限制
7-2-1 Veo 的核心能力
7-2-2 Veo 的限制
7-2-3 最佳使用情境
7-3 Text → Video:從文字生成影片
7-3-1 進入Gemini 的影片創作環境
7-3-2 Text → Video 的基本 Prompt 結構
7-3-3 實例示範 - 從描述到影片生成
7-4 Image → Video:從圖片延伸影片
7-4-1 為什麼 Image → Video 很重要
7-4-2 實例示範 - 讓圖片產生「自然動態」
7-5 從畫面生成到影片敘事
▌第8 章 影片流程控制 - Flow 與結構設計
8-1 Flow 是什麼:從生成到流程的轉變
8-1-1 為什麼單一影片生成不夠用
8-1-2 Flow 的核心概念:影片是流程,不是結果
8-1-3 Flow 在創作流程中的位置
8-2 分鏡(Storyboard): AI 影片的關鍵能力
8-2-1 什麼是分鏡(Storyboard)
8-2-2 如何設計一段影片的分鏡結構
8-2-3 從文字到分鏡的轉換技巧
8-3 多段影片生成與串接
8-3-1 建立多個影片片段
8-3-2 影片串接與順序控制
8-3-3 風格一致性的維持技巧
8-4 Flow 創作設計:完整影片案例
8-4-1 主題設定與創意發想 - 實戰案例:奈米香蕉人
8-4-2 分鏡設計與腳本建立
8-4-3 影片生成與 Flow 組裝 - 4 段 Prompt 完整實作
8-5 Flow 實作:奈米香蕉人
8-5-1 進入Flow
8-5-2 建立第一張場景圖片
8-5-3 建立Scene 1 - 角色登場
8-5-4 建立Scene 2 – 能力展現
8-5-5 建立Scene 3 – 生活互動
8-5-6 建立Scene 4 – 成果展示
8-5-7 故事延伸與調整
8-6 延伸創作方向:讀者可發展的主題
▌第9 章 AI 音樂與情緒設計 - Lyria 與聲音創作
9-1 為什麼創作需要「聲音與音樂」
9-1-1 聲音如何改變觀眾的感受
9-1-2 沒有音樂的作品為什麼不完整
9-1-3 聲音在創作流程中的位置
9-2 Lyria 是什麼:從使用音樂到創作音樂
9-2-1 Lyria 的核心能力與定位
9-2-2 音樂生成的基本邏輯
9-2-3 Lyria 的使用情境與創作限制
9-3 Gemini 創作音樂環境
9-3-1 進入Gemini 創作音樂環境
9-3-2 Gemini「創作音樂」環境中的音樂圖片功能說明
9-3-3 音樂風格圖片的使用策略:從自由生成到精準控制
9-4 從文字生成音樂(Text → Music)
9-4-1 音樂 Prompt 的基本結構(音樂 x 歌曲雙應用)
9-4-2 範例實作:不同情境的音樂與歌曲生成
9-5 從圖像生成音樂(Image → Music)
9-5-1 圖像如何被轉換為音樂
9-5-2 範例實作:同一角色,不同場景的音樂設計
9-5-3 風格一致性的維持技巧(從畫面到聲音)
9-6 影片配樂設計:從分析到音樂生成
9-6-1 用 Gemini 分析影片情緒
9-6-2 從影片分析轉為音樂 Prompt(奈米香蕉人實戰)
9-6-3 直接以影片生成音樂(快速模式與精準模式的取捨)
9-7 音樂風格與情緒控制(讓聲音成為創作能力)
9-7-1 常見音樂風格分類(建立創作語言)
9-7-2 情緒控制三大元素(節奏 x 音色 x 強弱)
9-7-3 建立「聲音風格」(從創作到品牌)
▌第10 章 影片與音樂整合 - Google Vids 應用
10-1 Google Vids 是什麼
10-1-1 為什麼說它是「實驗性工具」
10-1-2 核心功能(本章會用到的部分)
10-1-3 與傳統剪輯工具的差異
10-1-4 小結
10-2 進入Google Vids 工作環境
10-3 上傳影片
10-4 影片嵌入音訊
10-5 建立影片標題
10-6 儲存與下載影片


















