Gemini 3.5 x NotebookLM 領軍: Nano Banana x Omni x Lyric x Flow x Gem - Google 多模態 AI 工作流
洪錦魁 著
商品描述
Gemini 3.5 x NotebookLM 領軍
Nano Banana x Omni x Lyric x Flow x Gem
Google 多模態 AI 工作流
本書內容
☆★☆內容最新、最全面(512頁) ☆★☆
☆★☆全面整合 Google Workspace 與 Gemini 生態系 AI 工具☆★☆
☆★☆圖像、語音、音樂、影片、研究與文件的多模態一次到位☆★☆
☆★☆讓 AI 成為真正的工作夥伴,而非只會聊天的助手☆★☆
☆★☆一次掌握「行動 + 桌面 + 雲端」的 Gemini 3.5 全平台☆★☆
導讀語
當多數人仍停留在「和 AI 聊天」,Gemini 3.5 已經進化成能驅動搜尋、文件、影像、影片與知識引擎的智慧核心。本書以實務導向為核心,從 Gemini 3.5 的基礎操作出發,逐步深入 Google Workspace、Chrome AI 搜尋、Canvas、Deep Research、Gem,一直到 Nano Banana、Omni 與 Flow 所構成的多媒體創作環境。
壓軸的 Notebook 與 NotebookLM 整合能力,更完整展現 Gemini 3.5 如何把資料來源轉化為可對話、可摘要、可整理、可教學的知識工作流。使用者不只可以透過 NotebookLM 深入研究資料,也能在 Gemini 中直接建立 Notebook,讓 AI 從單次助理升級為長期陪伴學習與研究的知識引擎。
無論你是想提升效率的辦公室人士、創意工作者、行銷專家、教育工作者,或希望用 AI 展開第二職涯的自媒體創作者,這本書都會讓你擁有一位「全能的 AI 夥伴」。
本書值得閱讀的十四大亮點
1:Gemini 3.5 全新世代完整解析
全面整合 Gemini、Chrome、Google Workspace、Canvas、Nano Banana、Omni、Flow、Gem、NotebookLM、Gemini App、Gemini Live、Google翻譯等 AI 平台,建立多模態工作流的第一本中文專書。
2:從聊天到研究的多層次學習路徑
第1 ~ 3章由淺入深介紹 Gemini 操作、聊天技巧與輸出格式控制,讓新手快速具備 AI 對話邏輯與結構思考力。
Google 翻譯是 Google 提供的多語言翻譯工具,可協助使用者快速翻譯文字、語音、圖片與網頁內容。使用者可以輸入文字、說出句子,或拍攝外文招牌、菜單、文件,讓系統即時轉換成指定語言。
3:Nano Banana:AI 驅動智慧圖像成為核心能力
第4 ~ 5章AI驅動的智慧圖像生成、搭配Google網站與AI搜尋整合協作,圖像生成包含封面、插圖、資訊圖、漫畫、地圖全面實作。
◎AI 圖像創作部分:健康圖表、教學情境圖、心智圖、旅遊動線地圖、路線圖、資訊圖表(概念、流程、比較、架構、KPI)、漫畫、四格與多格故事。
◎即時資訊視覺化:天氣預報圖、股市走勢圖、交通與人潮預估圖。
◎圖像編輯:圖像一致化、超寫實3D、科幻公仔、場景變換與多圖融合。
◎Nano Banana驅動 AI 塗鴉。
4:Gemini x Workspace跨應用場景的實務操作
旅遊、媒體、Workspace 三大應用(第6 ~ 7章),示範如何整合 Google 地圖、航班、YouTube、Gmail、文件(Docs)、日曆(Calendar)、Tasks、Keep、雲端硬碟(Drive) 等工具,打造 AI 辦公室自動化流程。
◎Gemini整合Verify AI內容識別技術,保護創作者、大眾與平台。
5:Chrome x Gemini 的 AI 搜尋革命
第8章介紹「AI 搜尋」,關鍵轉變是:「使用者不再必須搜尋資訊,而是讓資訊主動整理好給使用者」。
不只找資料,直接生成比較表、簡報與決策建議。展現「查詢 → 分析 → 產出 → 視覺化」的完整能力。
6:多模態資料上傳與分析實戰
第9章介紹「文字」、「音訊」、「圖像」、「影片」等資料型態上傳與智慧解析,展現 Gemini在辦公與研究領域的強大應用潛力。例如:
◎ 文字文件:摘要重點、生成簡報。
◎ 音訊檔案:會議記錄、專訪內容轉文字稿。教學錄音生成講義與摘要。
◎ 圖像檔案:物品辨識、場景分析與意境解讀。
◎影片檔案:影片內容摘要、場景分析、重點片段整理。教學影片生成學習筆記,會議影片整理成紀錄與待辦事項。
7:Gemini 融入Google文件、試算表與簡報
◎Gemini 融入 Google 文件後,可以協助撰寫初稿、摘要內容、改寫段落與整理重點,讓文件從文字編輯工具,升級為 AI 寫作助理。
◎Gemini 融入 Google 試算表後,能協助建立表格、產生公式、整理資料與分析趨勢,讓資料處理更直覺、更有效率。
◎Gemini 融入 Google 簡報後,可以協助產生大綱、整理重點、撰寫投影片內容與講稿,讓簡報製作更快速、更有架構。
8:Canvas:讓文件活起來,把 AI 思考變成可編輯成果
第11章的Gemini Canvas ,跳脫聊天環境的結構化創作方式,協助「把想法梳理清楚」、「把內容組織起來」、「把成果保存與再利用」。同時也協助使用者將靈感轉化為「網頁」、「資訊圖表」、「測驗」、「學習卡」與「語音摘要」。
◎Canvas也具備輕量化程式設計功能,是初學Vibe Coding最佳平台。
◎Canvas整合NotebookLM筆記。
8:Deep Research:AI 查證與引用透明化
第12章的Deep Research章節,教你如何利用多來源比對與長時推理,生成可驗證、可追溯的研究結果,適合學生、學者與記者。
有了他,使用者將從「零碎資訊的消費者」轉變為「結構化知識的獲取者」。
9:Gem:建立專屬 AI 助理與導師
第13章的探索Gem,驗證了 AI 的能力不再只是「即時對話」,而能被模組化、保存、重複使用。本章用「英文學習卡Gem」與「電商客服Gem」,完整說明建立專屬「AI 助理」。
10:創作音樂 - Lyria
第14章用 Lyria 建立音樂的 3 個重點是:
◎用文字描述音樂風格:可以輸入想要的音樂類型,例如流行、爵士、電子、古典或電影配樂,讓 AI 依照描述生成音樂。
◎指定情緒與使用情境:可說明音樂要表現的感覺,例如輕快、溫暖、緊張、療癒,或指定用途如影片背景、廣告配樂、課程開場音樂。
◎調整節奏與氛圍:可進一步描述速度、樂器與整體氣氛,例如「中等節奏、鋼琴主旋律、適合閱讀時播放」,讓生成結果更符合需求。
11:Omni x Flow - AI 影片創作新紀元
第15章描述用Omni建立影片,以及用Flow建立電影級的影片。
◎Omni:文字、圖像與影片建立音效影片,創建「能量覺醒 – 電光英雄」影片。以及建立中、英文影片「水的三態變化」。
◎Flow:Google實驗工具,可從單一片段到完整敘事短片的生成流程。創作長達25秒、電影等級含音效與文字的故事短片「奈米香蕉人創作大冒險」。
12:Gemini App x Gemini Live
Gemini App 讓 AI 隨身同行,從語音對話、拍照辨識到 Live 即時互動,讓手機成為學習、工作與生活中的智慧助理。
13:Gemini x NotebookLM:AI 知識庫與學習革命
第17 ~ 18章,講解NotebookLM與Gemini的整合應用。Gemini 不再只是單次問答工具,可以直接開啟與建立 NotebookLM,將資料整理、知識對話與成果輸出整合在同一個 AI 工作流程中。使用者可以從 Gemini 進入 NotebookLM,建立專屬 Notebook,加入文件、影片、音訊、網頁與筆記等來源,讓 AI 協助理解、整理、轉換與應用知識。
從「資料來源 → 對話 → 工作室」的完整流程中,NotebookLM 可以把分散資料轉化為可摘要、可提問、可視覺化、可教學、可展示的知識成果,真正展現 AI 知識庫與學習革命。
◎語音摘要:NotebookLM 將知識「說給你聽」的功能。
◎影片摘要:NotebookLM 不只是文字與語音的工具,透過影片形式,知識更容易被理解、分享與傳播,特別適合課程教學與團隊協作。
◎報告:NotebookLM 不只可以做為學習輔助,更能成為「知識成果輸出機器」。它能將同一份來源轉化為不同風格的報告,滿足學術、教學與商務場景的多重需求
◎心智圖:NotebookLM組織「一眼可看全局」的知識。它將分散在來源文件裡的概念,轉化為清晰的結構圖,幫助使用者更快理解、比較與應用。
◎智慧學習卡:NotebookLM 超越了單純的「知識整合工具」,它把整理後的知識轉化為問答練習,幫助使用者主動回憶與檢測,達到更深層的學習效果。
◎互動測驗:NotebookLM 不僅是「筆記整理器」,而能透過多題型測驗來檢視學習成果的「智慧教練」。測驗可檢驗理解深度,幫助知識內化並長期記憶。
◎資訊圖表:將 Notebook 中較為複雜、抽象或篇幅較長的內容,轉換為一眼就能理解的視覺化重點整理。
◎簡報:將 Notebook 中的知識內容,自動整理為條理清楚、可直接展示的簡報架構。
◎資料表:NotebookLM 不再只是閱讀與摘要工具,透過 AI 的語意理解能力,原本分散在文件、筆記與研究資料中的內容,得以快速轉換為清楚的表格形式,協助使用者建立可比較、可延伸應用的資料基礎。
14. 引導式學習:AI 線上導師正式上線(電子書)
附錄A的引導式學習,Gemini 在此學習場景中,扮演的不僅是「知識提供者」,更是「智慧學習夥伴」。透過引導式學習、語音互動與測驗生成,Gemini 能協助使用者以更有效率、更符合個人需求的方式學習,無論是語言、專業技能,還是跨領域知識,都能快速上手。
作者簡介
洪錦魁
畢業於明志工專(現今明志科技大學),跳級留學美國University of Mississippi計算機系研究所。
2023~2025年連續3年獲選博客來「年度十大華文作家」,多年來唯一獲選的電腦書籍作者。也是一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家,下列是他在各時期的代表作品。
► DOS時代:「IBM PC組合語言、Basic、C、C++、Pascal、資料結構」。
► Windows時代:「Windows Programming 使用C、Visual Basic」。
► Internet時代:「網頁設計使用HTML」。
► 大數據時代:「R 語言邁向Big Data之路、Python王者歸來」。
► AI時代:「機器學習數學、微積分 + Python實作」、「AI視覺、AI之眼」。
► 通用AI時代:「ChatGPT、Gemini、Copilot、無料AI、AI職場、AI行銷、AI影片、AI賺錢術、AI 學習術、AI 生活術、NotebookLM - 打造AI『第二大腦』」。
► Vibe Coding 時代:「寫程式的 AI 戰友、Vibe Coding - ChatGPT x Codex」。
► 國內第 1 本「Gemini 3、ChatGPT 5.5、Nano Banana 藝術宇宙」作者。
► 國內第 1 本「AI 健康養生長壽書」、「AI 思維 – 原子習慣」作者。
作品曾被翻譯為簡體中文、馬來西亞文,英文,近年來作品則是在北京清華大學和台灣深智同步發行。
他的多本著作皆曾登上天瓏、博客來、Momo電腦書類,不同時期暢銷排行榜第1 名,他的著作特色是,所有程式語法或是功能解說會依特性分類,同時以實用的程式範例做說明,不賣弄學問,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。
目錄大綱
▍第1 章 認識與快速上手Gemini
1-1 Gemini 是什麼
1-2 登入與認識Gemini 操作環境
1-3 與Gemini 聊天 – 展現Google AI的特色
1-4 生成與操作聊天主題
1-5 分享聊天內容
1-6 匯出到文件 – Google 文件與Gmail
1-7 閱讀網址內容生成摘要報告
1-8 活動紀錄
1-9 搜尋對話功能
1-10 將個人化記憶匯入Gemini
1-11 個人智慧化服務
▍第2 章 AI 外語隨身教練- Gemini 語音與Google 翻譯
2-1 Gemini 語音輸入邁向外語學習
2-2 Google 翻譯
▍第3 章 聊天技巧與輸出格式的規則
3-1 聊天技巧
3-2 如何讓Gemini 用您指定的格式回應
3-3 條列式、Q&A、表格輸出控制
3-4 限制字數與加入實例
▍第4 章 AI 圖像創作 - Nano Banana
4-1 文字生成圖像的時代來臨
4-2 文字 → 圖像 - Nano Banana 2的關鍵功能
4-3 實際應用 - 用文字生成真正能用的專業圖像
4-4 企業導入AI 專題 - 用資訊圖快速建立共同語言
4-5 學校導入 AI 教育的資訊圖
4-6 繪製心智圖(AI-Generated Mind Maps)
4-7 製作 AI 旅遊地圖與情境地圖
4-8 從資料到圖像 - 即時資訊可視化應用
4-9 漫畫與多格漫畫創作中的應用
4-10 Gemini x Nano Banana 塗鴉
▍第5 章 AI 圖像編輯 - Nano Banana
5-1 圖生圖
5-2 多圖融合 - 人物移動
5-3 多圖融合 - 合成新圖像
5-4 世界知識加成 - 自動融入合理的背景元素
5-5 官網展示實例
▍第6 章 Gemini x Google 服務 - 把AI變成你的日常生活助理
6-1 Google 地圖 - 智慧導覽與資訊查詢
6-2 Google 航班/ 機票 - 智慧查詢與比價
6-3 Google 飯店 - 智慧查詢與比價
6-4 結合地圖、航班或飯店的旅遊規劃
6-5 YouTube 應用
▍第7 章 Gemini 應用程式 – Google Workspace
7-1 認識「應用程式」
7-2 Gmail 應用 - 智慧郵件操作
7-3 Google Calendar - 時間管理
7-4 Google Keep - 雲端筆記
7-5 Google Tasks - 建立待辦清單系統
7-6 Google 文件 – 生成與摘要
7-7 Google 雲端硬碟
7-8 YouTube 與 YouTube Music 應用
7-9 Gemini 3.5 應用程式中的 Verify AI功能說明
▍第8 章 Chrome x Gemini - 從 AI 搜尋到智慧瀏覽助理
8-1 AI Overview 入門 - 讓搜尋直接告訴你答案
8-2 Gemini 如何驅動 Chrome 的 AI搜尋系統
8-3 進入Chrome 的AI 搜尋
8-4 實作AI 搜尋
8-5 Chrome 的「問問Gemini」
▍第9 章 文字、音訊與圖像檔案上傳 -智慧分析
9-1 檔案上傳與分析的核心價值
9-2 文件型檔案分析(Word、PDF)
9-3 音訊檔案轉文字稿
9-4 影片檔案內容分析
9-5 AI 視覺 - 上傳圖像,理解圖像內容
▍第10 章 Google 文件、試算表與簡報的AI 升級
10-1 Google 文件
10-2 Google 試算表
10-3 Google 簡報
▍第11 章 Gemini 的 Canvas 功能
11-1 Canvas 功能概覽
11-2 建立Canvas 文案
11-3 讓文件活起來 - Canvas「 建立」應用
11-4 用Canvas 檢視或摘要檔案
11-5 Canvas 設計帕斯卡三角形遊戲
▍第12 章 Deep Research 深度研究
12-1 Deep Research 功能概覽
12-2 操作流程
12-3 實際應用情境
▍第13 章 探索Gem - 建立專屬AI 助理
13-1 什麼是 Gem
13-2 認識與建立Gem 環境
13-3 Gem 管理工具
13-4 英文學習卡 Gem
13-5 電商客服 Gem
13-6 我可以稱Gem 是打造「專屬AI Agent 嗎」
▍第14 章 創作音樂與 Lyria 3
14-1 Lyria 3 模型技術架構與生成機制
14-2 Gemini 創作音樂環境
14-3 實際操作流程完整示範
14-4 創作英文歌曲
▍第15 章 AI 語音影片生成新紀元 -Gemini Omni x Flow
15-1 Gemini Omni 的定位與特點
15-2 Gemini Omni 的操作流程
15-3 文字生成影片
15-4 圖片生成影片
15-5 文字 + 圖片 - 飛翔的英雄
15-6 建立含語音的影片 - 電光英雄
15-7 影片再創作:從上傳影片到 AI導演
15-8 實驗性創作工具Google Flow -從生成片段走向完整影片製作
▍第16 章 Gemini App 與Live - 手機上的隨身 AI 助手
16-1 安裝與登入
16-2 操作介面導覽
16-3 Gemini App 行動體驗特色
16-4 Gemini Live
▍第17 章 NotebookLM - AI 智慧筆記與研究助理
17-1 NotebookLM 的定位與演變
17-2 NotebookLM 視窗與筆記操作環境
17-3 建立NotebookLM 的知識引擎
17-4 智慧「對話」 - 與 NotebookLM的互動中樞
17-5 工作室 - 多模態輸出的創作空間
17-6 我的筆記本
▍第18 章 Gemini 內建筆記本 -NotebookLM 進入Gemini工作流程
18-1 Gemini 為什麼內建筆記本
18-2 Gemini 筆記本與 NotebookLM的關係
18-3 在 Gemini 中建立筆記本
18-4 Gemini 筆記本適合哪些使用情境
18-5 在 Gemini 中使用 NotebookLM建立的筆記本
18-6 未來 AI 知識工作流程的改變
▍附錄A AI 導師上線- 體驗Gemini 的引導式學習( 深智官網下載電子書)




















