描述
內容簡介
Gemini 3.5 x NotebookLM 領軍Nano Banana x Omni x Lyric x Flow x GemGoogle 多模態 AI 工作流
本書內容
☆★☆內容最新、最全面(512頁) ☆★☆ ☆★☆全面整合 Google Workspace 與 Gemini 生態系 AI 工具☆★☆ ☆★☆圖像、語音、音樂、影片、研究與文件的多模態一次到位☆★☆ ☆★☆讓 AI 成為真正的工作夥伴,而非只會聊天的助手☆★☆ ☆★☆一次掌握「行動 + 桌面 + 雲端」的 Gemini 3.5 全平台☆★☆
導讀語 當多數人仍停留在「和 AI 聊天」,Gemini 3.5 已經進化成能驅動搜尋、文件、影像、影片與知識引擎的智慧核心。本書以實務導向為核心,從 Gemini 3.5 的基礎操作出發,逐步深入 Google Workspace、Chrome AI 搜尋、Canvas、Deep Research、Gem,一直到 Nano Banana、Omni 與 Flow 所構成的多媒體創作環境。 壓軸的 Notebook 與 NotebookLM 整合能力,更完整展現 Gemini 3.5 如何把資料來源轉化為可對話、可摘要、可整理、可教學的知識工作流。使用者不只可以透過 NotebookLM 深入研究資料,也能在 Gemini 中直接建立 Notebook,讓 AI 從單次助理升級為長期陪伴學習與研究的知識引擎。 無論你是想提升效率的辦公室人士、創意工作者、行銷專家、教育工作者,或希望用 AI 展開第二職涯的自媒體創作者,這本書都會讓你擁有一位「全能的 AI 夥伴」。
本書值得閱讀的十四大亮點 1:Gemini 3.5 全新世代完整解析 全面整合 Gemini、Chrome、Google Workspace、Canvas、Nano Banana、Omni、Flow、Gem、NotebookLM、Gemini App、Gemini Live、Google翻譯等 AI 平台,建立多模態工作流的第一本中文專書。
2:從聊天到研究的多層次學習路徑 第1 ~ 3章由淺入深介紹 Gemini 操作、聊天技巧與輸出格式控制,讓新手快速具備 AI 對話邏輯與結構思考力。 Google 翻譯是 Google 提供的多語言翻譯工具,可協助使用者快速翻譯文字、語音、圖片與網頁內容。使用者可以輸入文字、說出句子,或拍攝外文招牌、菜單、文件,讓系統即時轉換成指定語言。
3:Nano Banana:AI 驅動智慧圖像成為核心能力 第4 ~ 5章AI驅動的智慧圖像生成、搭配Google網站與AI搜尋整合協作,圖像生成包含封面、插圖、資訊圖、漫畫、地圖全面實作。 ◎AI 圖像創作部分:健康圖表、教學情境圖、心智圖、旅遊動線地圖、路線圖、資訊圖表(概念、流程、比較、架構、KPI)、漫畫、四格與多格故事。 ◎即時資訊視覺化:天氣預報圖、股市走勢圖、交通與人潮預估圖。 ◎圖像編輯:圖像一致化、超寫實3D、科幻公仔、場景變換與多圖融合。 ◎Nano Banana驅動 AI 塗鴉。
4:Gemini x Workspace跨應用場景的實務操作 旅遊、媒體、Workspace 三大應用(第6 ~ 7章),示範如何整合 Google 地圖、航班、YouTube、Gmail、文件(Docs)、日曆(Calendar)、Tasks、Keep、雲端硬碟(Drive) 等工具,打造 AI 辦公室自動化流程。 ◎Gemini整合Verify AI內容識別技術,保護創作者、大眾與平台。
5:Chrome x Gemini 的 AI 搜尋革命 第8章介紹「AI 搜尋」,關鍵轉變是:「使用者不再必須搜尋資訊,而是讓資訊主動整理好給使用者」。 不只找資料,直接生成比較表、簡報與決策建議。展現「查詢 → 分析 → 產出 → 視覺化」的完整能力。
6:多模態資料上傳與分析實戰 第9章介紹「文字」、「音訊」、「圖像」、「影片」等資料型態上傳與智慧解析,展現 Gemini在辦公與研究領域的強大應用潛力。例如: ◎ 文字文件:摘要重點、生成簡報。 ◎ 音訊檔案:會議記錄、專訪內容轉文字稿。教學錄音生成講義與摘要。 ◎ 圖像檔案:物品辨識、場景分析與意境解讀。 ◎影片檔案:影片內容摘要、場景分析、重點片段整理。教學影片生成學習筆記,會議影片整理成紀錄與待辦事項。
7:Gemini 融入Google文件、試算表與簡報 ◎Gemini 融入 Google 文件後,可以協助撰寫初稿、摘要內容、改寫段落與整理重點,讓文件從文字編輯工具,升級為 AI 寫作助理。 ◎Gemini 融入 Google 試算表後,能協助建立表格、產生公式、整理資料與分析趨勢,讓資料處理更直覺、更有效率。 ◎Gemini 融入 Google 簡報後,可以協助產生大綱、整理重點、撰寫投影片內容與講稿,讓簡報製作更快速、更有架構。
8:Canvas:讓文件活起來,把 AI 思考變成可編輯成果 第11章的Gemini Canvas ,跳脫聊天環境的結構化創作方式,協助「把想法梳理清楚」、「把內容組織起來」、「把成果保存與再利用」。同時也協助使用者將靈感轉化為「網頁」、「資訊圖表」、「測驗」、「學習卡」與「語音摘要」。 ◎Canvas也具備輕量化程式設計功能,是初學Vibe Coding最佳平台。 ◎Canvas整合NotebookLM筆記。
8:Deep Research:AI 查證與引用透明化 第12章的Deep Research章節,教你如何利用多來源比對與長時推理,生成可驗證、可追溯的研究結果,適合學生、學者與記者。 有了他,使用者將從「零碎資訊的消費者」轉變為「結構化知識的獲取者」。
9:Gem:建立專屬 AI 助理與導師 第13章的探索Gem,驗證了 AI 的能力不再只是「即時對話」,而能被模組化、保存、重複使用。本章用「英文學習卡Gem」與「電商客服Gem」,完整說明建立專屬「AI 助理」。
10:創作音樂 - Lyria 第14章用 Lyria 建立音樂的 3 個重點是: ◎用文字描述音樂風格:可以輸入想要的音樂類型,例如流行、爵士、電子、古典或電影配樂,讓 AI 依照描述生成音樂。 ◎指定情緒與使用情境:可說明音樂要表現的感覺,例如輕快、溫暖、緊張、療癒,或指定用途如影片背景、廣告配樂、課程開場音樂。 ◎調整節奏與氛圍:可進一步描述速度、樂器與整體氣氛,例如「中等節奏、鋼琴主旋律、適合閱讀時播放」,讓生成結果更符合需求。
11:Omni x Flow - AI 影片創作新紀元 第15章描述用Omni建立影片,以及用Flow建立電影級的影片。 ◎Omni:文字、圖像與影片建立音效影片,創建「能量覺醒 – 電光英雄」影片。以及建立中、英文影片「水的三態變化」。 ◎Flow:Google實驗工具,可從單一片段到完整敘事短片的生成流程。創作長達25秒、電影等級含音效與文字的故事短片「奈米香蕉人創作大冒險」。
12:Gemini App x Gemini Live Gemini App 讓 AI 隨身同行,從語音對話、拍照辨識到 Live 即時互動,讓手機成為學習、工作與生活中的智慧助理。
13:Gemini x NotebookLM:AI 知識庫與學習革命 第17 ~ 18章,講解NotebookLM與Gemini的整合應用。Gemini 不再只是單次問答工具,可以直接開啟與建立 NotebookLM,將資料整理、知識對話與成果輸出整合在同一個 AI 工作流程中。使用者可以從 Gemini 進入 NotebookLM,建立專屬 Notebook,加入文件、影片、音訊、網頁與筆記等來源,讓 AI 協助理解、整理、轉換與應用知識。 從「資料來源 → 對話 → 工作室」的完整流程中,NotebookLM 可以把分散資料轉化為可摘要、可提問、可視覺化、可教學、可展示的知識成果,真正展現 AI 知識庫與學習革命。 ◎語音摘要:NotebookLM 將知識「說給你聽」的功能。 ◎影片摘要:NotebookLM 不只是文字與語音的工具,透過影片形式,知識更容易被理解、分享與傳播,特別適合課程教學與團隊協作。 ◎報告:NotebookLM 不只可以做為學習輔助,更能成為「知識成果輸出機器」。它能將同一份來源轉化為不同風格的報告,滿足學術、教學與商務場景的多重需求 ◎心智圖:NotebookLM組織「一眼可看全局」的知識。它將分散在來源文件裡的概念,轉化為清晰的結構圖,幫助使用者更快理解、比較與應用。 ◎智慧學習卡:NotebookLM 超越了單純的「知識整合工具」,它把整理後的知識轉化為問答練習,幫助使用者主動回憶與檢測,達到更深層的學習效果。 ◎互動測驗:NotebookLM 不僅是「筆記整理器」,而能透過多題型測驗來檢視學習成果的「智慧教練」。測驗可檢驗理解深度,幫助知識內化並長期記憶。 ◎資訊圖表:將 Notebook 中較為複雜、抽象或篇幅較長的內容,轉換為一眼就能理解的視覺化重點整理。 ◎簡報:將 Notebook 中的知識內容,自動整理為條理清楚、可直接展示的簡報架構。 ◎資料表:NotebookLM 不再只是閱讀與摘要工具,透過 AI 的語意理解能力,原本分散在文件、筆記與研究資料中的內容,得以快速轉換為清楚的表格形式,協助使用者建立可比較、可延伸應用的資料基礎。
14. 引導式學習:AI 線上導師正式上線(電子書) 附錄A的引導式學習,Gemini 在此學習場景中,扮演的不僅是「知識提供者」,更是「智慧學習夥伴」。透過引導式學習、語音互動與測驗生成,Gemini 能協助使用者以更有效率、更符合個人需求的方式學習,無論是語言、專業技能,還是跨領域知識,都能快速上手。 |
作者簡介
| 洪錦魁
畢業於明志工專(現今明志科技大學),跳級留學美國University of Mississippi計算機系研究所。 2023~2025年連續3年獲選博客來「年度十大華文作家」,多年來唯一獲選的電腦書籍作者。也是一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家,下列是他在各時期的代表作品。 ► DOS時代:「IBM PC組合語言、Basic、C、C++、Pascal、資料結構」。 ► Windows時代:「Windows Programming 使用C、Visual Basic」。 ► Internet時代:「網頁設計使用HTML」。 ► 大數據時代:「R 語言邁向Big Data之路、Python王者歸來」。 ► AI時代:「機器學習數學、微積分 + Python實作」、「AI視覺、AI之眼」。 ► 通用AI時代:「ChatGPT、Gemini、Copilot、無料AI、AI職場、AI行銷、AI影片、AI賺錢術、NotebookLM - 打造AI『第二大腦』」。 ► Vibe Coding 時代:「寫程式的 AI 戰友、Vibe Coding - ChatGPT x Codex」。 ► 國內第 1 本「Gemini 3、ChatGPT 5.5、Nano Banana 藝術宇宙」作者。 ► 國內第 1 本「AI 健康養生長壽書」、「AI 思維 – 原子習慣」作者。 作品曾被翻譯為簡體中文、馬來西亞文,英文,近年來作品則是在北京清華大學和台灣深智同步發行。 他的多本著作皆曾登上天瓏、博客來、Momo電腦書類,不同時期暢銷排行榜第1 名,他的著作特色是,所有程式語法或是功能解說會依特性分類,同時以實用的程式範例做說明,不賣弄學問,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。 |
目錄
| ▍第1 章 認識與快速上手Gemini
1-1 Gemini 是什麼 1-2 登入與認識Gemini 操作環境 1-3 與Gemini 聊天 – 展現Google AI的特色 1-4 生成與操作聊天主題 1-5 分享聊天內容 1-6 匯出到文件 – Google 文件與Gmail 1-7 閱讀網址內容生成摘要報告 1-8 活動紀錄 1-9 搜尋對話功能 1-10 將個人化記憶匯入Gemini 1-11 個人智慧化服務
▍第2 章 AI 外語隨身教練- Gemini 語音與Google 翻譯 2-1 Gemini 語音輸入邁向外語學習 2-2 Google 翻譯
▍第3 章 聊天技巧與輸出格式的規則 3-1 聊天技巧 3-2 如何讓Gemini 用您指定的格式回應 3-3 條列式、Q&A、表格輸出控制 3-4 限制字數與加入實例
▍第4 章 AI 圖像創作 - Nano Banana 4-1 文字生成圖像的時代來臨 4-2 文字 → 圖像 - Nano Banana 2的關鍵功能 4-3 實際應用 - 用文字生成真正能用的專業圖像 4-4 企業導入AI 專題 - 用資訊圖快速建立共同語言 4-5 學校導入 AI 教育的資訊圖 4-6 繪製心智圖(AI-Generated Mind Maps) 4-7 製作 AI 旅遊地圖與情境地圖 4-8 從資料到圖像 - 即時資訊可視化應用 4-9 漫畫與多格漫畫創作中的應用 4-10 Gemini x Nano Banana 塗鴉
▍第5 章 AI 圖像編輯 - Nano Banana 5-1 圖生圖 5-2 多圖融合 - 人物移動 5-3 多圖融合 - 合成新圖像 5-4 世界知識加成 - 自動融入合理的背景元素 5-5 官網展示實例
▍第6 章 Gemini x Google 服務 - 把AI變成你的日常生活助理 6-1 Google 地圖 - 智慧導覽與資訊查詢 6-2 Google 航班/ 機票 - 智慧查詢與比價 6-3 Google 飯店 - 智慧查詢與比價 6-4 結合地圖、航班或飯店的旅遊規劃 6-5 YouTube 應用
▍第7 章 Gemini 應用程式 – Google Workspace 7-1 認識「應用程式」 7-2 Gmail 應用 - 智慧郵件操作 7-3 Google Calendar - 時間管理 7-4 Google Keep - 雲端筆記 7-5 Google Tasks - 建立待辦清單系統 7-6 Google 文件 – 生成與摘要 7-7 Google 雲端硬碟 7-8 YouTube 與 YouTube Music 應用 7-9 Gemini 3.5 應用程式中的 Verify AI功能說明
▍第8 章 Chrome x Gemini - 從 AI 搜尋到智慧瀏覽助理 8-1 AI Overview 入門 - 讓搜尋直接告訴你答案 8-2 Gemini 如何驅動 Chrome 的 AI搜尋系統 8-3 進入Chrome 的AI 搜尋 8-4 實作AI 搜尋 8-5 Chrome 的「問問Gemini」
▍第9 章 文字、音訊與圖像檔案上傳 -智慧分析 9-1 檔案上傳與分析的核心價值 9-2 文件型檔案分析(Word、PDF) 9-3 音訊檔案轉文字稿 9-4 影片檔案內容分析 9-5 AI 視覺 - 上傳圖像,理解圖像內容
▍第10 章 Google 文件、試算表與簡報的AI 升級 10-1 Google 文件 10-2 Google 試算表 10-3 Google 簡報
▍第11 章 Gemini 的 Canvas 功能 11-1 Canvas 功能概覽 11-2 建立Canvas 文案 11-3 讓文件活起來 - Canvas「 建立」應用 11-4 用Canvas 檢視或摘要檔案 11-5 Canvas 設計帕斯卡三角形遊戲
▍第12 章 Deep Research 深度研究 12-1 Deep Research 功能概覽 12-2 操作流程 12-3 實際應用情境
▍第13 章 探索Gem - 建立專屬AI 助理 13-1 什麼是 Gem 13-2 認識與建立Gem 環境 13-3 Gem 管理工具 13-4 英文學習卡 Gem 13-5 電商客服 Gem 13-6 我可以稱Gem 是打造「專屬AI Agent 嗎」
▍第14 章 創作音樂與 Lyria 3 14-1 Lyria 3 模型技術架構與生成機制 14-2 Gemini 創作音樂環境 14-3 實際操作流程完整示範 14-4 創作英文歌曲
▍第15 章 AI 語音影片生成新紀元 -Gemini Omni x Flow 15-1 Gemini Omni 的定位與特點 15-2 Gemini Omni 的操作流程 15-3 文字生成影片 15-4 圖片生成影片 15-5 文字 + 圖片 - 飛翔的英雄 15-6 建立含語音的影片 - 電光英雄 15-7 影片再創作:從上傳影片到 AI導演 15-8 實驗性創作工具Google Flow -從生成片段走向完整影片製作
▍第16 章 Gemini App 與Live - 手機上的隨身 AI 助手 16-1 安裝與登入 16-2 操作介面導覽 16-3 Gemini App 行動體驗特色 16-4 Gemini Live
▍第17 章 NotebookLM - AI 智慧筆記與研究助理 17-1 NotebookLM 的定位與演變 17-2 NotebookLM 視窗與筆記操作環境 17-3 建立NotebookLM 的知識引擎 17-4 智慧「對話」 - 與 NotebookLM的互動中樞 17-5 工作室 - 多模態輸出的創作空間 17-6 我的筆記本
▍第18 章 Gemini 內建筆記本 -NotebookLM 進入Gemini工作流程 18-1 Gemini 為什麼內建筆記本 18-2 Gemini 筆記本與 NotebookLM的關係 18-3 在 Gemini 中建立筆記本 18-4 Gemini 筆記本適合哪些使用情境 18-5 在 Gemini 中使用 NotebookLM建立的筆記本 18-6 未來 AI 知識工作流程的改變
▍附錄A AI 導師上線- 體驗Gemini 的引導式學習( 深智官網下載電子書) |
序
| 人工智慧的發展,正從「會回答問題的對話系統」,正式邁入「能參與工作流程、協助創作、整理知識與串連工具的智慧協作夥伴」階段。Gemini 3.5 的出現,不只是模型能力的升級,更象徵 Google AI 生態系完成一次重要的整合與轉向。AI 不再只是單一工具,而是逐漸成為貫穿學習、工作、研究、生活與創作流程的核心引擎。
在 Gemini 3.5 的架構下,文字、語音、圖像、音樂、影片、文件與資料不再各自分散,而是能在同一個對話、專案與知識脈絡中彼此轉換、補強與延伸。透過 Chrome x Gemini 的智慧搜尋與瀏覽輔助、Nano Banana 的圖像生成與編輯、Lyria 3 的音樂創作、Gemini Omni x Flow 的影音生成能力,以及 NotebookLM 所建構的智慧筆記與研究助理,Google 已逐步形塑出一套真正可落地的「多模態 AI 工作流」。 本書即是在這樣的背景下誕生,並以「Gemini 3.5 x NotebookLM 領軍,邁向Google 多模態 AI 工作流」為核心主軸,系統性整理 Gemini 3.5 世代的完整能力版圖。內容涵蓋從 Gemini 快速上手、聊天技巧、輸出格式控制,到 Chrome AI 搜尋、Google Workspace 深度整合;從檔案上傳分析、Canvas 視覺化工作空間、Deep Research 深度研究,到 Gem 專屬 AI 助理的建立;並進一步深入圖像、音樂、語音、影片與知識管理等跨模態應用,完整呈現 AI 如何從「輔助思考」進化為「共同創作」。
在本書中,讀者將實際體驗: z Gemini 3.5 如何改變搜尋、寫作、規劃、學習與決策的工作模式。 z Chrome x Gemini 如何讓瀏覽器從查資料工具,升級為智慧閱讀與搜尋助理。 z Nano Banana 如何讓文字生成圖像,並進一步完成圖像編輯、合成與視覺化應用。 z Lyria 3、Gemini Omni 與 Flow 如何開啟音樂、語音與影片生成的新型創作流程。 z Canvas、Deep Research 與 Gem 如何協助使用者整理內容、研究議題並建立專屬 AI 助理。 z NotebookLM 如何將來源資料轉化為摘要、問答、筆記、學習卡、測驗、簡報與語音摘要等知識成果。 z Gemini App 與 Gemini Live 如何把多模態 AI 帶入手機、語音互動與即時生活場景。
本書並非單純介紹功能,而是試圖回答一個更關鍵的問題:在 AI 已經能理解內容、生成素材、分析資料、輔助推理與組織知識的時代,人應該如何與 AI 協作,才能真正放大自己的能力,而不是被工具牽著走? AI 的價值,從來不只是展示它能完成多少任務,而在於它是否能幫助我們想得更清楚、學得更有效率、整理得更有系統、創作得更有方向。這也是本書一以貫之的核心精神:將 Gemini 3.5 與 Google AI 生態系,轉化為日常可實踐、可累積、可進化的智慧工作方法。 期盼讀者在閱讀本書後,不僅能熟練操作 Gemini 3.5、NotebookLM、Chrome、Nano Banana、Omni、Flow 與 Gem 等工具,更能建立屬於自己的多模態 AI 工作流思維,並將其實際應用於學習、研究、職場、行銷、教學與創意創作之中。當 AI 成為思考與創作的長期夥伴,未來不再只是即將到來,而是正在我們每一次對話、每一份文件、每一個筆記本與每一個專案中,逐步成形。 本書編寫雖力求完善,然疏漏與不足仍在所難免,尚祈讀者不吝指正、賜教,讓這本《Gemini 3.5 x NotebookLM 領軍:Nano Banana x Omni x Lyric x Flow x Gem -Google 多模態 AI 工作流》能持續修正、持續進化,陪伴讀者一同前行。
洪錦魁2026/7/10 編號:320/370/500 jiinkwei@me.com
臉書粉絲團 歡迎加入:王者歸來電腦專業圖書系列 歡迎加入:iCoding 程式語言讀書會 歡迎加入:MQTT 與AIoT 整合運用 歡迎加入:深度機器學習線上讀書會
圖書資源說明 本書籍的所有Prompt 和資源實例可以在深智公司網站下載。 |
































