描述

內容簡介

Google AI 創作術

靈感 x 圖像 x 設計 x 音樂 x 影片的工作流

☆★☆從靈感到作品☆★☆

☆★☆一次掌握 Google AI 創作整合流程☆★☆

AI 工具越來越多，創作看似變得更簡單。但當你真正開始使用時，可能也會發現：

★生成圖片很容易，做出一致風格很難。

★生成影片很快速，做出完整敘事很難。

★生成音樂很新鮮，但讓聲音與畫面真正搭配很難。

問題不在工具不夠強，而在於你還沒有一套清楚的創作工作流。

《Google AI 創作術：靈感 x 圖像 x 設計 x 音樂 x 影片的工作流》帶你從創作的最前端開始，先用 Gemini 釐清主題、受眾、風格與文案結構，再進一步將想法轉換為圖像、設計、影片與音樂，最後整合成可以發表的完整作品。

本書不是把工具一個一個分開介紹，而是把它們串成一條真正可執行的創作流程。你將學會：

◎ 用 Gemini 把想法變成創作藍圖

在動手生成之前，先釐清主題、方向、風格與內容結構，讓創作不再只是反覆試錯。

◎ 用 Nano Banana Pro 讓圖像從好看變成好用

從第一張圖片開始，進一步掌握風格控制、局部編修、角色一致性與多圖融合，讓圖像成為可延伸的視覺資產。

◎ 用 Stitch 把圖像與內容變成版面設計

學會用文字描述網站與 App 版型，快速建立網頁、介面與互動原型。

◎ 用 Veo 與 Flow 讓畫面變成有節奏的影片

從文字生成影片、圖片延伸影片，到分鏡設計、多段影片串接與流程控制，建立真正的影片敘事能力。

◎ 用 Lyria 為作品設計聲音與情緒

從文字、圖像與影片生成音樂，讓聲音不再只是背景，而是作品情緒的一部分。

◎ 用 Google Vids 完成最後整合輸出

把影片、音樂、標題與內容整合起來，讓素材成為可以觀看、分享與發表的作品。

◎ 這本書適合

想用 AI 創作圖像、影片與音樂的內容創作者。

想建立個人品牌視覺的講師、作者、設計師與行銷人。

想學會 Google AI 工具整合應用的初學者。

想把靈感變成作品，而不只是產生零散素材的創作者。

AI 時代的創作者，不只是會使用工具的人，而是能夠規劃流程、控制結果、完成作品的人。

從一個想法開始，

把靈感變成圖像，

把圖像變成設計，

把設計變成影片，

再用音樂完成情緒。

這就是 Google AI 創作術。

作者簡介

洪錦魁

畢業於明志工專（現今明志科技大學），跳級留學美國University of Mississippi計算機系研究所。

2023~2025年連續3年獲選博客來「年度十大華文作家」，多年來唯一獲選的電腦書籍作者。也是一位跨越電腦作業系統與科技時代的電腦專家，著作等身的作家，下列是他在各時期的代表作品。

► DOS時代：「IBM PC組合語言、Basic、C、C++、Pascal、資料結構」。

► Windows時代：「Windows Programming 使用C、Visual Basic」。

► Internet時代：「網頁設計使用HTML」。

► 大數據時代：「R 語言邁向Big Data之路、Python王者歸來」。

► AI時代：「機器學習數學、微積分 + Python實作」、「AI視覺、AI之眼」。

► 通用AI時代：「ChatGPT、Gemini、Copilot、無料AI、AI職場、AI行銷、AI影片、AI賺錢術、NotebookLM - 打造AI『第二大腦』」。

► Vibe Coding 時代：「寫程式的 AI 戰友、Vibe Coding - ChatGPT x Codex」。

► 國內第 1 本「多模態 AI - ChatGPT 5」、「Nano Banana 藝術宇宙」作者。

► 國內第 1 本「AI 健康養生長壽書」、「AI 思維 – 原子習慣」作者。

作品曾被翻譯為簡體中文、馬來西亞文，英文，近年來作品則是在北京清華大學和台灣深智同步發行。

他的多本著作皆曾登上天瓏、博客來、Momo電腦書類，不同時期暢銷排行榜第1 名，他的著作特色是，所有程式語法或是功能解說會依特性分類，同時以實用的程式範例做說明，不賣弄學問，讓整本書淺顯易懂，讀者可以由他的著作事半功倍輕鬆掌握相關知識。

▌第1 章　創作的起點 - 用 Gemini 建立創作藍圖

1-1 為什麼多數人做不出作品

1-1-1 沒有主題：不知道自己要做什麼

1-1-2 沒有風格：產出無法保持一致

1-1-3 沒有結構：內容零散，難以發展

1-2 Gemini：你的創作大腦

1-3 用 Gemini 規劃創作文案

1-3-1 從主題開始（Idea）

1-3-2 建立文案結構（Structure）

1-3-3 定義風格與情緒（Direction）

1-3-4 Gemini 生成給AI 繪圖工具的Prompt

1-4 創作藍圖的價值（為什麼要先想清楚）

1-4-1 沒有藍圖的創作：反覆生成

1-4-2 有藍圖的創作：穩定產出

1-4-3 藍圖讓創作變簡單

▌第2 章　快速生成圖像 - 用Gemini 建立第一張作品

2-1 為什麼從 Gemini 的「建立圖像」開始

2-2 Gemini 建立圖像（基本操作）

2-2-1 理解圖像風格（選擇的基礎）

2-2-2 圖像生成的兩個關鍵問題

2-2-3 建立圖像的基本流程（實際操作）

2-2-4 生成結果的基本判斷

2-3 從創作藍圖到圖像（關鍵轉換）

2-3-1 將藍圖轉換為圖像描述

2-3-2 圖像結果的問題分析與修正（讓畫面更精準）

2-4 從生成到創作

▌第3 章　讓圖變有用- 情境化圖像創作與Prompt 設計

3-1 圖像不是作品，而是「用途」

3-2 傳達型圖像創作 - 讓人看懂

3-2-1 書內插圖 - 概念轉具體

3-2-2 教學圖解 - 流程與步驟

3-2-3 資訊圖 - 整體理解

3-2-4 心智圖 - 結構化思考

3-3 吸引型圖像創作 - 讓人停下來

3-3-1 書籍封面 - 建立第一印象

3-3-2 行銷海報 - 快速抓住注意

3-3-3 社群貼文 - 建立情緒與互動

3-3-4 網頁 Banner - 引導視線與行動

3-4 敘事型圖像創作 - 讓人記住

3-4-1 漫畫 - 用角色呈現概念

3-4-2 情境插圖 - 讓讀者進入畫面

3-4-3 教學故事圖 - 呈現過程與轉變

3-4-4 品牌角色視覺 - 建立記憶與辨識

▌第4 章　進階圖像創作 - 風格x 編修x 控制

4-1 圖像創作的進階關鍵 - 從生成到控制

4-1-1 為什麼「生成」不等於「創作」

4-1-2 Nano Banana Pro - 圖像控制引擎與三大核心能力

4-2 風格控制 - 決定圖像的方向

4-2-1 三大常見風格 - 快速分類

4-2-2 風格是策略，不是裝飾

4-2-3 風格穩定的關鍵

4-2-4 風格可以被轉換

4-3 Image-to-Image - 圖像創作的核心能力

4-3-1 什麼是 Image-to-Image，從「重來」到「延續」

4-3-2 局部修改 - 精準調整，而不是全部重來

4-3-3 角色一致性 - 讓同一人物持續存在

4-3-4 多圖融合 - 從單一素材到創意組合

4-4 世界知識加成 - AI 隱藏能力

▌第5 章　圖像策略 - 建立個人與品牌視覺

5-1 圖像的價值升級 - 從作品到品牌

5-1-1 為什麼單張圖片沒有長期價值

5-1-2 什麼是「視覺資產」

5-1-3 品牌視覺的核心概念

5-2 視覺一致性設計 - 建立你的圖像語言

5-2-1 一致性的三大元素 - 色彩 x 風格 x 構圖

5-2-2 如何用 AI 維持一致性 - 從設定到延續

5-3 AI 品牌風格建立 - 從個人到系統

5-3-1 什麼是 AI 品牌風格

5-3-2 建立你的風格 Prompt - 從描述到標準化

5-3-3 角色與視覺 IP 建立 - 讓圖像被記住

5-4 應用實戰 - 社群 x 書封 x 廣告圖

5-4-1 社群圖像 - 吸引注意與建立互動

5-4-2 書封設計 - 建立第一印象與品牌識別

5-4-3 廣告與 Banner - 引導視線與促進行動

5-4-4 多版本輸出 - 一套素材，延伸多種應用

5-5 本章小結 - 從圖像到品牌

▌第6 章　AI 版面設計 - Stitch

6-1 進入Google Stitch

6-1-1 應用程式或網頁

6-1-2 運作模式

6-1-3 Start Live Mode(Preview)

6-1-4 附加內容

6-2 用Stitch 設計網頁版型

6-2-1 設計個人品牌 / 專家網站（Personal Branding）

6-2-2 上傳圖像與編輯圖像

6-2-3 將網頁文字改成中文

6-2-4 編輯文字

6-2-5 Stitch 主工具列

6-2-5 查看程式碼

6-2-6 建立新專案

6-2-7 課程學習平台/ 產品介紹頁 - 網站設計實例

6-3 用 Stitch 設計多頁式 App - 從畫面到互動流程

6-3-1 設計「多頁式AI 學習平台App」

6-3-2 請將英文版App 轉成中文

6-3-3 連結與預覽即時原型

6-4 Stitch 設計流程回顧 - 從版型設計走向原型思維

▌第7 章　AI 影片創作核心 - Veo 模型

7-1 影片的本質 - 為什麼「影片 = 敘事」

7-1-1 從圖片到影片的差別

7-1-2 影片的三個核心元素

7-1-3 AI 影片創作的關鍵轉換

7-2 Veo 模型概念 - 能力與限制

7-2-1 Veo 的核心能力

7-2-2 Veo 的限制

7-2-3 最佳使用情境

7-3 Text → Video：從文字生成影片

7-3-1 進入Gemini 的影片創作環境

7-3-2 Text → Video 的基本 Prompt 結構

7-3-3 實例示範 - 從描述到影片生成

7-4 Image → Video：從圖片延伸影片

7-4-1 為什麼 Image → Video 很重要

7-4-2 實例示範 - 讓圖片產生「自然動態」

7-5 從畫面生成到影片敘事

▌第8 章　影片流程控制 - Flow 與結構設計

8-1 Flow 是什麼：從生成到流程的轉變

8-1-1 為什麼單一影片生成不夠用

8-1-2 Flow 的核心概念：影片是流程，不是結果

8-1-3 Flow 在創作流程中的位置

8-2 分鏡（Storyboard）： AI 影片的關鍵能力

8-2-1 什麼是分鏡（Storyboard）

8-2-2 如何設計一段影片的分鏡結構

8-2-3 從文字到分鏡的轉換技巧

8-3 多段影片生成與串接

8-3-1 建立多個影片片段

8-3-2 影片串接與順序控制

8-3-3 風格一致性的維持技巧

8-4 Flow 創作設計：完整影片案例

8-4-1 主題設定與創意發想 - 實戰案例：奈米香蕉人

8-4-2 分鏡設計與腳本建立

8-4-3 影片生成與 Flow 組裝 - 4 段 Prompt 完整實作

8-5 Flow 實作：奈米香蕉人

8-5-1 進入Flow

8-5-2 建立第一張場景圖片

8-5-3 建立Scene 1 - 角色登場

8-5-4 建立Scene 2 – 能力展現

8-5-5 建立Scene 3 – 生活互動

8-5-6 建立Scene 4 – 成果展示

8-5-7 故事延伸與調整

8-6 延伸創作方向：讀者可發展的主題

▌第9 章　AI 音樂與情緒設計 - Lyria 與聲音創作

9-1 為什麼創作需要「聲音與音樂」

9-1-1 聲音如何改變觀眾的感受

9-1-2 沒有音樂的作品為什麼不完整

9-1-3 聲音在創作流程中的位置

9-2 Lyria 是什麼：從使用音樂到創作音樂

9-2-1 Lyria 的核心能力與定位

9-2-2 音樂生成的基本邏輯

9-2-3 Lyria 的使用情境與創作限制

9-3 Gemini 創作音樂環境

9-3-1 進入Gemini 創作音樂環境

9-3-2 Gemini「創作音樂」環境中的音樂圖片功能說明

9-3-3 音樂風格圖片的使用策略：從自由生成到精準控制

9-4 從文字生成音樂（Text → Music）

9-4-1 音樂 Prompt 的基本結構（音樂 x 歌曲雙應用）

9-4-2 範例實作：不同情境的音樂與歌曲生成

9-5 從圖像生成音樂（Image → Music）

9-5-1 圖像如何被轉換為音樂

9-5-2 範例實作：同一角色，不同場景的音樂設計

9-5-3 風格一致性的維持技巧（從畫面到聲音）

9-6 影片配樂設計：從分析到音樂生成

9-6-1 用 Gemini 分析影片情緒

9-6-2 從影片分析轉為音樂 Prompt（奈米香蕉人實戰）

9-6-3 直接以影片生成音樂（快速模式與精準模式的取捨）

9-7 音樂風格與情緒控制（讓聲音成為創作能力）

9-7-1 常見音樂風格分類（建立創作語言）

9-7-2 情緒控制三大元素（節奏 x 音色 x 強弱）

9-7-3 建立「聲音風格」（從創作到品牌）

▌第10 章　影片與音樂整合 - Google Vids 應用

10-1 Google Vids 是什麼

10-1-1 為什麼說它是「實驗性工具」

10-1-2 核心功能（本章會用到的部分）

10-1-3 與傳統剪輯工具的差異

10-1-4 小結

10-2 進入Google Vids 工作環境

10-3 上傳影片

10-4 影片嵌入音訊

10-5 建立影片標題

10-6 儲存與下載影片

序

「創作」，從來不只是靈感的出現，也不只是工具的操作。

在 AI 快速進入創作現場的今天，我們似乎比過去更容易產出內容。只要輸入一句話，就能得到一段文案、一張圖片、一支影片，甚至一首音樂。工具變得更強，速度變得更快，創作的門檻也被大幅降低。然而，當我們真正開始使用 AI 時，很快會發現一個新的問題：內容可以生成，作品卻不一定成立。

一張好看的圖片，不一定能成為品牌視覺；一段精彩的影片，不一定有清楚的敘事；一首動聽的音樂，如果無法貼合畫面，也只是背景聲音。AI 能夠快速提供素材，但真正讓素材變成作品的，仍然是人的判斷、結構與設計能力。

這正是本書想要處理的核心問題。

《Google AI 創作術：靈感 x 圖像 x 設計 x 音樂 x 影片的工作流》不是一本只介紹單一工具的操作手冊，而是一本幫助讀者建立「完整創作流程」的書。從最初的靈感發想，到圖像生成、風格控制、版面設計、影片敘事、音樂情緒，再到最後的整合輸出，本書希望帶你看見一件事：AI 創作真正的價值，不在於一次生成多少內容，而在於能否把每一步串連成一個可持續、可控制、可完成的工作流。

因此，這本書的起點不是工具，而是思考。在創作開始之前，我們必須先問清楚：

► 我要做什麼？

► 為誰而做？

► 想傳達什麼訊息？

► 希望呈現什麼感覺？

當這些問題被釐清之後，Gemini 不再只是問答工具，而能成為創作的大腦，幫助我們整理主題、建立結構、定義風格，將模糊的想法轉化為可以執行的創作藍圖。

有了藍圖之後，圖像才不再是隨機生成的結果，而是有方向的視覺表達。透過Gemini 與 Nano Banana Pro，讀者可以從第一張圖像開始，進一步理解圖像的用途、情境與控制方式。圖像不只是好看，更要能傳達、吸引、敘事；不只是單張作品，更要能延伸為個人或品牌的視覺資產。

接著，創作會從「畫面」走向「版面」。Stitch 讓我們用文字描述網站與 App 的結構，將圖像與內容放進更清楚的設計框架中。這一步提醒我們，設計不是裝飾，而是資訊被理解的方式。當創作者能夠掌握畫面如何排列、資訊如何被看見，就開始具備產品與介面思維。

再往後，作品需要動起來。Veo 讓畫面成為影片，Flow 則讓影片不只是片段，而是有分鏡、有節奏、有結構的敘事。影片的本質不是「會動的圖片」，而是一段被設計的時間體驗。當你開始思考開場、發展、轉折與結尾時，你就不再只是生成影片，而是在導演一段觀看過程。

最後，聲音讓作品真正被感受。Lyria 使音樂不再只是事後尋找的素材，而是可以被設計的情緒語言。畫面讓人理解內容，音樂讓人進入情緒；當兩者結合，作品才真正完整。透過 Google Vids，影片、音樂與標題被整合在一起，創作也從素材階段，正式走向可觀看、可分享、可發表的成果。

在這條流程中，AI 扮演的不是替代創作者的角色，而是擴展創作者能力的夥伴。它可以幫助我們更快發想、更快嘗試、更快產出，但它無法替我們決定方向、判斷品質、建立風格，也無法替我們理解作品真正想要帶給觀眾的感受。

因此，本書真正想傳達的是：