描述
內容簡介
Google AI 創作術靈感 x 圖像 x 設計 x 音樂 x 影片的工作流
☆★☆從靈感到作品☆★☆ ☆★☆一次掌握 Google AI 創作整合流程☆★☆
AI 工具越來越多,創作看似變得更簡單。但當你真正開始使用時,可能也會發現: ★生成圖片很容易,做出一致風格很難。 ★生成影片很快速,做出完整敘事很難。 ★生成音樂很新鮮,但讓聲音與畫面真正搭配很難。
問題不在工具不夠強,而在於你還沒有一套清楚的創作工作流。
《Google AI 創作術:靈感 x 圖像 x 設計 x 音樂 x 影片的工作流》帶你從創作的最前端開始,先用 Gemini 釐清主題、受眾、風格與文案結構,再進一步將想法轉換為圖像、設計、影片與音樂,最後整合成可以發表的完整作品。
本書不是把工具一個一個分開介紹,而是把它們串成一條真正可執行的創作流程。你將學會:
◎ 用 Gemini 把想法變成創作藍圖 在動手生成之前,先釐清主題、方向、風格與內容結構,讓創作不再只是反覆試錯。
◎ 用 Nano Banana Pro 讓圖像從好看變成好用 從第一張圖片開始,進一步掌握風格控制、局部編修、角色一致性與多圖融合,讓圖像成為可延伸的視覺資產。
◎ 用 Stitch 把圖像與內容變成版面設計 學會用文字描述網站與 App 版型,快速建立網頁、介面與互動原型。
◎ 用 Veo 與 Flow 讓畫面變成有節奏的影片 從文字生成影片、圖片延伸影片,到分鏡設計、多段影片串接與流程控制,建立真正的影片敘事能力。
◎ 用 Lyria 為作品設計聲音與情緒 從文字、圖像與影片生成音樂,讓聲音不再只是背景,而是作品情緒的一部分。
◎ 用 Google Vids 完成最後整合輸出 把影片、音樂、標題與內容整合起來,讓素材成為可以觀看、分享與發表的作品。
◎ 這本書適合 想用 AI 創作圖像、影片與音樂的內容創作者。 想建立個人品牌視覺的講師、作者、設計師與行銷人。 想學會 Google AI 工具整合應用的初學者。 想把靈感變成作品,而不只是產生零散素材的創作者。
AI 時代的創作者,不只是會使用工具的人,而是能夠規劃流程、控制結果、完成作品的人。 從一個想法開始, 把靈感變成圖像, 把圖像變成設計, 把設計變成影片, 再用音樂完成情緒。 這就是 Google AI 創作術。 |
作者簡介
| 洪錦魁
畢業於明志工專(現今明志科技大學),跳級留學美國University of Mississippi計算機系研究所。 2023~2025年連續3年獲選博客來「年度十大華文作家」,多年來唯一獲選的電腦書籍作者。也是一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家,下列是他在各時期的代表作品。 ► DOS時代:「IBM PC組合語言、Basic、C、C++、Pascal、資料結構」。 ► Windows時代:「Windows Programming 使用C、Visual Basic」。 ► Internet時代:「網頁設計使用HTML」。 ► 大數據時代:「R 語言邁向Big Data之路、Python王者歸來」。 ► AI時代:「機器學習數學、微積分 + Python實作」、「AI視覺、AI之眼」。 ► 通用AI時代:「ChatGPT、Gemini、Copilot、無料AI、AI職場、AI行銷、AI影片、AI賺錢術、NotebookLM - 打造AI『第二大腦』」。 ► Vibe Coding 時代:「寫程式的 AI 戰友、Vibe Coding - ChatGPT x Codex」。 ► 國內第 1 本「多模態 AI - ChatGPT 5」、「Nano Banana 藝術宇宙」作者。 ► 國內第 1 本「AI 健康養生長壽書」、「AI 思維 – 原子習慣」作者。 作品曾被翻譯為簡體中文、馬來西亞文,英文,近年來作品則是在北京清華大學和台灣深智同步發行。 他的多本著作皆曾登上天瓏、博客來、Momo電腦書類,不同時期暢銷排行榜第1 名,他的著作特色是,所有程式語法或是功能解說會依特性分類,同時以實用的程式範例做說明,不賣弄學問,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。 |
目錄
| ▌第1 章 創作的起點 - 用 Gemini 建立創作藍圖
1-1 為什麼多數人做不出作品 1-1-1 沒有主題:不知道自己要做什麼 1-1-2 沒有風格:產出無法保持一致 1-1-3 沒有結構:內容零散,難以發展 1-2 Gemini:你的創作大腦 1-3 用 Gemini 規劃創作文案 1-3-1 從主題開始(Idea) 1-3-2 建立文案結構(Structure) 1-3-3 定義風格與情緒(Direction) 1-3-4 Gemini 生成給AI 繪圖工具的Prompt 1-4 創作藍圖的價值(為什麼要先想清楚) 1-4-1 沒有藍圖的創作:反覆生成 1-4-2 有藍圖的創作:穩定產出 1-4-3 藍圖讓創作變簡單
▌第2 章 快速生成圖像 - 用Gemini 建立第一張作品 2-1 為什麼從 Gemini 的「建立圖像」開始 2-2 Gemini 建立圖像(基本操作) 2-2-1 理解圖像風格(選擇的基礎) 2-2-2 圖像生成的兩個關鍵問題 2-2-3 建立圖像的基本流程(實際操作) 2-2-4 生成結果的基本判斷 2-3 從創作藍圖到圖像(關鍵轉換) 2-3-1 將藍圖轉換為圖像描述 2-3-2 圖像結果的問題分析與修正(讓畫面更精準) 2-4 從生成到創作
▌第3 章 讓圖變有用- 情境化圖像創作與Prompt 設計 3-1 圖像不是作品,而是「用途」 3-2 傳達型圖像創作 - 讓人看懂 3-2-1 書內插圖 - 概念轉具體 3-2-2 教學圖解 - 流程與步驟 3-2-3 資訊圖 - 整體理解 3-2-4 心智圖 - 結構化思考 3-3 吸引型圖像創作 - 讓人停下來 3-3-1 書籍封面 - 建立第一印象 3-3-2 行銷海報 - 快速抓住注意 3-3-3 社群貼文 - 建立情緒與互動 3-3-4 網頁 Banner - 引導視線與行動 3-4 敘事型圖像創作 - 讓人記住 3-4-1 漫畫 - 用角色呈現概念 3-4-2 情境插圖 - 讓讀者進入畫面 3-4-3 教學故事圖 - 呈現過程與轉變 3-4-4 品牌角色視覺 - 建立記憶與辨識
▌第4 章 進階圖像創作 - 風格x 編修x 控制 4-1 圖像創作的進階關鍵 - 從生成到控制 4-1-1 為什麼「生成」不等於「創作」 4-1-2 Nano Banana Pro - 圖像控制引擎與三大核心能力 4-2 風格控制 - 決定圖像的方向 4-2-1 三大常見風格 - 快速分類 4-2-2 風格是策略,不是裝飾 4-2-3 風格穩定的關鍵 4-2-4 風格可以被轉換 4-3 Image-to-Image - 圖像創作的核心能力 4-3-1 什麼是 Image-to-Image,從「重來」到「延續」 4-3-2 局部修改 - 精準調整,而不是全部重來 4-3-3 角色一致性 - 讓同一人物持續存在 4-3-4 多圖融合 - 從單一素材到創意組合 4-4 世界知識加成 - AI 隱藏能力
▌第5 章 圖像策略 - 建立個人與品牌視覺 5-1 圖像的價值升級 - 從作品到品牌 5-1-1 為什麼單張圖片沒有長期價值 5-1-2 什麼是「視覺資產」 5-1-3 品牌視覺的核心概念 5-2 視覺一致性設計 - 建立你的圖像語言 5-2-1 一致性的三大元素 - 色彩 x 風格 x 構圖 5-2-2 如何用 AI 維持一致性 - 從設定到延續 5-3 AI 品牌風格建立 - 從個人到系統 5-3-1 什麼是 AI 品牌風格 5-3-2 建立你的風格 Prompt - 從描述到標準化 5-3-3 角色與視覺 IP 建立 - 讓圖像被記住 5-4 應用實戰 - 社群 x 書封 x 廣告圖 5-4-1 社群圖像 - 吸引注意與建立互動 5-4-2 書封設計 - 建立第一印象與品牌識別 5-4-3 廣告與 Banner - 引導視線與促進行動 5-4-4 多版本輸出 - 一套素材,延伸多種應用 5-5 本章小結 - 從圖像到品牌
▌第6 章 AI 版面設計 - Stitch 6-1 進入Google Stitch 6-1-1 應用程式或網頁 6-1-2 運作模式 6-1-3 Start Live Mode(Preview) 6-1-4 附加內容 6-2 用Stitch 設計網頁版型 6-2-1 設計個人品牌 / 專家網站(Personal Branding) 6-2-2 上傳圖像與編輯圖像 6-2-3 將網頁文字改成中文 6-2-4 編輯文字 6-2-5 Stitch 主工具列 6-2-5 查看程式碼 6-2-6 建立新專案 6-2-7 課程學習平台/ 產品介紹頁 - 網站設計實例 6-3 用 Stitch 設計多頁式 App - 從畫面到互動流程 6-3-1 設計「多頁式AI 學習平台App」 6-3-2 請將英文版App 轉成中文 6-3-3 連結與預覽即時原型 6-4 Stitch 設計流程回顧 - 從版型設計走向原型思維
▌第7 章 AI 影片創作核心 - Veo 模型 7-1 影片的本質 - 為什麼「影片 = 敘事」 7-1-1 從圖片到影片的差別 7-1-2 影片的三個核心元素 7-1-3 AI 影片創作的關鍵轉換 7-2 Veo 模型概念 - 能力與限制 7-2-1 Veo 的核心能力 7-2-2 Veo 的限制 7-2-3 最佳使用情境 7-3 Text → Video:從文字生成影片 7-3-1 進入Gemini 的影片創作環境 7-3-2 Text → Video 的基本 Prompt 結構 7-3-3 實例示範 - 從描述到影片生成 7-4 Image → Video:從圖片延伸影片 7-4-1 為什麼 Image → Video 很重要 7-4-2 實例示範 - 讓圖片產生「自然動態」 7-5 從畫面生成到影片敘事
▌第8 章 影片流程控制 - Flow 與結構設計 8-1 Flow 是什麼:從生成到流程的轉變 8-1-1 為什麼單一影片生成不夠用 8-1-2 Flow 的核心概念:影片是流程,不是結果 8-1-3 Flow 在創作流程中的位置 8-2 分鏡(Storyboard): AI 影片的關鍵能力 8-2-1 什麼是分鏡(Storyboard) 8-2-2 如何設計一段影片的分鏡結構 8-2-3 從文字到分鏡的轉換技巧 8-3 多段影片生成與串接 8-3-1 建立多個影片片段 8-3-2 影片串接與順序控制 8-3-3 風格一致性的維持技巧 8-4 Flow 創作設計:完整影片案例 8-4-1 主題設定與創意發想 - 實戰案例:奈米香蕉人 8-4-2 分鏡設計與腳本建立 8-4-3 影片生成與 Flow 組裝 - 4 段 Prompt 完整實作 8-5 Flow 實作:奈米香蕉人 8-5-1 進入Flow 8-5-2 建立第一張場景圖片 8-5-3 建立Scene 1 - 角色登場 8-5-4 建立Scene 2 – 能力展現 8-5-5 建立Scene 3 – 生活互動 8-5-6 建立Scene 4 – 成果展示 8-5-7 故事延伸與調整 8-6 延伸創作方向:讀者可發展的主題
▌第9 章 AI 音樂與情緒設計 - Lyria 與聲音創作 9-1 為什麼創作需要「聲音與音樂」 9-1-1 聲音如何改變觀眾的感受 9-1-2 沒有音樂的作品為什麼不完整 9-1-3 聲音在創作流程中的位置 9-2 Lyria 是什麼:從使用音樂到創作音樂 9-2-1 Lyria 的核心能力與定位 9-2-2 音樂生成的基本邏輯 9-2-3 Lyria 的使用情境與創作限制 9-3 Gemini 創作音樂環境 9-3-1 進入Gemini 創作音樂環境 9-3-2 Gemini「創作音樂」環境中的音樂圖片功能說明 9-3-3 音樂風格圖片的使用策略:從自由生成到精準控制 9-4 從文字生成音樂(Text → Music) 9-4-1 音樂 Prompt 的基本結構(音樂 x 歌曲雙應用) 9-4-2 範例實作:不同情境的音樂與歌曲生成 9-5 從圖像生成音樂(Image → Music) 9-5-1 圖像如何被轉換為音樂 9-5-2 範例實作:同一角色,不同場景的音樂設計 9-5-3 風格一致性的維持技巧(從畫面到聲音) 9-6 影片配樂設計:從分析到音樂生成 9-6-1 用 Gemini 分析影片情緒 9-6-2 從影片分析轉為音樂 Prompt(奈米香蕉人實戰) 9-6-3 直接以影片生成音樂(快速模式與精準模式的取捨) 9-7 音樂風格與情緒控制(讓聲音成為創作能力) 9-7-1 常見音樂風格分類(建立創作語言) 9-7-2 情緒控制三大元素(節奏 x 音色 x 強弱) 9-7-3 建立「聲音風格」(從創作到品牌)
▌第10 章 影片與音樂整合 - Google Vids 應用 10-1 Google Vids 是什麼 10-1-1 為什麼說它是「實驗性工具」 10-1-2 核心功能(本章會用到的部分) 10-1-3 與傳統剪輯工具的差異 10-1-4 小結 10-2 進入Google Vids 工作環境 10-3 上傳影片 10-4 影片嵌入音訊 10-5 建立影片標題 10-6 儲存與下載影片 |
序
| 「創作」,從來不只是靈感的出現,也不只是工具的操作。
在 AI 快速進入創作現場的今天,我們似乎比過去更容易產出內容。只要輸入一句話,就能得到一段文案、一張圖片、一支影片,甚至一首音樂。工具變得更強,速度變得更快,創作的門檻也被大幅降低。然而,當我們真正開始使用 AI 時,很快會發現一個新的問題:內容可以生成,作品卻不一定成立。 一張好看的圖片,不一定能成為品牌視覺;一段精彩的影片,不一定有清楚的敘事;一首動聽的音樂,如果無法貼合畫面,也只是背景聲音。AI 能夠快速提供素材,但真正讓素材變成作品的,仍然是人的判斷、結構與設計能力。 這正是本書想要處理的核心問題。 《Google AI 創作術:靈感 x 圖像 x 設計 x 音樂 x 影片的工作流》不是一本只介紹單一工具的操作手冊,而是一本幫助讀者建立「完整創作流程」的書。從最初的靈感發想,到圖像生成、風格控制、版面設計、影片敘事、音樂情緒,再到最後的整合輸出,本書希望帶你看見一件事:AI 創作真正的價值,不在於一次生成多少內容,而在於能否把每一步串連成一個可持續、可控制、可完成的工作流。 因此,這本書的起點不是工具,而是思考。在創作開始之前,我們必須先問清楚: ► 我要做什麼? ► 為誰而做? ► 想傳達什麼訊息? ► 希望呈現什麼感覺? 當這些問題被釐清之後,Gemini 不再只是問答工具,而能成為創作的大腦,幫助我們整理主題、建立結構、定義風格,將模糊的想法轉化為可以執行的創作藍圖。 有了藍圖之後,圖像才不再是隨機生成的結果,而是有方向的視覺表達。透過Gemini 與 Nano Banana Pro,讀者可以從第一張圖像開始,進一步理解圖像的用途、情境與控制方式。圖像不只是好看,更要能傳達、吸引、敘事;不只是單張作品,更要能延伸為個人或品牌的視覺資產。 接著,創作會從「畫面」走向「版面」。Stitch 讓我們用文字描述網站與 App 的結構,將圖像與內容放進更清楚的設計框架中。這一步提醒我們,設計不是裝飾,而是資訊被理解的方式。當創作者能夠掌握畫面如何排列、資訊如何被看見,就開始具備產品與介面思維。 再往後,作品需要動起來。Veo 讓畫面成為影片,Flow 則讓影片不只是片段,而是有分鏡、有節奏、有結構的敘事。影片的本質不是「會動的圖片」,而是一段被設計的時間體驗。當你開始思考開場、發展、轉折與結尾時,你就不再只是生成影片,而是在導演一段觀看過程。 最後,聲音讓作品真正被感受。Lyria 使音樂不再只是事後尋找的素材,而是可以被設計的情緒語言。畫面讓人理解內容,音樂讓人進入情緒;當兩者結合,作品才真正完整。透過 Google Vids,影片、音樂與標題被整合在一起,創作也從素材階段,正式走向可觀看、可分享、可發表的成果。 在這條流程中,AI 扮演的不是替代創作者的角色,而是擴展創作者能力的夥伴。它可以幫助我們更快發想、更快嘗試、更快產出,但它無法替我們決定方向、判斷品質、建立風格,也無法替我們理解作品真正想要帶給觀眾的感受。 因此,本書真正想傳達的是: ► AI 時代的創作者,不只是會使用工具的人,而是能夠規劃流程、串接工具、控制結果,並讓作品持續累積價值的人。 如果你曾經覺得 AI 很強,卻不知道如何做出完整作品;如果你曾經生成許多圖片、影片與音樂,卻覺得它們彼此零散;如果你想把靈感變成圖像,把圖像變成設計,把設計變成影片,再讓音樂與情緒完成最後的整合,那麼這本書就是為你而寫。 創作的未來,不只是更快生成,而是更清楚地設計。 願這本書陪你從第一個模糊想法開始,一步一步建立屬於自己的 AI 創作工作流,讓靈感不再停留在腦中,讓素材不再散落各處,讓每一次生成,都能朝著真正的作品前進。 洪錦魁2026/5/10 編號:318/368/500 jiinkwei@me.com
臉書粉絲團 歡迎加入:王者歸來電腦專業圖書系列 歡迎加入:iCoding 程式語言讀書會 歡迎加入:MQTT 與AIoT 整合運用 歡迎加入:深度機器學習線上讀書會
圖書資源說明 本書籍的所有實例可以在深智公司網站下載。 |































