特價 -20%

Google AI 創作術: 靈感 x 圖像 x 設計 x 音樂 x 影片的工作流 DM2645

原始價格:NT$620。目前價格:NT$496。

出版商 深智數位股份有限公司
出版日期 2026年05月26日
語言 繁體中文
頁數 320
ISBN 9786267889305

已售完

貨號: DM2645 Categories: , ,

描述

內容簡介

Google AI 創作術

靈感 x 圖像 x 設計 x 音樂 x 影片的工作流

 

☆★☆從靈感到作品☆★☆

☆★☆一次掌握 Google AI 創作整合流程☆★☆

 

AI 工具越來越多,創作看似變得更簡單。但當你真正開始使用時,可能也會發現:

★生成圖片很容易,做出一致風格很難。

★生成影片很快速,做出完整敘事很難。

★生成音樂很新鮮,但讓聲音與畫面真正搭配很難。

 

問題不在工具不夠強,而在於你還沒有一套清楚的創作工作流。

 

Google AI 創作術:靈感 x 圖像 x 設計 x 音樂 x 影片的工作流》帶你從創作的最前端開始,先用 Gemini 釐清主題、受眾、風格與文案結構,再進一步將想法轉換為圖像、設計、影片與音樂,最後整合成可以發表的完整作品。

 

本書不是把工具一個一個分開介紹,而是把它們串成一條真正可執行的創作流程。你將學會:

 

◎ 用 Gemini 把想法變成創作藍圖

在動手生成之前,先釐清主題、方向、風格與內容結構,讓創作不再只是反覆試錯。

 

◎ 用 Nano Banana Pro 讓圖像從好看變成好用

從第一張圖片開始,進一步掌握風格控制、局部編修、角色一致性與多圖融合,讓圖像成為可延伸的視覺資產。

 

◎ 用 Stitch 把圖像與內容變成版面設計

學會用文字描述網站與 App 版型,快速建立網頁、介面與互動原型。

 

◎ 用 Veo 與 Flow 讓畫面變成有節奏的影片

從文字生成影片、圖片延伸影片,到分鏡設計、多段影片串接與流程控制,建立真正的影片敘事能力。

 

◎ 用 Lyria 為作品設計聲音與情緒

從文字、圖像與影片生成音樂,讓聲音不再只是背景,而是作品情緒的一部分。

 

◎ 用 Google Vids 完成最後整合輸出

把影片、音樂、標題與內容整合起來,讓素材成為可以觀看、分享與發表的作品。

 

◎ 這本書適合

想用 AI 創作圖像、影片與音樂的內容創作者。

想建立個人品牌視覺的講師、作者、設計師與行銷人。

想學會 Google AI 工具整合應用的初學者。

想把靈感變成作品,而不只是產生零散素材的創作者。

 

AI 時代的創作者,不只是會使用工具的人,而是能夠規劃流程、控制結果、完成作品的人

從一個想法開始,

把靈感變成圖像,

把圖像變成設計,

把設計變成影片,

再用音樂完成情緒。

這就是 Google AI 創作術。

 

作者簡介

洪錦魁

畢業於明志工專(現今明志科技大學),跳級留學美國University of Mississippi計算機系研究所。

2023~2025年連續3年獲選博客來「年度十大華文作家」,多年來唯一獲選的電腦書籍作者。也是一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家,下列是他在各時期的代表作品。

DOS時代:「IBM PC組合語言、Basic、C、C++、Pascal、資料結構」。

Windows時代:「Windows Programming 使用C、Visual Basic」。

Internet時代:「網頁設計使用HTML」。

大數據時代:「R 語言邁向Big Data之路、Python王者歸來」。

AI時代:「機器學習數學、微積分 + Python實作」、「AI視覺、AI之眼」。

通用AI時代:「ChatGPT、Gemini、Copilot、無料AI、AI職場、AI行銷、AI影片、AI賺錢術、NotebookLM - 打造AI『第二大腦』」。

Vibe Coding 時代:「寫程式的 AI 戰友、Vibe Coding - ChatGPT x Codex」。

國內第 1 本「多模態 AI - ChatGPT 5」、「Nano Banana 藝術宇宙」作者。

國內第 1 本「AI 健康養生長壽書」、「AI 思維 – 原子習慣」作者。

作品曾被翻譯為簡體中文、馬來西亞文,英文,近年來作品則是在北京清華大學台灣深智同步發行。

他的多本著作皆曾登上天瓏、博客來、Momo電腦書類,不同時期暢銷排行榜第1 名,他的著作特色是,所有程式語法或是功能解說會依特性分類,同時以實用的程式範例做說明,不賣弄學問,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。

 

目錄

1 章 創作的起點 - Gemini 建立創作藍圖

1-1 為什麼多數人做不出作品

1-1-1 沒有主題:不知道自己要做什麼

1-1-2 沒有風格:產出無法保持一致

1-1-3 沒有結構:內容零散,難以發展

1-2 Gemini:你的創作大腦

1-3 Gemini 規劃創作文案

1-3-1 從主題開始(Idea)

1-3-2 建立文案結構(Structure)

1-3-3 定義風格與情緒(Direction)

1-3-4 Gemini 生成給AI 繪圖工具的Prompt

1-4 創作藍圖的價值(為什麼要先想清楚)

1-4-1 沒有藍圖的創作:反覆生成

1-4-2 有藍圖的創作:穩定產出

1-4-3 藍圖讓創作變簡單

 

2 章 快速生成圖像 - Gemini 建立第一張作品

2-1 為什麼從 Gemini 的「建立圖像」開始

2-2 Gemini 建立圖像(基本操作)

2-2-1 理解圖像風格(選擇的基礎)

2-2-2 圖像生成的兩個關鍵問題

2-2-3 建立圖像的基本流程(實際操作)

2-2-4 生成結果的基本判斷

2-3 從創作藍圖到圖像(關鍵轉換)

2-3-1 將藍圖轉換為圖像描述

2-3-2 圖像結果的問題分析與修正(讓畫面更精準)

2-4 從生成到創作

 

3 章 讓圖變有用- 情境化圖像創作與Prompt 設計

3-1 圖像不是作品,而是「用途」

3-2 傳達型圖像創作 - 讓人看懂

3-2-1 書內插圖 - 概念轉具體

3-2-2 教學圖解 - 流程與步驟

3-2-3 資訊圖 - 整體理解

3-2-4 心智圖 - 結構化思考

3-3 吸引型圖像創作 - 讓人停下來

3-3-1 書籍封面 - 建立第一印象

3-3-2 行銷海報 - 快速抓住注意

3-3-3 社群貼文 - 建立情緒與互動

3-3-4 網頁 Banner - 引導視線與行動

3-4 敘事型圖像創作 - 讓人記住

3-4-1 漫畫 - 用角色呈現概念

3-4-2 情境插圖 - 讓讀者進入畫面

3-4-3 教學故事圖 - 呈現過程與轉變

3-4-4 品牌角色視覺 - 建立記憶與辨識

 

4 章 進階圖像創作 - 風格x 編修x 控制

4-1 圖像創作的進階關鍵 - 從生成到控制

4-1-1 為什麼「生成」不等於「創作」

4-1-2 Nano Banana Pro - 圖像控制引擎與三大核心能力

4-2 風格控制 - 決定圖像的方向

4-2-1 三大常見風格 - 快速分類

4-2-2 風格是策略,不是裝飾

4-2-3 風格穩定的關鍵

4-2-4 風格可以被轉換

4-3 Image-to-Image - 圖像創作的核心能力

4-3-1 什麼是 Image-to-Image,從「重來」到「延續」

4-3-2 局部修改 - 精準調整,而不是全部重來

4-3-3 角色一致性 - 讓同一人物持續存在

4-3-4 多圖融合 - 從單一素材到創意組合

4-4 世界知識加成 - AI 隱藏能力

 

5 章 圖像策略 - 建立個人與品牌視覺

5-1 圖像的價值升級 - 從作品到品牌

5-1-1 為什麼單張圖片沒有長期價值

5-1-2 什麼是「視覺資產」

5-1-3 品牌視覺的核心概念

5-2 視覺一致性設計 - 建立你的圖像語言

5-2-1 一致性的三大元素 - 色彩 x 風格 x 構圖

5-2-2 如何用 AI 維持一致性 - 從設定到延續

5-3 AI 品牌風格建立 - 從個人到系統

5-3-1 什麼是 AI 品牌風格

5-3-2 建立你的風格 Prompt - 從描述到標準化

5-3-3 角色與視覺 IP 建立 - 讓圖像被記住

5-4 應用實戰 - 社群 x 書封 x 廣告圖

5-4-1 社群圖像 - 吸引注意與建立互動

5-4-2 書封設計 - 建立第一印象與品牌識別

5-4-3 廣告與 Banner - 引導視線與促進行動

5-4-4 多版本輸出 - 一套素材,延伸多種應用

5-5 本章小結 - 從圖像到品牌

 

6 章 AI 版面設計 - Stitch

6-1 進入Google Stitch

6-1-1 應用程式或網頁

6-1-2 運作模式

6-1-3 Start Live Mode(Preview)

6-1-4 附加內容

6-2 Stitch 設計網頁版型

6-2-1 設計個人品牌 / 專家網站(Personal Branding)

6-2-2 上傳圖像與編輯圖像

6-2-3 將網頁文字改成中文

6-2-4 編輯文字

6-2-5 Stitch 主工具列

6-2-5 查看程式碼

6-2-6 建立新專案

6-2-7 課程學習平台/ 產品介紹頁 - 網站設計實例

6-3 Stitch 設計多頁式 App - 從畫面到互動流程

6-3-1 設計「多頁式AI 學習平台App」

6-3-2 請將英文版App 轉成中文

6-3-3 連結與預覽即時原型

6-4 Stitch 設計流程回顧 - 從版型設計走向原型思維

 

7 章 AI 影片創作核心 - Veo 模型

7-1 影片的本質 - 為什麼「影片 = 敘事」

7-1-1 從圖片到影片的差別

7-1-2 影片的三個核心元素

7-1-3 AI 影片創作的關鍵轉換

7-2 Veo 模型概念 - 能力與限制

7-2-1 Veo 的核心能力

7-2-2 Veo 的限制

7-2-3 最佳使用情境

7-3 Text Video:從文字生成影片

7-3-1 進入Gemini 的影片創作環境

7-3-2 Text → Video 的基本 Prompt 結構

7-3-3 實例示範 - 從描述到影片生成

7-4 Image Video:從圖片延伸影片

7-4-1 為什麼 Image → Video 很重要

7-4-2 實例示範 - 讓圖片產生「自然動態」

7-5 從畫面生成到影片敘事

 

8 章 影片流程控制 - Flow 與結構設計

8-1 Flow 是什麼:從生成到流程的轉變

8-1-1 為什麼單一影片生成不夠用

8-1-2 Flow 的核心概念:影片是流程,不是結果

8-1-3 Flow 在創作流程中的位置

8-2 分鏡(Storyboard): AI 影片的關鍵能力

8-2-1 什麼是分鏡(Storyboard)

8-2-2 如何設計一段影片的分鏡結構

8-2-3 從文字到分鏡的轉換技巧

8-3 多段影片生成與串接

8-3-1 建立多個影片片段

8-3-2 影片串接與順序控制

8-3-3 風格一致性的維持技巧

8-4 Flow 創作設計:完整影片案例

8-4-1 主題設定與創意發想 - 實戰案例:奈米香蕉人

8-4-2 分鏡設計與腳本建立

8-4-3 影片生成與 Flow 組裝 - 4 段 Prompt 完整實作

8-5 Flow 實作:奈米香蕉人

8-5-1 進入Flow

8-5-2 建立第一張場景圖片

8-5-3 建立Scene 1 - 角色登場

8-5-4 建立Scene 2 – 能力展現

8-5-5 建立Scene 3 – 生活互動

8-5-6 建立Scene 4 – 成果展示

8-5-7 故事延伸與調整

8-6 延伸創作方向:讀者可發展的主題

 

9 章 AI 音樂與情緒設計 - Lyria 與聲音創作

9-1 為什麼創作需要「聲音與音樂」

9-1-1 聲音如何改變觀眾的感受

9-1-2 沒有音樂的作品為什麼不完整

9-1-3 聲音在創作流程中的位置

9-2 Lyria 是什麼:從使用音樂到創作音樂

9-2-1 Lyria 的核心能力與定位

9-2-2 音樂生成的基本邏輯

9-2-3 Lyria 的使用情境與創作限制

9-3 Gemini 創作音樂環境

9-3-1 進入Gemini 創作音樂環境

9-3-2 Gemini「創作音樂」環境中的音樂圖片功能說明

9-3-3 音樂風格圖片的使用策略:從自由生成到精準控制

9-4 從文字生成音樂(Text Music

9-4-1 音樂 Prompt 的基本結構(音樂 x 歌曲雙應用)

9-4-2 範例實作:不同情境的音樂與歌曲生成

9-5 從圖像生成音樂(Image Music

9-5-1 圖像如何被轉換為音樂

9-5-2 範例實作:同一角色,不同場景的音樂設計

9-5-3 風格一致性的維持技巧(從畫面到聲音)

9-6 影片配樂設計:從分析到音樂生成

9-6-1 用 Gemini 分析影片情緒

9-6-2 從影片分析轉為音樂 Prompt(奈米香蕉人實戰)

9-6-3 直接以影片生成音樂(快速模式與精準模式的取捨)

9-7 音樂風格與情緒控制(讓聲音成為創作能力)

9-7-1 常見音樂風格分類(建立創作語言)

9-7-2 情緒控制三大元素(節奏 x 音色 x 強弱)

9-7-3 建立「聲音風格」(從創作到品牌)

 

10 章 影片與音樂整合 - Google Vids 應用

10-1 Google Vids 是什麼

10-1-1 為什麼說它是「實驗性工具」

10-1-2 核心功能(本章會用到的部分)

10-1-3 與傳統剪輯工具的差異

10-1-4 小結

10-2 進入Google Vids 工作環境

10-3 上傳影片

10-4 影片嵌入音訊

10-5 建立影片標題

10-6 儲存與下載影片

 

「創作」,從來不只是靈感的出現,也不只是工具的操作。

在 AI 快速進入創作現場的今天,我們似乎比過去更容易產出內容。只要輸入一句話,就能得到一段文案、一張圖片、一支影片,甚至一首音樂。工具變得更強,速度變得更快,創作的門檻也被大幅降低。然而,當我們真正開始使用 AI 時,很快會發現一個新的問題:內容可以生成,作品卻不一定成立

一張好看的圖片,不一定能成為品牌視覺;一段精彩的影片,不一定有清楚的敘事;一首動聽的音樂,如果無法貼合畫面,也只是背景聲音。AI 能夠快速提供素材,但真正讓素材變成作品的,仍然是人的判斷、結構與設計能力。

這正是本書想要處理的核心問題

《Google AI 創作術:靈感 x 圖像 x 設計 x 音樂 x 影片的工作流》不是一本只介紹單一工具的操作手冊,而是一本幫助讀者建立「完整創作流程」的書。從最初的靈感發想,到圖像生成、風格控制、版面設計、影片敘事、音樂情緒,再到最後的整合輸出,本書希望帶你看見一件事:AI 創作真正的價值,不在於一次生成多少內容,而在於能否把每一步串連成一個可持續、可控制、可完成的工作流。

因此,這本書的起點不是工具,而是思考。在創作開始之前,我們必須先問清楚:

► 我要做什麼?

► 為誰而做?

► 想傳達什麼訊息?

► 希望呈現什麼感覺?

當這些問題被釐清之後,Gemini 不再只是問答工具,而能成為創作的大腦,幫助我們整理主題、建立結構、定義風格,將模糊的想法轉化為可以執行的創作藍圖。

有了藍圖之後,圖像才不再是隨機生成的結果,而是有方向的視覺表達。透過Gemini 與 Nano Banana Pro,讀者可以從第一張圖像開始,進一步理解圖像的用途、情境與控制方式。圖像不只是好看,更要能傳達、吸引、敘事;不只是單張作品,更要能延伸為個人或品牌的視覺資產。

接著,創作會從「畫面」走向「版面」。Stitch 讓我們用文字描述網站與 App 的結構,將圖像與內容放進更清楚的設計框架中。這一步提醒我們,設計不是裝飾,而是資訊被理解的方式。當創作者能夠掌握畫面如何排列、資訊如何被看見,就開始具備產品與介面思維。

再往後,作品需要動起來。Veo 讓畫面成為影片,Flow 則讓影片不只是片段,而是有分鏡、有節奏、有結構的敘事。影片的本質不是「會動的圖片」,而是一段被設計的時間體驗。當你開始思考開場、發展、轉折與結尾時,你就不再只是生成影片,而是在導演一段觀看過程。

最後,聲音讓作品真正被感受。Lyria 使音樂不再只是事後尋找的素材,而是可以被設計的情緒語言。畫面讓人理解內容,音樂讓人進入情緒;當兩者結合,作品才真正完整。透過 Google Vids,影片、音樂與標題被整合在一起,創作也從素材階段,正式走向可觀看、可分享、可發表的成果。

在這條流程中,AI 扮演的不是替代創作者的角色,而是擴展創作者能力的夥伴。它可以幫助我們更快發想、更快嘗試、更快產出,但它無法替我們決定方向、判斷品質、建立風格,也無法替我們理解作品真正想要帶給觀眾的感受。

因此,本書真正想傳達的是:

AI 時代的創作者,不只是會使用工具的人,而是能夠規劃流程、串接工具、控制結果,並讓作品持續累積價值的人。

如果你曾經覺得 AI 很強,卻不知道如何做出完整作品;如果你曾經生成許多圖片、影片與音樂,卻覺得它們彼此零散;如果你想把靈感變成圖像,把圖像變成設計,把設計變成影片,再讓音樂與情緒完成最後的整合,那麼這本書就是為你而寫。

創作的未來,不只是更快生成,而是更清楚地設計。

願這本書陪你從第一個模糊想法開始,一步一步建立屬於自己的 AI 創作工作流,讓靈感不再停留在腦中,讓素材不再散落各處,讓每一次生成,都能朝著真正的作品前進。

洪錦魁2026/5/10

編號:318/368/500

jiinkwei@me.com

 

臉書粉絲團

歡迎加入:王者歸來電腦專業圖書系列

歡迎加入:iCoding 程式語言讀書會

歡迎加入:MQTT 與AIoT 整合運用

歡迎加入:深度機器學習線上讀書會

 

圖書資源說明

本書籍的所有實例可以在深智公司網站下載。

額外資訊

出版商

深智數位股份有限公司

出版日期

2026年05月26日

語言

繁體中文

頁數

320

ISBN

9786267889305