描述

內容簡介

AI之眼

Name: AI之眼 - 幻影操控、變臉、唇語、美妝、手勢、肢體、表情偵測、人臉辨識 Python創意實戰 DM2522
SKU: DM2522
Availability: InStock

幻影操控、變臉、唇語、美妝、手勢、肢體

表情偵測、人臉辨識

Python創意實戰

本書內容

《AI之眼》—— AI視覺時代的必讀指南！

🔹 幻影操控 × AI變臉 × 人臉識別 × 手勢追蹤 🔹

📸 解鎖 AI 影像技術 × Python打造 AI 創意應用！

「AI變臉、表情分析、手勢追蹤，不只是電影特效，而是你的創作工具！」

還記得《Mission Impossible》中，湯姆克魯斯隔空拖曳螢幕、變換身份的畫面嗎？現在，你也可以用 Python程式，打造自己的「幻影操控」系統！

📖 本書特色

✅ 幻影操控：實作電影級互動技術。

✅ 變臉 & 美妝濾鏡：Face Mesh 解析變臉奧秘。

✅ 手勢追蹤 & 肢體識別：MediaPipe Hands、Pose 打造未來人機互動。

✅ 人臉辨識 & 門禁系統：DeepFace實作，從安全監控到 AI 互動應用。

✅ 疲勞駕駛偵測 & 表情分析：AI 深度學習技術落地應用。

📖 翻開本書，你將學到

🔹 從零開始，打造 AI 影像處理專案。

🔹 MediaPipe、DeepFace、Dlib、OpenCV 等強大Python模組的完整實戰。

🔹 結合影像識別，創造安全監控、門禁系統、虛擬濾鏡、手勢密碼等創新應用。

🎯 適合誰閱讀

✔ AI 與 Python 開發者 —— 想要動手打造 AI 影像應用的人。

✔ 視覺創意工作者 —— 想探索 AI 美妝、變臉、濾鏡等新技術。

✔ 學生、研究者 —— 對 AI 影像處理充滿好奇，想親自實作。

作者簡介

洪錦魁

2023年和2024年連續2年獲選博客來10大暢銷華文作家，多年來唯一電腦書籍作者獲選，也是一位跨越電腦作業系統與科技時代的電腦專家，著作等身的作家，下列是他在各時期的代表作品。

◇ DOS 時代：「IBM PC 組合語言、Basic、C、C++、Pascal、資料結構」。

◇ Windows 時代：「Windows Programming 使用 C、Visual Basic」。

◇ Internet 時代：「網頁設計使用 HTML」。

◇ 大數據時代：「R 語言邁向 Big Data 之路」。

◇ AI 時代：「機器學習 Python 實作、AI視覺」。

◇ 通用AI時代：「ChatGPT、Copilot、無料AI、AI(職場、行銷、影片、賺錢術)」。

作品曾被翻譯為簡體中文、馬來西亞文，英文，近年來作品則是在北京清華大學和台灣深智同步發行：

1：C、Java、Python、C#、R 最強入門邁向頂尖高手之路王者歸來

2：Python 網路爬蟲/ 影像創意/ 演算法邏輯思維/ 資料視覺化 - 王者歸來

3：網頁設計HTML+CSS+JavaScript+jQuery+Bootstrap+Google Maps 王者歸來

4：機器學習基礎數學、微積分、真實數據、專題Python實作王者歸來

5：Excel 完整學習、Excel 函數庫、AI 助攻學Excel VBA 應用王者歸來

6：Python x AI 辦公室自動化之路

7：Power BI 最強入門 – AI 視覺化+ 智慧決策+ 雲端分享王者歸來

8：無料AI、AI 職場、AI 行銷、AI 繪圖、AI 創意影片的作者

他的多本著作皆曾登上天瓏、博客來、Momo 電腦書類，不同時期暢銷排行榜第1 名，他的著作特色是，所有程式語法或是功能解說會依特性分類，同時以實用的程式範例做說明，不賣弄學問，讓整本書淺顯易懂，讀者可以由他的著作事半功倍輕鬆掌握相關知識。

第1章　認識MediaPipe

▌1-1 MediaPipe 是什麼？概念與應用

1-1-1 MediaPipe 的背景與起源

1-1-2 MediaPipe 的核心架構

1-1-3 MediaPipe 在 Python 上的應用優勢

1-1-4 安裝MediaPipe

1-1-5 如何升級或降級MediaPipe 版本

▌1-2 主要應用領域與實際案例

▌1-3 MediaPipe 的程式核心Calculator 和Graph

▌1-4 驗證是否可以正確使用MediaPipe 模組

1-4-1 MediaPipe 的「Hello, world!」程式測試

1-4-2 Calculator 和 Graph 解釋人臉偵測程式

1-4-3 影片讀取與人臉偵測

1-4-4 無限迴圈播放影片

第2章　掌握影像輸入 - 攝影機與影片的運用

▌2-1 取得影像來源（Webcam / 影片檔）

2-1-1 Webcam（即時攝影機）

2-1-2 影片檔案

2-1-3 儲存影片檔案

▌2-2 更改影像大小

2-2-1 攝影機的輸出解析度（Frame Capture Size）

2-2-2 程式中顯示視窗的大小（Window Display Size）

第3章　人臉偵測

▌3-1 人臉偵測的意義與應用範圍

3-1-1 基礎定位功能

3-1-2 各式應用情境

3-1-3 核心地位

3-1-4 章節範圍與進階議題的預告

▌3-2 MediaPipe Face Detection 基本流程

3-2-1 建立模組物件

3-2-2 認識FaceDetection( ) 函數

3-2-3 函數初始化與主要參數

3-2-4 取得人臉 Bounding Box 與基礎關鍵點

3-2-5 process( ) 的輸入要求

3-2-6 未偵測到人臉

3-2-7 With 關鍵字的應用

▌3-3 註解人臉位置與關鍵點數據

3-3-1 中文註解人臉位置與關鍵點數據

3-3-2 手工繪製人臉框和關鍵點

▌3-4 MediaPipe 輔助繪圖模組

3-4-1 drawing_utils 輔助繪圖基礎觀念

3-4-2 draw_detection( ) 函數

3-4-3 自訂顏色、大小、粗細 - DrawSpec( )

▌3-5 多人照片人臉偵測

3-5-1 多人照片人臉測試基礎

3-5-2 處理無法偵測到全部人臉的問題

3-5-3 偵測更多臉的實作

3-5-4 人臉編號與信心分數

3-5-5 MediaPipe 未說明的機制

▌3-6 多人影片人臉偵測

▌3-7 多人即時攝影機人臉偵測

第4章　語音輸出與人臉偵測專題

▌4-1 語音輸出 – 離線模組pyttsx3

4-1-1 pyttsx3 的特點

4-1-2 基本用法

4-1-3 語音引擎屬性設定

▌4-2 人臉偵測的應用

▌4-3 安全監控

▌4-4 新聞報導人臉馬賽克

4-4-1 圖像馬賽克原理

4-4-2 設計新聞報導時的人臉馬賽克系統

▌4-5 智慧型攝影對焦

4-5-1 圖像亮度調整原理

4-5-2 圖片人臉亮度調整

4-5-3 智慧型攝影對焦 – 整體畫面調整

4-5-4 智慧型攝影對焦 – 臉部畫面調整

第5章　人臉關鍵點偵測 - 68 點模型

▌5-1 緣起與背景

5-1-1 人臉偵測與關鍵點在電腦視覺中的地位

5-1-2 從人臉偵測到關鍵點定位的演進

▌5-2 68點模型概述

5-2-1 模型來源與資料庫

5-2-2 68 個關鍵點的位置分佈

5-2-3 模型優點與限制

5-2-4 為何選擇 68 點模型

▌5-3 Dlib 模組 - 人臉偵測基礎

5-3-1 初始化人臉偵測器

5-3-2 get_frontal_face_detector( )的核心技術

5-3-3 解析detector

▌5-4 Dlib 68 點人臉關鍵點偵測

5-4-1 dlib.shape_predictor( ) 的基本概念

5-4-2 解析predictor

5-4-3 標記人臉68 個關鍵點

▌5-5 人臉對齊

5-5-1 演算法硬功夫處理人臉對齊

5-5-2 應用場景

▌5-6 多人臉的偵測

5-6-1 多人臉與關鍵點的偵測

5-6-2 多人臉68 點關鍵點容器

5-6-3 多張人臉對齊實作

▌5-7 AI 貼圖(AI Stickers)

5-7-1 什麼是 AI 貼圖 (AI Stickers) ？

5-7-2 AI 貼圖的技術核心6

5-7-3 愛心圖片貼到雙眼的實例

5-7-4 AI貼圖的應用場景

第6章　疲勞駕駛與表情識別

▌6-1 疲勞駕駛偵測

6-1-1 疲勞駕駛的主要偵測方法

6-1-2 眼睛開合比 (Eye Aspect Ratio, EAR)

6-1-3 嘴巴開合程度偵測 (Mouth Aspect Ratio, MAR)

6-1-4 疲勞駕駛偵測實作

▌6-2 人臉表情識別系統

6-2-1 相關表情關鍵點解析

6-2-2 6大主要情緒對應表

第7章　AI 變臉

▌7-1 AI 變臉 – 演算法原理

▌7-2 變臉程式設計

7-2-1 程式設計

7-2-2 主程式分析

▌7-3 程式重點函數分析

7-3-1 三角剖分 (delaunay_triangulation)

7-3-2 三角形仿射貼合(Triangle Affine Warp)

7-3-3 膚色高斯化校正(color_transfer_gaussian)

▌7-4 圖像貼合的羽化遮罩處理

7-4-1 圖像貼合不自然的銜接

7-4-2 Feathering（羽化）的原理

第8章　MediaPipe Face Mesh 高精度468點人臉識別技術解析

▌8-1 為什麼需要 Face Mesh？

8-1-1 基礎觀念

8-1-2 傳統人臉框與68 點模型的限制

8-1-3 與 Face Mesh 的對比

▌8-2 MediaPipe Face Mesh 介紹

8-2-1 即時處理、高效能與易整合特點

8-2-2 468 點模型的全域概念

▌8-3 認識臉部468 點

8-3-1 高密度人臉關鍵點概述

8-3-2 468 點定位分佈

▌8-4 MediaPipe Face Mesh 模組

8-4-1 建立模組物件

8-4-2 檢測影像與回傳數據

8-4-3 硬功夫繪製468 點數據

▌8-5 繪製臉部網格

8-5-1 繪製臉部關鍵點

8-5-2 繪製臉部網格

8-5-3 繪製臉部關鍵部位連線

8-5-4 用錄影機偵測臉部關鍵點

▌8-6 展示468 點所在關鍵臉部區域的索引點

8-6-1 認識臉部關鍵連線的數據結構

8-6-2 輸出關鍵區域的索引點和像素位置

第9章　Face Mesh 的創意應用

▌9-1 Face Mesh 的可能應用

▌9-2 彩妝的應用

▌9-3 人臉趣味變形 - 向右伸長的嘴角

▌9-4 唇語動畫設計

第10章　 MediaPipe Hands 手勢偵測

▌10-1 初探 MediaPipe Hands 模組

10-1-1 MediaPipe Hands 功能概覽

10-1-2 21 個關鍵點的座標定義與排列

10-1-3 如何判斷手勢

▌10-2 偵測手語繪製關節

10-2-1 初始化MediaPipe Hands 物件

10-2-2 hands.process( ) 函數用法

10-2-3 mp_drawing.draw_landmarks( )函數用法

10-2-4 手部點樣式

10-2-5 手部點連線樣式

10-2-6 攝影機偵測應用

▌10-3 專題實作 - 剪刀、石頭與布

第11章　AI 幻影操控

▌11-1 MediaPipe Hands 的應用領域

11-1-1 手勢控制 (Gesture Control)

11-1-2 擴增實境 (AR) / 虛擬實境 (VR)

11-1-3 視訊 / 直播互動

11-1-4 AI 虛擬人物 (AI Avatars)

11-1-5 醫療 & 康復 (Medical & Rehabilitation)

11-1-6 企業 & AI 自動化

▌11-2 判斷 OK 手勢

11-2-1 判斷邏輯

11-2-2 程式實作

▌11-3 OK 手勢計時器

11-3-1 設計邏輯

11-3-2 程式實作

▌11-4 手勢幻影操控

11-4-1 設計邏輯

11-3-2 程式實作

第12章　AI 人體姿勢偵測 - MediaPipe Pose

▌12-1 認識MediaPipe Pose

12-1-1 Pose 的特點

12-1-2 Pose ( 人體姿勢偵測) vs FaceMesh( 臉部網格)

12-1-3 Pose ( 人體姿勢偵測) vs Hands( 手部偵測)

▌12-2 33個關鍵點詳細解說

12-2-1 Pose 的33 個關鍵點

12-2-2 MediaPipe Pose 只偵測 11 個頭部點

▌12-3 MediaPipe Pose 模組

12-3-1 建立模組物件

12-3-2 實作偵測圖像的人體

12-3-3 標記人體33 個關鍵點

▌12-4 繪製人體骨架

12-4-1 預設環境繪製人體骨架

12-4-2 官方推薦預設繪製關鍵點樣式

12-4-3 自訂繪製格式

12-4-4 多元connections 的應用

▌12-5 攝影機錄製人體骨架

▌12-6 AI 人體動作分析 - 座標、距離與角度計算

12-6-1 座標計算

12-6-2 關鍵點的列舉常數

12-6-3 計算關鍵點之間的距離

12-6-4 計算關鍵點的角度

▌12-7 伏地挺身與深蹲中

12-7-1 關鍵點角度的應用範圍

12-7-2 偵測「伏地挺身中」或「深蹲中」

第13章　AI 靜態圖像與攝影背景去除

▌13-1 為何需要背景去除？

13-1-1 背景去除的概念

13-1-2 背景去除的關鍵應用場景

13-1-3 背景去除對 AI 偵測的影響

13-1-4 背景去除的技術選擇

▌13-2 使用 MediaPipe Selfie Segmentation進行背景去除

13-2-1 什麼是 MediaPipe Selfie Segmentation?

13-2-2 Selfie Segmentation 的運作原理

▌13-3 MediaPipe Selfie Segmentation 模組

13-3-1 建立模組物件

13-3-2 process( ) 方法處理影像

13-3-3 認識回傳值segmentation_mask – 遮罩結構

13-3-4 轉換遮罩為灰階影像

▌13-4 圖像背景去除實作

13-4-1 設計黑色和白色背景

13-4-2 建立背景是高斯模糊

13-4-3 圖片取代背景

▌13-5 智慧攝影機背景處理

▌13-6 AI 背景的創意應用

第14章　AI 全身偵測 – Holistic

▌14-1 Holistic 簡介

14-1-1 什麼是 Holistic 識別？

14-1-2 關鍵點檢測的範圍（臉部、手部、姿態）

14-1-3 Holistic 與其他 MediaPipe 模組的差異說明

▌14-2 架構與資料輸出

14-2-1 Holistic 識別的流程

14-2-2 關鍵點資料的結構

14-2-3 姿態、手勢、臉部數據的組合

▌14-3 MediaPipe Holistic 模組

14-3-1 建立模組物件

14-3-2 處理影像並取得結果results

▌14-4 AI 全身動作偵測與視覺化

14-4-1 基本預設繪製全身關鍵點

14-4-2 官方推薦標準樣式繪製全身關鍵點

14-4-3 繪製全身關鍵點 – 去背與背景是影片

▌14-5 Holistic 全身偵測的創意應用

14-5-1 創意應用

14-5-2 AI 健身教練 - 深蹲計數器

第15章　 DeepFace 人臉辨識 設計門禁系統

▌15-1 DeepFace 簡介

15-1-1 什麼是 DeepFace ？

15-1-2 DeepFace 與一般人臉識別的差異

15-1-3 DeepFace 在 AI 和計算機視覺中的重要性

▌15-2 預訓練模型下載檔案

15-2-1 比較DeepFace 與MediaPipe 模組

15-2-2 預訓練模型下載

▌15-3 使用 DeepFace 進行人臉分析

15-3-1 使用 DeepFace 進行人臉分析

15-3-2 年齡預測

15-3-3 性別預測

15-3-4 情緒分析

15-3-5 種族預測

▌15-4 DeepFace 的人臉辨識技術基礎

15-4-1 深度學習與卷積神經網路在DeepFace的應用

15-4-2 人臉辨識的主要步驟

▌15-5 人臉辨識實作

15-5-1 基礎實例

15-5-2 認識DeepFace 支援的深度學習模型

▌15-6 設計企業門禁系統

15-6-1 建立人臉數據庫 -（ Embedding 存儲）

15-6-2 將人臉與數據庫特徵向量比對

15-6-3 門禁系統設計

序

2025 年2 月，筆者撰寫並出版了《AI 視覺 - 最強入門邁向頂尖高手之路》。雖然全書涵蓋32 個章節、832 頁的豐富內容，但筆者仍覺得難以充分展現AI 視覺的多元應用。尤其在AI 繪圖技術崛起後，「變臉、唇語、美妝、濾鏡⋯⋯」等功能已成為人們唾手可得的熱門工具，這股新潮流也進一步激發了筆者對其底層程式設計原理的好奇。正因如此，筆者決定撰寫這本應用書籍，嘗試揭開這些AI 工具的潘朵拉之盒。

在《Mission Impossible》電影中，觀眾曾見到湯姆克魯斯隔空拖曳螢幕、展現幻影操控的科幻場景。本書將透過程式實作與詳盡解析，帶領讀者一同探索並實現類似的應用，使「幻影操控」不再只是電影特效，而是日常中可以實際體驗的創新技術。

在近年來，人工智慧在影像處理與電腦視覺領域的應用可說是突飛猛進。隨著硬體效能的提升，以及Python、OpenCV、MediaPipe、Dlib、DeepFace 等工具與套件的日趨成熟，越來越多開發者開始嘗試將人臉偵測、表情識別、手勢追蹤等技術實際應用到各種場景之中。此時，本書《AI 之眼 - 幻影操控、變臉、唇語、美妝、手勢、肢體、表情偵測、人臉辨識 Python 創意實戰》正好提供了一個深度學習、動手實作的機會，

讓你全方位體驗這些尖端技術的魅力。

全書共分為十五章，內容環環相扣，步步深入。從最初的環境配置與基礎知識，到後續涵蓋人臉、手勢與肢體偵測，再一路帶領讀者體驗AI 變臉、表情偵測、美妝濾鏡、門禁系統設計等創意應用。以下簡要說明各章節精華，讓你在正式展開閱讀前，先一覽本書的全貌。

第1 章至第2 章，先從MediaPipe 的基礎原理與介面介紹著手，接著進一步掌握如何取得攝影機與影片的影像輸入。這一部分不僅為後續的實作奠定扎實基礎，也讓讀者能熟悉開發過程中所需的技術環境。

第3 章與第4 章，聚焦在最實用的人臉偵測技術。透過人臉偵測的原理介紹以及初步專題實作，讀者將會看到如何將語音輸出與人臉偵測結合，創造出更具互動性的應用。

第5 章與第6 章，進一步介紹人臉關鍵點偵測與表情辨識，這也是許多人臉應用的核心。無論是疲勞駕駛警示、情緒識別或是未來的智慧安全系統，都能透過這些技術加以實現或優化。

第7 章談到「AI 變臉」，是近年來相當火紅的創意應用。讀者可透過本章，了解如何使用深度學習與人臉關鍵點技術，做到擬真且自然的臉部替換效果。隨後在第8章與第9 章，引領大家探索MediaPipe Face Mesh 468 點高精度的人臉網格偵測技術，並進一步探討如何利用這些細膩的人臉資訊，開發更多驚奇有趣的效果。

第10 章與第11 章，則專注在MediaPipe Hands 的手勢偵測，並帶領讀者理解與應用手部關鍵點資訊。結合先前的影像處理與多媒體互動技術，讀者可以嘗試開發出手勢控制遊戲、手勢密碼解鎖等更廣泛的應用。

第12 章與第13 章，將視野擴大到全身偵測與背景去除。不論是人體姿勢偵測或背景替換，都將為讀者開啟更多創作可能。例如虛擬攝影棚、健身動作矯正、虛實整合的動態影片等。

第14 章則進一步延伸到MediaPipe Holis􀆟c，同時偵測人臉、手勢與身體姿勢，將所有關鍵點資訊一次掌握，真正展現出多模態AI 的強大。此時，讀者不只可實現基礎的追蹤系統，更能邁向更高層次的整合式應用。

最後在第15 章，介紹了DeepFace 的人臉辨識技術，並將前面所學融會貫通，設計出結合門禁系統的人臉識別應用。從此，你將能進一步瞭解如何使用AI 驅動實際的安全與辨識服務，切實落實各種可能的商業模式或專案需求。

本書的目標並不僅止於教讀者「怎麼做」，更希望能啟發你「能怎麼用」。隨著每一章的遞進，我們同時也希望你能從中感受到科技與創意的火花，並擴散至你日後的各項專案中。無論你是初學者，或者已經在AI 與電腦視覺領域有一定的基礎，相信本書都能帶給你不同層次的啟發與應用靈感。

願這本能成為你AI 影像技術道路上的良伴，助你激發更多跨領域的創新思維，開闢更廣闊的實踐舞台。祝閱讀愉快，旅程精彩！編著本書雖力求完美，但是學經歷不足，謬誤難免，尚祈讀者不吝指正。

洪錦魁2025/03/15

jiinkwei@me.com

臉書粉絲團

歡迎加入：王者歸來電腦專業圖書系列

歡迎加入：MQTT 與AIoT 整合應用

歡迎加入：iCoding 程式語言讀書會(Python, Java, C, C++, C#, JavaScript, 大數據,人工智慧等不限)，讀者可以不定期獲得本書籍和作者相關訊息。