描述
內容簡介
★☆★深度學習暢銷好書2025全新改版★☆★
本書專為想掌握深度學習核心概念卻不希望陷入繁瑣數學推導的讀者而設計,以「以程式設計取代定理證明」為宗旨,透過實作引導理解,縮短學習曲線,提升學習趣味與成就感。 內容著重於演算法的觀念理解,輔以大量圖解說明,捨棄冗長的理論鋪陳,讓讀者能夠輕鬆掌握深度學習的核心原理。全書提供完整範例程式與多種演算法的實務應用,強調實用性與延伸性,期盼能激發讀者靈感,將所學應用於實際專案或產品開發中。 本次改版翻修實作的範例程式,並新增更多應用實例及演算法說明,例如Transformer、Diffusion Model等。 《深度學習最佳入門與專題實戰:理論基礎與影像篇》內容包括:深度學習導論、神經網路原理、TensorFlow 基礎操作、物件偵測、生成式 AI、生成對抗網路、擴散模型等,全面涵蓋深度學習的基礎知識與影像應用領域。
適合讀者 ►深度學習的入門者:必須熟悉Python 程式語言及機器學習基本概念。 ►資料工程師:以應用系統開發為職志,希望能應用各種演算法,進行實作。 ►資訊工作者:希望能擴展深度學習知識領域。 ►從事其他領域的工作,希望能一窺深度學習奧秘者。 |
作者簡介
|
目錄
►第一篇 深度學習導論
第1 章 深度學習(Deep Learning)導論 ▍1-1 人工智慧的三波浪潮 ▍1-2 人工智慧的未來趨勢 ▍1-3 AI 的學習地圖 ▍1-4 機器學習應用領域 ▍1-5 機器學習開發流程 ▍1-6 開發環境安裝 ▍參考資料(References)
第2 章 神經網路(Neural Network)原理 ▍2-1 必備的數學與統計知識 ▍2-2 線性代數(Linear Algebra) 2-2-1 向量(Vector) 2-2-2 矩陣(Matrix) 2-2-3 聯立方程式求解 ▍2-3 微積分(Calculus) 2-3-1 微分(Differentiation) 2-3-2 微分定理 2-3-3 偏微分(Partial Differentiation) 2-3-4 線性迴歸求解 2-3-5 積分(Integration) ▍2-4 機率(Probability)與統計(Statistics) 2-4-1 資料型態 2-4-2 抽樣(Sampling) 2-4-3 基礎統計(Statistics Fundamentals) 2-4-4 機率(Probability) 2-4-5 機率分配(Distribution) 2-4-6 假設檢定(Hypothesis Testing) 2-4-7 小結 ▍2-5 線性規劃(Linear Programming) ▍2-6 最大概似法(MLE) ▍2-7 神經網路(Neural Network)求解 2-7-1 神經網路(Neural Network) 2-7-2 梯度下降法(Gradient Descent) 2-7-3 神經網路求解 ▍參考資料(References)
►第二篇 TensorFlow 基礎篇 第3 章 TensorFlow 架構與主要功能 ▍3-1 常用的深度學習套件 ▍3-2 TensorFlow 架構 ▍3-3 張量(Tensor)運算 ▍3-4 自動微分(Automatic Differentiation) ▍3-5 神經層(Neural Network Layer) ▍參考資料( References)
第4 章 神經網路實作 ▍4-1 撰寫第一支神經網路程式 4-1-1 最簡短的程式 4-1-2 程式強化 4-1-3 實驗 ▍4-2 Keras 模型種類 4-2-1 順序型模型(Sequential Model) 4-2-2 Functional API ▍4-3 神經層(Layer) 4-3-1 完全連接神經層(Dense Layer) 4-3-2 Dropout Layer ▍4-4 激勵函數(Activation Function) ▍4-5 損失函數(Loss Functions) ▍4-6 優化器(Optimizer) ▍4-7 效能衡量指標(Performance Metrics) ▍4-8 超參數調校(Hyperparameter Tuning) ▍參考資料( References)
第5 章 TensorFlow 常用指令與功能 ▍5-1 特徵轉換 ▍5-2 模型存檔與載入(Model Saving and Loading) ▍5-3 模型彙總與結構圖(Summary and Plotting) ▍5-4 回呼函數(Callbacks) 5-4-1 EarlyStopping Callback 5-4-2 ModelCheckpoint Callback 5-4-3 TensorBoard Callback 5-4-4 自訂Callback 5-4-5 自訂Callback 5-4-6 取得優化器的學習率變化 5-4-7 小結 ▍5-5 TensorBoard 5-5-1 TensorBoard 功能 5-5-2 測試 5-5-3 寫入圖片 5-5-4 效能調校(Performance Tuning) 5-5-5 敏感度分析(What-If Tool, WIT) 5-5-6 小結 ▍5-6 模型佈署(Deploy) 5-6-1 網頁開發 5-6-2 桌面程式開發 ▍5-7 TensorFlow Dataset 5-7-1 產生Dataset 5-7-2 圖像Dataset 5-7-3 TFRecord 與Dataset 5-7-4 TextLineDataset 5-7-5 Dataset 效能提升 ▍參考資料( References)
第6 章 卷積神經網路(Convolutional Neural Network) ▍6-1 卷積神經網路簡介 ▍6-2 卷積(Convolution) ▍6-3 濾波器(Filter) ▍6-4 池化層(Pooling Layer) ▍6-5 CNN 模型實作 ▍6-6 資料增補(Data Augmentation) ▍6-7 可解釋的 AI( eXplainable AI, XAI) ▍6-8 卷積神經網路的缺點 ▍參考資料( References)
第7 章 預先訓練的模型(Pre-trained Model) ▍7-1 預先訓練模型的簡介 ▍7-2 採用完整模型 ▍7-3 採用部分模型 ▍7-4 轉移學習(Transfer Learning) ▍7-5 Batch Normalization 說明 ▍參考資料( References)
►第三篇 進階的影像應用 第8 章 物件偵測(Object Detection) ▍8-1 圖像辨識模型的發展 ▍8-2 影像金字塔與滑動視窗 ▍8-3 方向梯度直方圖(HOG) ▍8-3 R-CNN 系列演算法 ▍8-4 R-CNN 改良 ▍8-5 YOLO 演算法簡介 ▍8-6 YOLO 訓練與推論 ▍8-7 YOLO 各項功能 ▍8-8 圖像分類(Image Classification) ▍8-9 物件偵測(Object Detection) 8-9-1 YOLO 物件偵測(Object Detection) 8-9-2 TensorFlow Object Detection API ▍8-10 資料標記(Data Annotation) ▍8-11 物件偵測的效能衡量指標 ▍8-12 實例分割(Instance Segmentation) ▍8-13 姿態辨識(Pose Estimation) ▍8-14 旋轉邊界框物件偵測(Oriented Bounding Boxes Object Detection) ▍8-15 物件追蹤(Object Tracking) ▍8-16 YOLO 測試心得 ▍8-17 總結 ▍參考資料( References)
第9 章 生成式AI(Generative AI) ▍9-1 編碼器與解碼器(Encoder-decoder) ▍9-2 自動編碼器(AutoEncoder) ▍9-3 變分自編碼器(Variational AutoEncoder) ▍9-4 Conditional VAE ▍9-5 U-Net ▍9-6 風格轉換(Style Transfer) -- 人人都可以是畢卡索 ▍9-7 快速風格轉換(Fast Style Transfer) ▍9-8 本章小結 ▍參考資料( References)
第 10 章 生成對抗網路( GAN) ▍10-1 生成對抗網路介紹 ▍10-2 生成對抗網路種類 ▍10-3 DCGAN ▍10-4 Progressive GAN ▍10-5 Conditional GAN ▍10-6 Pix2Pix ▍10-7 CycleGAN ▍10-8 CartoonGAN ▍10-9 GAN 挑戰 ▍10-10 深度偽造(Deepfake) ▍參考資料( References)
第11 章 擴散模型(Diffusion Model) ▍11-1 擴散模型(Diffusion Model)原理 ▍11-2 擴散模型(Diffusion Model)實作 ▍11-3 MidJourney 簡介 ▍11-4 Stable Diffusion 簡介 ▍11-5 DreamStudio 使用 ▍11-6 Stable Diffusion 本機安裝 ▍11-7 Stable Diffusion API ▍11-8 Stable Diffusion Extension ▍11-9 ControlNet in Diffusers ▍11-10 NitroFusion ▍11-11 OpenAI DALL · E ▍11-12 本章小結 ▍參考資料( References)
第12 章 其他影像應用 ▍12-1 臉部辨識(Facial Recognition) ▍12-2 臉部偵測(Face Detection) ▍12-3 MTCNN 演算法 ▍12-4 臉部追蹤(Face Tracking) ▍12-5 臉部特徵點偵測 ▍12-6 臉部驗證(Face Verification) ▍12-7 光學文字辨識(OCR) ▍12-8 EasyOCR ▍12-9 車牌辨識(ANPR) ▍12-10 影像去背(Background Removing) ▍12-11 本章小結 ▍參考資料( References) |
序
再版說明
初版至今已近3 年,其間AI 發展迅速,各項套件/ 演算法均有重大變革,例如大語言模型(LLM)、生成式AI(Generative AI)、Keras v3、YOLO v11、Gymnasium,全書實作的範例程式幾乎全部翻修,並新增更多應用程式,也包括更多的演算法說明,例如Transformer、Diffusion Model⋯等。 為何撰寫本書 從事機器學習教育訓練已近6 年,其間也在『IT 邦幫忙』撰寫100 多篇的文章(https://ithelp.ithome.com.tw/users/20001976/articles),從學員及讀者的回饋獲得許多寶貴意見,期望能將整個歷程集結成冊,同時,相關領域的進展也在飛速變化,過往的文章內容需要翻新,因此藉機再重整思緒,想一想如何能將演算法的原理解釋得更簡易清晰,協助讀者跨入AI 的門檻,另外,也避免流於空談,盡量增加應用範例,希望能達到即學即用,不要有過多理論的探討。 AI 是一個將資料轉化為知識的過程,演算法就是過程中的生產設備,最後產出物是模型,再將模型植入各種硬體裝置,例如電腦、手機、智慧音箱、自駕車、醫療診斷儀器、⋯等,這些裝置就擁有特殊專長的智慧,再進一步整合各項技術就構建出智慧製造、智慧金融、智慧交通、智慧醫療、智慧城市、智慧家庭、⋯等應用系統。AI 的應用領域如此的廣闊,個人精力有限,當然不可能具備十八般武藝,樣樣精通,惟有從基礎紮根,再擴及有興趣的領域,因此,筆者撰寫這本書的初衷,非常單純,就是希望讀者在紮根的過程中,貢獻一點微薄的力量。
本書主要的特點 由於筆者身為統計人,希望能『以統計/ 數學為出發點』,介紹深度學習必備的數理基礎,但又不希望內文有太多數學公式的推導,讓離開校園已久的在職者看到一堆數學符號就心生恐懼,因此,嘗試以『程式設計取代定理證明』,縮短學習歷程,增進學習樂趣。 TensorFlow 2.x 版有巨大的變動,預設模式改為Eager Execution,並以Keras 為主力,整合TensorFlow 其他模組,形成完整的架構,本書期望對TensorFlow/Keras 架構作完性的介紹。 演算法介紹以理解為主,輔以大量圖表說明,摒棄長篇大論。 完整的範例程式及各種演算法的延伸應用,以實用為要,希望能觸發讀者靈感,能在專案或產品內應用。 介紹日益普及的演算法與相關套件的使用,例如YOLO(物件偵測)、GAN(生成對抗網路)/DeepFake(深度偽造)、OCR(辨識圖像中的文字)、臉部辨識、BERT/Transformer、ChatBot、強化學習、自動語音辨識(ASR)等。
目標對象 深度學習的入門者:必須熟悉Python 程式語言及機器學習基本概念。 資料工程師:以應用系統開發為職志,希望能應用各種演算法,進行實作。 資訊工作者:希望能擴展深度學習知識領域。 從事其他領域的工作,希望能一窺深度學習奧秘者。
閱讀重點 第一章介紹AI 的發展趨勢,鑑古知今,瞭解前兩波AI 失敗的原因,比較第三波發展的差異性。 第二章介紹深度學習必備的統計/ 數學基礎,不僅要理解相關知識,也力求能撰寫程式解題。 第三章介紹TensorFlow/Keras 基本功能,包括張量(Tensor)運算、自動微分及神經網路模型的組成,並說明梯度下降法求解的過程。 第四章開始實作,依照機器學習10 項流程,撰寫完整的範例,包括Web、桌面程式。 第五章介紹TensorFlow 進階功能, 包括各種工具, 如TensorBoard、TensorFlow Serving、Callbacks。 第六~ 八章介紹圖像/ 視訊的演算法及各式應用。 第九~ 十一章介紹生成式AI,包括Encoder-decoder、生成對抗網路(GAN)及擴散模型(Diffusion Model),也說明Stable Diffusion 及Dall-E 實作。 第十二章介紹各種影像應用,包括臉部辨識、OCR、車牌辨識及圖像去背。 第十三~ 十四章介紹自然語言處理及各式應用。 第十五章介紹大型語言模型(Large Language Model, LLM),包括Transformer 演算法、ChatGPT 實作及企業導入實務。 第十六章介紹語音辨識的原理/ 演算法/ 實作/ 應用,包括OpenAI Whisper 實作及應用範例。 第十七章介紹強化學習(Reinforcement Learning, RL)的概念/ 演算法/ 實作/ 應用,包括Gymnasium、Stable Baselines3 套件實作及應用範例。
本書範例程式碼全部收錄在 https://github.com/mc6666/DL_Book2,還包括各章的參考資料及超連結,方便使用者複製。 |