描述
內容簡介
熟悉基礎,精通實戰。
接續了上一本實戰篇的基礎,本書將介紹目前最流行的物體辨識和自然語言處理在圖神經網路上的最完整應用。當你熟悉了神經網路之後,接下來要精進的就是針對網路結果的強化及最佳化。在GNN的基礎上,針對目前最流行的視覺處理模型進行修改、架設及強化,並且實際應用在現有的平台上。本書的重點就是大量了使用現有的Python函數庫,並且應用了最新的資料集,讓你能真正看到資料套用在模型上的強大能力。在針對Pytorch的函數庫上,不但有視覺應用,更有號稱人工智慧明珠的NLP應用。使用了Torchtext以及NLP的唯一/最佳選擇Huggingface Transformers。而大家耳熟能詳,但又不知道怎麼用的模型,包括GPT-2、Transformer-XL、ALBERT、ELECTRA、DistillBERT等,在書中都有詳細介紹。另外為了解開DL的神祕,本書也難得介紹了Captum套件,讓深度神經網路更具可解釋性。本書最後也不忘介紹ZSL、這種極少量資料就可訓練高精度模型的方法。有關異質圖神經網路部分,也有大量DGL和NetworkX的範例,實戰篇+基礎篇兩本書,要不充分了解GNN都不行。 本書亮點 ~GNN 最強實戰參考書~ l 使用圖型的預訓練模型、Torschvision,GaitSet模型、CASIA-B資料集 l 高級NLP模型訓練及微調、BERTology、CBOW、Skip-Gram、Torchtext、spaCy l 文字使用模型TextCNN來把玩IMDB資料庫 l 高階工程師才會用的Mist啟動函數、Ranger最佳化器 l 正宗NLP函數庫Huggingface Transformers詳解、AutoModel、AutoModelWithMHead、多頭注意力、PretrainedTokernizer |
作者簡介
李金洪
精通 C、Python、Java 語言,擅長神經網路、演算、協定分析、移動互聯網安全架構等技術,先後擔任過 CAD 演算工程師、架構師、專案經理、部門經理等職位。參與過深度學習領域某移動互聯網後臺的 OCR 項目,某娛樂節目機器人的語音辨識、聲紋識別專案,金融領域的若干分類專案。 |
目錄
第 1 章 圖片分類模型
1.1 深度神經網路起源 1.2 Inception 系列模型 1.3 ResNet 模型 1.4 DenseNet 模型 1.5 PNASNet 模型 1.6 EfficientNet 模型 1.7 實例:使用預訓練模型辨識圖片內容 1.8 實例:使用遷移學習辨識多種鳥類 1.9 從深度卷積模型中提取視覺特徵 第 2 章 機器視覺的進階應用 2.1 基於圖片內容的處理任務 2.2 實例: 使用Mask R-CNN 模型進行目標檢測與語義分割 2.3 基於視訊內容的處理任務 2.4 實例: 用GaitSet 模型分析人走路的姿態,並進行身份辨識 2.5 偵錯技巧 第 3 章 自然語言處理的相關應用 3.1 BERT 模型與NLP 任務的發展階段 3.2 NLP 中的常見任務 3.3 實例: 訓練中文詞向量 3.4 常用文字處理工具 3.5 實例: 用TextCNN 模型分析評論者是否滿意 3.6 了解Transformers 函數庫 3.7 實例: 使用Transformers 函數庫的管道方式完成多種NLP任務 3.8 Transformers 函數庫中的AutoModel 類別 3.9 Transformers 函數庫中的BERTology 系列模型 3.10 Transformers 函數庫中的詞表工具 3.11 BERTology 系列模型 3.12 實例: 用遷移學習訓練BERT 模型來對中文分類 3.13 實例: 用R-GCN 模型了解文字中的代詞 第 4 章 神經網路的可解釋性 4.1 了解模型解釋函數庫 4.2 實例: 用可解釋性了解數值分析神經網路模型 4.3 實例: 用可解釋性了解NLP 相關的神經網路模型 4.4 實例: 用Bertviz 工具視覺化BERT 模型權重 4.5 實例: 用可解釋性了解影像處理相關的神經網路模型 4.6 實例: 用可解釋性了解圖片分類相關的神經網路模型 第 5 章 辨識未知分類的方法-- 零次學習 5.1 了解零次學習 5.2 零次學習中的常見問題 5.3 帶有視覺結構約束的VSC 模型 5.4 詳解Sinkhorn 演算法 5.5 實例: 使用VSC 模型來辨識未知類別的鳥類圖片 5.6 針對零次學習的性能分析 第 6 章 異質圖神經網路 6.1 異質圖的基礎知識 6.2 二分圖的實現方式 6.3 異質圖的實現方式 6.4 隨機行走取樣 6.5 DGL 函數庫中的區塊圖結構 6.6 實例: 使用PinSAGE 模型架設推薦系統 6.7 複習 |
序
圖神經網路(GNN)是一類基於深度學習的處理圖域資訊的方法。因為圖神經網路具有較好的性能和可解釋性,所以它已成為一種廣泛應用的圖型分析方法。
本書透過介紹一些深度學習實例,從可解釋性角度出發,說明深度學習的原理,然後將圖神經網路與深度學習結合,實現一些圖神經網路的實例。這些實例是在PyTorch 框架上完成的,具有很高的實用價值。本書中的實例涉及人工智慧的多個應用領域,具體包括影像處理領域、視訊處理領域、文字分析領域、深度學習的可解釋性、零次學習、異質圖型處理領域等。在每個實例中,都會穿插介紹一些進階的最佳化技巧和模型架設方法。本書具有以下4 個特色。 (1)知識系統,逐層遞進。本書主要介紹圖神經網路的相關知識和基礎原理,內容涵蓋與圖神經網路相關的完整技術堆疊(更多基礎內容可參考《全格局使用PyTorch - 深度學習和圖神經網路基礎篇》),結合實踐,分別講解了圖型、視訊、文字、可解釋性等項目級實戰案例,並列出實現程式。同時,針對圖片分類中常見的樣本不足的問題,介紹了零次學習技術及應用實例。 (2)緊接前端技術。本書介紹的知識接近前端技術。在介紹與圖神經網路相關的原理和應用的同時,為了拓寬讀者的知識面,本書引用了與講解的原理相關的論文,並列出這些論文的出處,方便讀者對感興趣的知識進行溯源,並可以自主擴充閱讀。 (3)配以簡單易懂的圖形,學習更直觀。在介紹模型結構和原理的同時,本書還提供了大量插圖,用以視覺化模型中的資料流程向、展示模型擬合能力、細緻呈現某種技術的內部原理、直觀化模型的內部結構,幫助讀者快速了解和掌握書中內容。 (4)理論和實踐結合,並融入作者的經驗和技巧。本書採用了兩種講解基礎知識的方式:一是先介紹基礎知識原理,再對該基礎知識進行程式實現;二是直接從實例入手,在實現過程中,將相關的基礎知識展開並詳解開發技巧。為了不讓讀者閱讀時感到枯燥,本書將這兩種方式結合使用。同時,在一些重要的基礎知識後面,還會以特殊的樣式列出提示和注意內容。這些提示和注意內容中融合了作者的經驗,希望幫助讀者掃清障礙、解除困惑、抓住重點。 本書作者對書中的原理部分和實戰程式進行了反覆推敲與更改,限於時間和能力,書中存在紕漏在所難免,真誠地希望讀者批評指正。本書編輯聯繫電子郵件:zhangtao@ptpress.com.cn。本書由大蛇智慧網站提供有關內容的技術支援。在閱讀過程中,如有不了解之處,可到討論區https://bbs.aianaconda.com 提問。 李金洪 |