描述
內容簡介
機器學習最強入門 基礎數學/機率/統計 邁向 AI真實數據 x 專題實作 ★★★★★【數學原理 + 演算法 + 真實案例+ 專題實作】★★★★★ ★★★★★【最簡明的數學、機率、統計知識】★★★★★ ★★★★★【最完整的機器學習演算法】★★★★★ ★★★★★【最豐富的真實數據 x 專題實作】★★★★★
本書特色如下: ★ 最白話解釋數學原理 ☆ 從簡單的數據開始理解機器學習的演算法 ★ 將理論知識轉化為實際的程式碼 ☆ 實際案例分析 全書有約416個Python程式實例,讀者可以由本書內容,了解下列與機器學習有關的基礎數學、機率、統計知識: ★ 方程式與函數 ☆ 完整Python語法 ★ 一元函數到多元函數 ☆ 最小平方法 ★ 基礎統計 ☆ 機率與單純貝式理論 ★ 指數與對數 ☆ logit函數與logistic函數 ★ 向量與矩陣 ☆ 二次函數、三次函數與多項式函數 當讀者有了上述知識後,筆者從簡單的實例開始介紹下列機器學習的演算法,每一種演算法皆是從基礎數據開始解說,然後跨入真實數據,解說應該如何將演算法應用到真實案例環境: ★ 線性迴歸 – 波士頓房價 ☆ 邏輯迴歸 – 信用卡/葡萄酒/糖尿病 ★ 決策樹 – 葡萄酒/鐵達尼號/Telco/Retail ☆ 隨機森林樹 – 波士頓房價/鐵達尼號/Telco/收入分析 ★ KNN演算法 – 電影推薦/足球射門/鳶尾花/小行星撞地球 ☆ 支援向量機 – 鳶尾花/乳癌/汽車燃料 ★ 單純貝式分類 – 垃圾郵件/中英文的新聞分類/情感分析/電影評論 ☆ 集成機器學習 – 蘑菇/醫療保險/玻璃/加州房價 ★ K-means分群 – 購物中心消費/葡萄酒評價 ☆ PCA主成分分析 – 手寫數字/人臉數據 ★ 階層式分群 – 小麥數據/老實泉 ☆ DBSCAN演算法 – 購物中心客戶分析 在講解上述演算法時,筆者同時介紹下列機器學習應該知道的知識: ★ 特徵選擇 ☆ 用直方圖了解特徵分佈 ★ 用箱型圖了解異常值 ☆ 數據預處理 ★ 殘差圖(Residual plot) ☆ 機器學習性能評估 ★ 過擬合(overfitting) ☆ 欠擬合(underfitting) ★ 數據洩漏(Data leakage) ☆ 繪製決策樹圖(Decision tree map) ★ 可視化熱力圖(Heat map) ☆ 決策邊界(Decision Boundary) ★ 增加數據維度與超平面 ☆ 交叉驗證(Cross-validation) ★ 泛化能力(Generalization Ability) ☆ 弱學習器(Weaks learners) ★ 強學習器(Strong learners) ☆ 學習模型(base learner) 本書最後一章,介紹了熱門的AI主題「語音辨識」,從本章內容讀者可以學會下列知識: ★ 語音轉文字 ☆ 文字轉語音
※ 本書所有程式實例可至深智官網下載:deepwisdom.com.tw |
作者簡介
洪錦魁
一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家。
n DOS時代他的代表作品是IBM PC組合語言、C、C++、Pascal、資料結構。 n Windows時代他的代表作品是Windows Programming使用C、Visual Basic。 n Internet時代他的代表作品是網頁設計使用HTML。 n 大數據時代他的代表作品是R語言邁向Big Data之路。 n 人工智慧時代他的代表作品是機器學習基礎數/微積分 + Python實作。
作品曾被翻譯為簡體中文、馬來西亞文、英文,近年來作品則是在北京清華大學和台灣深智同步發行: 1:C、Java、Python、C#、R最強入門邁向頂尖高手之路王者歸來 2:OpenCV影像創意邁向AI視覺王者歸來 3:Python網路爬蟲:大數據擷取、清洗、儲存與分析王者歸來 4:演算法邏輯思維 + Python程式實作王者歸來 5:Python從2D到3D資料視覺化 6:網頁設計HTML+CSS+JavaScript+jQuery+Bootstrap+Google Maps王者歸來 7:機器學習彩色圖解 + 基礎數學、基礎微積分 + Python實作王者歸來 8:Excel完整學習、Excel函數庫、Excel VBA應用王者歸來 9:Python操作Excel最強入門邁向辦公室自動化之路王者歸來 10:Power BI最強入門 – AI視覺化+智慧決策+雲端分享王者歸來
他的多本著作皆曾登上天瓏、博客來、Momo電腦書類,各個時期暢銷排行榜第1名,他的著作最大的特色是,所有程式語法或是功能解說會依特性分類,同時以實用的程式範例做解說,不賣弄學問,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。 |
目錄
第1 章 機器學習基本觀念
1-1 人工智慧、機器學習、深度學習 1-2 認識機器學習 1-3 機器學習的種類 1-4 機器學習的應用範圍 1-5 深度學習
第2 章 機器學習的基礎數學 2-1 用數字描繪事物 2-2 變數觀念 2-3 從變數到函數 2-4 等式運算的規則 2-5 代數運算的基本規則 2-6 用數學抽象化開餐廳的生存條件 2-7 基礎數學的結論
第3 章 認識方程式/函數/座標圖形 3-1 認識方程式 3-2 方程式文字描述方法 3-3 一元一次方程式 3-4 函數 3-5 座標圖形分析 3-6 將線性函數應用在機器學習 3-7 二元函數到多元函數 3-8 Sympy 模組
第4 章 從聯立方程式看機器學習的數學模型 4-1 數學觀念建立連接兩點的直線 4-2 機器學習使用聯立方程式推估數據 4-3 從2 條直線的交叉點推估科學數據 4-4 兩條直線垂直交叉
第5章 從畢氏定理看機器學習 5-1 驗證畢氏定理 5-2 將畢氏定理應用在性向測試 5-3 將畢氏定理應用在三維空間 5-4 將畢氏定理應用在更高維的空間 5-5 電影分類 5-6 計算兩個向量的歐幾里德距離
第6章 聯立不等式與機器學習 6-1 聯立不等式與機器學習 6-2 再看聯立不等式的基本觀念 6-3 聯立不等式的線性規劃 6-4 Python 計算
第7 章 機器學習需要知道的二次函數 7-1 二次函數的基礎數學 7-2 從一次到二次函數的實務 7-3 認識二次函數的係數 7-4 使用3 個點求解一元二次函數 7-5 二次函數的配方法 7-6 二次函數與解答區間
第8 章 機器學習的最小平方法 8-1 最小平方法基本觀念 8-2 簡單的企業實例 8-3 機器學習建立含誤差值的線性方程式 8-4 Numpy 實作最小平方法 8-5 線性迴歸 8-6 實務應用
第9 章 機器學習必須懂的集合 9-1 使用Python 建立集合 9-2 集合的操作 9-3 子集、宇集與補集 9-4 加入與刪除集合元素 9-5 冪集與Sympy 模組 9-6 笛卡兒積
第10 章 機器學習必須懂的排列與組合 10-1 排列基本觀念 10-2 有多少條回家路 10-3 排列組合 10-4 階乘的觀念 10-5 重複排列 10-6 組合
第11 章 機器學習需要認識的機率 11-1 機率基本觀念 11-2 數學機率與統計機率 11-3 事件機率名稱 11-4 事件機率規則 11-5 抽獎的機率 – 加法與乘法綜合應用 11-6 餘事件與乘法的綜合應用 11-7 條件機率 11-8 貝氏定理 11-9 蒙地卡羅模擬 11-10 Numpy 的隨機模組random
第12 章 二項式定理 12-1 二項式的定義 12-2 二項式的幾何意義 12-3 二項式展開與規律性分析 12-4 找出xn-kyk 項的係數 12-5 二項式的通式 12-6 二項式到多項式 12-7 二項分佈實驗 12-8 將二項式觀念應用在業務數據分析 12-9 二項式機率分佈Python 實作 12-10 Numpy 隨機數模組的binomial( ) 函數
第13 章 指數觀念與指數函數 13-1 認識指數函數 13-2 指數運算的規則 13-3 指數函數的圖形
第14 章 對數(logarithm) 14-1 認識對數函數 14-2 對數表的功能 14-3 對數運算可以解決指數運算的問題 14-4 認識對數的特性 14-5 對數的運算規則與驗證
第15 章 歐拉數與邏輯函數 15-1 歐拉數 15-2 邏輯函數 15-3 logit 函數 15-4 邏輯函數的應用
第16 章 三角函數 16-1 直角三角形的邊長與夾角 16-2 三角函數的定義 16-3 計算三角形的面積 16-4 角度與弧度 16-5 程式處理三角函數 16-6 從單位圓看三角函數 16-7 三角函數與機器學習的關係
第17 章 基礎統計與大型運算子 17-1 母體與樣本 17-2 數據加總 17-3 數據分佈 17-4 數據中心指標 17-5 數據分散指標 17-6 符號運算規則與驗證 17-7 活用符號 17-8 迴歸分析 17-9 隨機函數的分佈
第18 章 機器學習的向量 18-1 向量的基礎觀念 18-2 向量加法的規則 18-3 向量的長度 18-4 向量方程式 18-5 向量內積 18-6 皮爾遜相關係數 18-7 向量外積
第19 章 機器學習的矩陣 19-1 矩陣的表達方式 19-2 矩陣相加與相減 19-3 矩陣乘以實數 19-4 矩陣乘法 19-5 方形矩陣 19-6 單位矩陣 19-7 反矩陣 19-8 用反矩陣解聯立方程式 19-9 張量(Tensor) 19-10 轉置矩陣
第20 章 向量、矩陣與多元線性回歸 20-1 向量應用在線性迴歸 20-2 向量應用在多元線性迴歸 20-3 矩陣應用在多元線性迴歸 20-4 將截距放入矩陣 20-5 簡單的線性迴歸
第21 章 三次函數迴歸曲線的程式實作 21-1 繪製數據的散點圖 21-2 三次函數的迴歸曲線模型 21-3 使用scikit-learn 模組評估迴歸模型 21-4 預測未來值 21-5 不適合的三次函數迴歸數據
第22 章 機器學習使用scikit-learn 入門 22-1 scikit-learn 的歷史 22-2 機器學習的數據集 22-3 scikit-learn 生成數據實作 22-4 scikit-learn 數據預處理 22-5 機器學習scikit-learn 入門 22-6 分類演算法 - 機器學習模型的性能評估 22-7 機器學習必需會的非數值資料轉換 22-8 機器學習演算法 22-9 使用隨機數據學習線性迴歸
第23 章 線性迴歸 - 波士頓房價 23-1 從線性迴歸到多元線性迴歸 23-2 簡單資料測試 23-3 波士頓房價數據集 23-4 用Pandas 顯示與預處理數據 23-5 特徵選擇 23-6 使用最相關的特徵做房價預估 23-7 多項式迴歸 23-8 用所有特徵執行波士頓房價預估 23-9 殘差圖(Residual plot) 23-10 梯度下降迴歸SGDRegressor( )
第24 章 邏輯迴歸 - 信用卡/葡萄酒/糖尿病 24-1 淺談線性迴歸的問題 24-2 邏輯迴歸觀念回顧 24-3 邏輯迴歸模型基礎應用 24-4 台灣信用卡持卡人數據集 24-5 葡萄酒數據 24-6 糖尿病數據
第25 章 決策樹 – 葡萄酒/鐵達尼號/Telco/Retail 25-1 決策樹基本觀念 25-2 從天氣數據認識決策樹設計流程 - 分類應用 25-3 葡萄酒數據 - 分類應用 25-4 鐵達尼號- 分類應用 25-5 Telco 電信公司- 分類應用 25-6 Retail Data Analytics - 迴歸應用
第26 章 隨機森林樹 – 波士頓房價/鐵達尼號/Telco/收入分析 26-1 隨機森林樹基本觀念 26-2 波士頓房價 - 迴歸應用 26-3 鐵達尼號 – 分類應用 26-4 Telco 客戶流失 – 分類應用 26-5 美國成年人收入分析 – 分類應用
第27 章 KNN 演算法 – 鳶尾花/小行星撞地球 27-1 KNN 演算法基礎觀念 27-2 電影推薦/ 足球射門 - 分類應用 27-3 房價計算/ 選舉準備香腸 – 迴歸應用 27-4 鳶尾花數據 - 分類應用 27-5 小行星撞地球 – 分類應用
第28 章 支援向量機 – 鳶尾花/乳癌/汽車燃料 28-1 支援向量機的基礎觀念 28-2 支援向量機 - 分類應用的基礎實例 28-3 從2 維到3 維的超平面 28-4 認識核函數 28-5 鳶尾花數據 - 分類應用 28-6 乳癌數據 - 分類應用 28-7 支援向量機 – 迴歸應用的基礎實例 28-8 汽車燃耗效率數據集 - 迴歸分析
第29 章 單純貝式分類 – 垃圾郵件/新聞分類/電影評論 29-1 單純貝式分類原理 29-2 詞頻向量模組CountVerctorizer 29-3 多項式單純貝式模組 - MultinomialNB 29-4 垃圾郵件分類 – Spambase 數據集 29-5 新聞郵件分類 – 新聞數據集20newsgroups 29-6 情感分析 – 電影評論IMDB Dataset 分析 29-7 單純貝式分類於中文的應用 29-8 今日頭條數據集
第30 章 集成機器學習 – 蘑菇/ 醫療保險/玻璃/加州房價 30-1 集成學習的基本觀念 30-2 集成學習 - 投票法Voting (鳶尾花/波士頓房價) 30-3 集成學習 - 裝袋法Bagging (蘑菇/醫療保險) 30-4 集成學習 - 提升法AdaBoost(糖尿病/波士頓房價) 30-5 集成學習 - 提升法Gradient Boosting(玻璃/加州房價) 30-6 集成學習 – 堆疊法Stacking(信用卡違約/房價預估)
第31 章 K-means 分群 – 購物中心消費/葡萄酒評價 31-1 認識無監督學習 31-2 K-means 演算法 31-3 scikit-learn 的KMeans 模組 31-4 評估分群的效能 31-5 最佳群集數量 31-6 消費分析 - 購物中心客戶消費數據 31-7 價格 vs 評價 - 葡萄酒Wine Reviews
第32 章 PCA 主成份分析 – 手寫數字/人臉數據 32-1 PCA 基本觀念 32-2 鳶尾花數據的PCA 應用 32-3 數字辨識 - 手寫數字digits dataset 32-4 人臉辨識 – 人臉數據Labeled Faces in the Wild
第33 章 階層式分層 – 小麥數據/老實泉 33-1 認識階層式分群 33-2 凝聚型(Agglomerative) 分群 33-3 小麥數據集Seeds dataset 33-4 老實泉數據Old Faithful Geyser Data
第34 章 DBSCAN 演算法 – 購物中心客戶分析 34-1 DBSCAN 演算法 34-2 scikit-learn 的DBSCAN 模組 34-3 消費分析 - 購物中心客戶消費數據
第35 章 語音辨識 35-1 語音轉文字 35-2 文字轉語音
附錄A 函數與方法索引表 附錄B 電子書 - 本書程式實例彩色執行結果圖表 |
序
機器學習最強入門 基礎數學/機率/統計 邁向 AI 真實數據 x 專題實作 王者歸來 序
AI 時代來了,機器學習成為當今的顯學。過去閱讀機器學習的相關書籍,最常看到的是艱澀難懂的數學推導公式,對於許多讀者而言可能是很好的催眠劑,至少對筆者而言是如此。因此,筆者撰寫這本書的初衷是: ● 機器學習的知識,用最白話的方式,讓大家可以輕鬆看得懂,學得會。 ● 理論解說,搭配實際案例探討,讓讀者可以徹底了解理論與實務。 和許多機器學習領域的專家討論,大家一致認同,一本好的機器學習書籍必須有下列特色: ● 作者應該時時刻刻用最白話解釋數學原理或演算法,讓讀者以最簡單的方式學會機器學習。 ● 從機器學習有關基礎數學說起,同時輔助圖表與程式實例解說。 ● 用圖表與程式實例解說基礎統計觀念。 ● 說明基礎機率與貝式理論,用程式將理論化為實作。 ● 解說機器學習有關的 scikit-learn 方法,同時用簡單數據理解此方法。 ● 從簡單的數據開始說明機器學習的演算法。 ● 實用的程式碼範例,理論知識與實際應用之間可能有巨大的差異,一本好的書應該提供一些程式碼範例,讓讀者能理解如何將這些理論知識轉化為實際的程式碼。 ● 針對問題的策略與技巧,除了基礎理論和程式碼範例外,一本好的書應該能提供一些針對特定問題的策略和技巧,例如特徵選擇、模型選擇、超參數調整等。 ● 實際案例分析,實際的案例能讓讀者理解如何在現實世界中應用機器學習,書籍應該包含一些真實世界的案例分析,來說明如何應用這些理論知識和技巧。 撰寫本書時,筆者時時刻刻將上述特色放在內心,最後則呈現這本應該是目前中文書籍機器學習領域最完整的著作。全書內容有35章,前面21章是基礎數學、統計、機率相關知識。第22 ~ 34章是用scikit-learn為基礎,介紹機器學習演算法的觀念,以及真實案例分析。第35章則是以現成的模組,介紹語音辨識,讀者可以學會如何讀取語音輸入,或是將文字轉成語音。全書有約416個Python程式實例,讀者可以由本書內容,了解下列與機器學習有關的基礎數學、機率、統計知識: ● 方程式與函數 ● 一元函數到多元函數 ● 最小平方法 ● 基礎統計 ● 機率與單純貝式理論 ● 指數與對數 ● logit 函數與 logisc 函數 ● 向量與矩陣 ● 二次函數、三次函數與多項式函數 當讀者有了上述知識後,筆者從簡單的實例開始介紹下列機器學習的演算法,每一種演算法皆是從基礎數據開始解說,然後跨入真實數據,解說應該如何將演算法應用到真實案例環境: ● 線性迴歸 – 波士頓房價 ● 邏輯迴歸 – 信用卡 / 葡萄酒 / 糖尿病 ● 決策樹 – 葡萄酒 / 鐵達尼號 /Telco/Retail ● 隨機森林樹 – 波士頓房價 / 鐵達尼號 /Telco/ 收入分析 ● KNN 演算法 – 電影推薦 / 足球射門 / 鳶尾花 / 小行星撞地球 ● 支援向量機 – 鳶尾花 / 乳癌 / 汽車燃料 ● 單純貝式分類 – 垃圾郵件 / 中英文的新聞分類 / 情感分析 / 電影評論 ● 集成機器學習 – 蘑菇 / 醫療保險 / 玻璃 / 加州房價 ● K-means 分群 – 購物中心消費 / 葡萄酒評價 ● PCA 主成分分析 – 手寫數字 / 人臉數據 ● 階層式分群 – 小麥數據 / 老實泉 ● DBSCAN 演算法 – 購物中心客戶分析 在講解上述演算法時,筆者同時介紹下列機器學習應該知道的知識: ● 特徵選擇 ● 用直方圖了解特徵分佈 ● 用箱型圖了解異常值 ● 數據預處理 ● 殘差圖 (Residual plot) ● 機器學習性能評估 ● 數據洩漏 (Data leakage) ● 繪製決策樹圖 (Decision tree map) ● 可視化熱力圖 (Heat map) ● 決策邊界 (Decision Boundary) ● 增加數據維度與超平面 ● 交叉驗證 (Cross-validaon) ● 泛化能力 (Generalizaon Ability) ● 過擬合 (overfing) ● 欠擬合 (underfing) ● 弱學習器 (Weaks learners) ● 強學習器 (Strong learners) ● 學習模型 (base learner) 本書最後一章,介紹了熱門的AI 主題「語音辨識」,從本章內容讀者可以學會下列知識: ● 語音轉文字 ● 文字轉語音 這本書雖然沒有專門章節介紹機器學習必須會的繪圖知識matplotlib、seaborn,數據預處理numpy、pandas,但是每個程式在解說時,筆者已經用文字和程式實例講解了這方面的相關知識,無形中讀者就可以學會這方面的知識。 感謝好友銘傳大學前研發長、統計系系主任,張慶暉博士,協助本書校對工作。寫過許多的電腦書著作,本書沿襲筆者著作的特色,程式實例豐富,相信讀者只要遵循本書內容,必定可以在最短時間,精通使用Python 設計機器學習相關應用的知識。編著本書雖力求完美,但是學經歷不足,謬誤難免,尚祈讀者不吝指正。
洪錦魁2023-07-30
教學資源說明 教學資源有教學投影片。 註:教學資源不提供給一般讀者,請原諒。
讀者資源說明 請至本公司網頁https://deepwisdom.com.tw 下載本書程式實例與習題所需的相關檔案,以及相關附錄B之電子書資源,這些文件以Word檔案呈現。
臉書粉絲團 ● 歡迎加入:王者歸來電腦專業圖書系列 ● 歡迎加入:iCoding 程式語言讀書會(Python, Java, C, C++, C#, JavaScript, 大數據,人工智慧等不限),讀者可以不定期獲得本書籍和作者相關訊息。 ● 歡迎加入:穩健精實AI 技術手作坊 |