描述
內容簡介
|
作者簡介
姜偉生
博士FRM。勤奮的小鎮做題家,熱愛知識可視化和開源分享。自2022年8月開始,在GitHub上開源「鳶尾花書」學習資源,截至2023年9月,已經分享4000多頁PDF、4000多幅矢量圖、約2000個代碼文件,全球讀者數以萬計。 |
目錄
第1章 不止向量
1.1有資料的地方,必有矩陣 1.2有矩陣的地方,更有向量 1.3有向量的地方,就有幾何 1.4有幾何的地方,皆有空間 1.5有資料的地方,定有統計
第2章 向量運算 2.1向量:多面手 2.2行向量、列向量 2.3向量長度:模,歐氏距離,L2範數 2.4加減法:對應位置元素分別相加減 2.5純量乘法:向量縮放 2.6向量內積:結果為純量 2.7向量夾角:反餘弦 2.8餘弦相似度和餘弦距離 2.9向量積:結果為向量 2.10逐項積:對應元素分別相乘 2.11張量積:張起網格面
第3章 向量範數 3.1Lp範數:L2範數的推廣 3.2Lp範數和超橢圓的聯繫 3.3L1範數:旋轉正方形 3.4L2範數:正圓 3.5L∞範數:正方形 3.6再談距離度量
第4章 矩陣 4.1矩陣:一個不平凡的表格 4.2矩陣形狀:每種形狀都有特殊用途 4.3基本運算:加減和純量乘法 4.4廣播原則 4.5矩陣乘法:線性代數的運算核心 4.6兩個角度解剖矩陣乘法 4.7轉置:繞主對角線鏡像 4.8矩陣逆:「相當於 」除法運算 4.9跡:主對角元素之和 4.10逐項積:對應元素相乘 4.11行列式:將矩陣映射到純量值
第5章 矩陣乘法 5.1矩陣乘法:形態豐富多樣 5.2向量和向量 5.3再聊全1列向量 5.4矩陣乘向量:線性方程式組 5.5向量乘矩陣乘向量:二次型 5.6方陣次方陣:矩陣分解 5.7對角陣:批次縮放 5.8置換矩陣:調換元素順序 5.9矩陣乘向量:映射到一維 5.10矩陣乘矩陣:映射到多維 5.11長方陣:奇異值分解、格拉姆矩陣、張量積 5.12愛因斯坦求和約定 5.13矩陣乘法的幾個雷區
第6章 分塊矩陣 6.1分塊矩陣:橫平垂直切豆腐 6.2矩陣乘法第一角度:純量積展開 6.3矩陣乘法第二角度:外積展開 6.4矩陣乘法更多角度:分塊多樣化 6.5分塊矩陣的逆 6.6克羅內克積:矩陣張量積
第7章 向量空間 7.1向量空間:從直角座標系說起 7.2給向量空間塗顏色:RGB色卡 7.3張成空間:線性組合紅、綠、藍三原色 7.4線性無關:紅色和綠色,調不出青色 7.5非正交基底:青色、品紅、黃色 7.6基底轉換:從紅、綠、藍,到青色、品紅、黃色
第8章 幾何變換 8.1線性變換:線性空間到自身的線性映射 8.2平移:仿射變換,原點變動 8.3縮放:對角陣 8.4旋轉:行列式值為1 8.5鏡像:行列式值為負 8.6投影:降維操作 8.7再談行列式值:幾何角度
第9章 正交投影 9.1純量投影:結果為純量 9.2向量投影:結果為向量 9.3正交矩陣:一個規範正交基底 9.4規範正交基底性質 9.5再談鏡像:從投影角度 9.6格拉姆-施密特正交化 9.7投影角度看回歸
第10章 資料投影 10.1從一個矩陣乘法運算說起 10.2二次投影 + 層層疊加 10.3二特徵資料投影:標準正交基底 10.4二特徵資料投影:規範正交基底 10.5四特徵資料投影:標準正交基底 10.6四特徵資料投影:規範正交基底 10.7資料正交化
第11章 矩陣分解 11.1矩陣分解:類似因式分解 11.2LU分解:上下三角 11.3Cholesky分解:適用於正定矩陣 11.4QR分解:正交化 11.5特徵值分解:刻畫矩陣映射的特徵 11.6奇異值分解:適用於任何實數矩陣
第12章 Cholesky分解 12.1Cholesky分解 12.2正定矩陣才可以進行Cholesky分解 12.3幾何角度:開合 12.4幾何變換:縮放 → 開合 12.5推廣到三維空間 12.6從格拉姆矩陣到相似度矩陣
第13章 特徵值分解 13.1幾何角度看特徵值分解 13.2旋轉 → 縮放 → 旋轉 13.3再談行列式值和線性變換 13.4對角化、譜分解 13.5聊聊特徵值 13.6特徵值分解中的複數現象
第14章 深入特徵值分解 14.1方陣開方 14.2矩陣指數:冪級數的推廣 14.3費氏數列:求通項式 14.4馬可夫過程的平穩狀態 14.5瑞利商 14.6再談橢圓:特徵值分解
第15章 奇異值分解 15.1幾何角度:旋轉 → 縮放 → 旋轉 15.2不同類型SVD分解 15.3左奇異向量矩陣U 15.4右奇異向量矩陣V 15.5兩個角度:投影和資料疊加
第16章 深入奇異值分解 16.1完全型:U為方陣 16.2經濟型:S去掉零矩陣,變方陣 16.3緊湊型:非滿秩 16.4截斷型:近似 16.5資料還原:層層疊加 16.6估計與誤差:截斷型SVD 16.7正交投影:資料正交化
第17章 多元函式微分 17.1偏導:特定方向的變化率 17.2梯度向量:上山方向 17.3法向量:垂直於切平面 17.4方向性微分:函式任意方向的變化率 17.5泰勒展開:一元到多元
第18章 拉格朗日乘子法 18.1回顧最佳化問題 18.2等式約束條件 18.3線性等式約束 18.4非線性等式約束 18.5不等式約束 18.6再談特徵值分解:最佳化角度 18.7再談SVD:最佳化角度 18.8矩陣範數:矩陣 → 純量,矩陣「大小 」 18.9再談資料正交投影:最佳化角度
第19章 直線到超平面 19.1切向量:可以用來定義直線 19.2法向量:定義直線、平面、超平面 19.3超平面:一維直線和二維平面的推廣 19.4平面與梯度向量 19.5中垂線:用向量求解析式 19.6用向量計算距離
第20章 再談圓錐曲線 20.1無處不在的圓錐曲線 20.2正圓:從單位圓到任意正圓 20.3單位圓到旋轉橢圓:縮放 → 旋轉 → 平移 20.4多元高斯分佈:矩陣分解、幾何變換、距離 20.5從單位雙曲線到旋轉雙曲線 20.6切線:建構函式,求梯度向量 20.7法線:法向量垂直於切向量
第21章 曲面和正定性 21.1正定性 21.2幾何角度看正定性 21.3開口朝上抛物面:正定 21.4山谷面:半正定 21.5開口朝下抛物面:負定 21.6山脊面:半負定 21.7雙曲抛物面:不定 21.8多極值曲面:局部正定性
第22章 資料與統計 22.1統計 + 線性代數:以鳶尾花資料為例 22.2平均值:線性代數角度 22.3質心:平均值排列成向量 22.4中心化:平移 22.5分類資料:加標籤 22.6方差:平均值向量沒有解釋的部分 22.7協方差和相關性係數 22.8協方差矩陣和相關性係數矩陣
第23章 資料空間 23.1從資料矩陣X說起 23.2向量空間:從SVD分解角度理解 23.3緊湊型SVD分解:剔除零空間 23.4幾何角度說空間 23.5格拉姆矩陣:向量模、夾角餘弦值的集合體 23.6標準差向量:以資料質心為起點 23.7白話說空間:以鳶尾花資料為例
第24章 資料分解 24.1為什麼要分解矩陣? 24.2QR分解:獲得正交系 24.3Cholesky分解:找到列向量的座標 24.4特徵值分解:獲得行空間和零空間 24.5SVD分解:獲得四個空間
第25章 資料應用 25.1從線性代數到機器學習 25.2從隨機變數的線性變換說起 25.3單方向映射 25.4線性回歸 25.5多方向映射 25.6主成分分析 |
序
前言
感謝 首先感謝大家的信任。 作者僅是在學習應用資料科學和機器學習演算法時,多讀了幾本數學書,多做了一些思考和知識 整理而已。知者不言,言者不知。知者不博,博者不知。由於作者水準有限,斗膽把自己所學所思與大家分享,作者權當無知者無畏。希望大家在Github多提意見,讓這套書成為作者和讀者共同參與創作的作品。 特別感謝清華大學出版社的欒大成老師。從選題策劃、內容創作到裝幀設計,欒老師事無巨細、一路陪伴。每次與欒老師交流,都能感受到他對優質作品的追求、對知識分享的熱情。
出來混總是要還的 曾經,考試是我們學習數學的唯一動力。考試是頭懸樑的繩,是錐刺股的錐。我們中的大多數人 從小到大為各種考試埋頭題海,數學味同嚼蠟,甚至讓人恨之入骨。 數學所帶來了無盡的「折磨」。 我們甚至恐懼數學,憎恨數學,恨不得一走出校門就把數學拋之腦後,老死不相往來。 可悲可笑的是,我們很多人可能會在畢業的五年或十年以後,因為工作需要,不得不重新學習微積分、線性代數、機率統計,悔恨當初沒有學好數學,甚至遷怒於教材和老師。 這一切不能都怪數學,值得反思的是我們學習數學的方法和目的。
再給自己一個學數學的理由 為考試而學數學,是被逼無奈的舉動。而為數學而數學,則又太過高尚而遙不可及。 相信對絕大部分的我們來說,數學是工具、是謀生手段,而非目的。我們主動學數學,是想用數學工具解決具體問題。 現在,這套書給大家一個「學數學、用數學」的全新動力—資料科學、機器學習。 資料科學和機器學習已經深度融合到我們生活的各方面,而數學正是開啟未來大門的鑰匙。不是所有人生來都握有一副好牌,但是掌握「數學 + 程式設計 + 機器學習」的知識絕對是王牌。這次,學習數學不再是為了考試、分數、升學,而是投資時間、自我實現、面向未來。未來已來,你來不來?
本套書系如何幫到你 為了讓大家學數學、用數學,甚至愛上數學,作者可謂頗費心機。在創作這套書時,作者儘量克服傳統數學教材的各種弊端,讓大家學習時有興趣、看得懂、有思考、更自信、用得著。 為此,叢書在內容創作上突出以下幾個特點。 數學 + 藝術 全圖解,極致視覺化,讓數學思想躍然紙上、生動有趣、一看就懂,同時提高大家的資料思維、幾何想像力、藝術感。 零基礎 從零開始學習Python程式設計,從寫第一行程式到架設資料科學和機器學習應用,儘量將陡峭學習曲線拉平。 知識網路 打破數學板塊之間的門檻,讓大家看到數學代數、幾何、線性代數、微積分、 機率統計等板塊之間的聯繫,編織一張綿密的數學知識網路。 動手 授人以魚不如授人以漁,和大家一起寫程式、創作數學動畫、互動App。 學習生態 構造自主探究式學習生態環境「紙質圖書 + 程式檔案 + 視覺化工具 + 思維導圖」 ,提供各種優質學習資源。 理論 + 實踐 從加減乘除到機器學習,叢書內容安排由淺入深、螺旋上升,兼顧理論和實 踐;在程式設計中學習數學,學習數學時解決實際問題。 雖然本書標榜「從加減乘除到機器學習」, 但是建議讀者朋友們至少具備高中數學知識。如果讀者正在學習或曾經學過大學數學 (微積分、線性代數、機率統計) ,這套書就更容易讀懂了。
聊聊數學 數學是工具。錘子是工具,剪刀是工具,數學也是工具。 數學是思想。數學是人類思想高度抽象的結晶體。在其冷酷的外表之下,數學的核心實際上就是人類樸素的思想。學習數學時,知其然,更要知其所以然。不要死記硬背公式定理,理解背後的數學思想才是關鍵。如果你能畫一幅圖、用簡單的語言描述清楚一個公式、一則定理,這就說明你真正理解了它。 數學是語言。就好比世界各地不同種族有自己的語言,數學則是人類共同的語言和邏輯。數學這門語言極其精準、高度抽象,放之四海而皆準。雖然我們中大多數人沒有被數學「女神」選中,不能 為人類對數學認知開疆擴土;但是,這絲毫不妨礙我們使用數學這門語言。就好比,我們不會成為語言學家,我們完全可以使用母語和外語交流。 數學是系統。代數、幾何、線性代數、微積分、機率統計、最佳化方法等,看似一個個孤島,實際上都是數學網路的一條條織線。建議大家學習時,特別關注不同數學板塊之間的聯繫,見樹,更要見林。 數學是基石。拿破崙曾說「數學的日臻完善和國強民富息息相關。」數學是科學進步的根基,是經濟繁榮的支柱,是保家衛國的武器,是探索星辰大海的航船。 數學是藝術。數學和音樂、繪畫、建築一樣,都是人類藝術體驗。透過視覺化工具,我們會在看似枯燥的公式、定理、資料背後,發現數學之美。 數學是歷史,是人類共同記憶體。「歷史是過去,又屬於現在,同時在指引未來。」數學是人類的集體學習思考,它把人的思維符號化、形式化,進而記錄、累積、傳播、創新、發展。從甲骨、泥板、石板、竹簡、木牘、紙草、羊皮卷冊、活字印刷、紙質書,到數字媒介,這一過程持續了數千年,至今綿延不息。 數學是無窮無盡的想像力,是人類的好奇心,是自我挑戰的毅力,是一個接著一個的問題,是看似荒誕不經的猜想,是一次次膽大包天的批判性思考,是敢於站在前人臂膀之上的勇氣,是孜孜不倦 地延展人類認知邊界的不懈努力。
家園、詩、遠方 諾瓦利斯曾說:「哲學就是懷著一種鄉愁的衝動到處去尋找家園。」 在紛繁複雜的塵世,數學純粹得就像精神的世外桃源。數學是,一束光,一條巷,一團不滅的希望,一股磅礴的力量,一個值得寄託的避風港。 打破陳腐的鎖鏈,把功利心暫放一邊,我們一道懷揣一份鄉愁,心存些許詩意,踩著藝術維度,投入數學張開的臂膀,駛入它色彩斑斕、變幻無窮的深港,感受久違的歸屬,一睹更美、更好的遠方。 |