描述
搜尋引擎、維基百科,龐大系統的建立,全部靠著系統化的人工智慧技術,而知識圖譜(Knowledge Graph, KG)就是這個技術的佼佼者。知識圖譜是一種大規模語義網路,已經成為大數據時代知識工程的代表性進展。這一次你不但可以知道最新技術的來龍去脈,更可以自己實作這個技術,並且熟知知識圖譜技術的發展及未來。
這是一本系統介紹知識圖譜概念、技術與實作的書。全書共5篇,由16章組成,力求涵蓋知識圖譜相關的基本概念與關鍵技術。
►「基礎篇」介紹知識圖譜的基本概念、內涵與外延、歷史沿革、應用價值,以及相關的基礎知識。
►「建置篇」重點介紹大規模高品質知識圖譜的自動化建置技術,涵蓋詞彙採擷、實體識別、關係取出及概念圖譜建置、百科圖譜建置、眾包建置與品質控制等專題。
►「管理篇」系統地說明了知識圖譜建模與儲存、查詢與檢索,以及圖資料管理系統。
►「應用篇」對於以知識圖譜為基礎的關鍵應用技術多作說明,包含搜尋與推薦、自然語言問答,以及以知識圖譜為基礎的自然語言了解。
►「實作篇」介紹知識圖譜實作中的基本原則和有用實作,初步討論了知識圖譜實作中的開放性問題。
適合讀者群:從事技術和應用開發者、企業與企業智慧化的從業人員、電腦和人工智慧相關的師生或研究人員。
作者簡介
肖仰華博士,復旦大學教授、博士生導師、復旦大學知識工廠實驗室創始人、上海市互聯網大數據工程技術中心副主任、多家企業高級顧問與首席科學家、知識圖譜前沿技術系列課程發起人、十多個國家/省市/企業研究獎項獲得者、三十多個國家/省市/企業研發項目負責人。在國際頂級學術會議與期刊(包括SIGMOD、VLDB、ICDE、IJCAI、AAAI、TKDE等)發表論文百餘篇,授權近20項知識圖譜專利。百餘次擔任國際/國內學術機構/會議的學術服務工作。領導構建了知識庫雲端服務平台(知識工廠平台kw.fudan.edu.cn),發佈一系列知識圖譜,以API形式為數百家應用單位服務超過10億次。
目錄
第1 篇 基礎篇
01 | 知識圖譜概述
1.1 知識圖譜的基本概念
1.2 知識圖譜的歷史沿革
1.3 知識圖譜的研究意義
1.4 知識圖譜的應用價值
1.5 知識圖譜的分類
02 | 基礎知識
2.1 概述
2.2 知識表示
2.3 機器學習
2.4 自然語言處理
第2 篇 建置篇
03 | 詞彙採擷與實體識別
3.1 概述
3.2 領域子句採擷
3.3 同義字採擷
3.4 縮略詞取出
3.5 實體識別
04 | 關係取出
4.1 概述
4.2 以模式為基礎的取出
4.3 以學習為基礎的取出
4.4 開放關係取出
05 | 概念圖譜建置
5.1 概述
5.2 isA 關係取出
5.3 isA 關係補全
5.4 isA 關係校正
06 | 百科圖譜建置
6.1 概述
6.2 以單源為基礎的百科圖譜建置
6.3 以多源為基礎的百科圖譜融合
07 | 知識圖譜的眾包建置
7.1 概述
7.2 知識型眾包的基本概念
7.3 知識型眾包研究的問題
7.4 基於眾包的知識圖譜建置與精化
08 | 知識圖譜的品質控制
8.1 概述
8.2 缺失知識的發現與補全
8.3 錯誤知識的發現與校正
8.4 過期知識的更新
第3 篇 管理篇
09 | 知識圖譜的建模與儲存
9.1 概述
9.2 知識圖譜的資料模型
9.3 知識圖譜的物理儲存
10 | 知識圖譜的查詢與檢索
10.1 概述
10.2 查詢語言:SPARQL
10.3 子圖查詢
10.4 其他查詢
11 | 圖資料管理系統
11.1 概述
11.2 知識圖譜與圖資料管理系統
11.3 圖資料管理系統的基本架構和設計原則
11.4 典型的圖資料管理系統
第4 篇 應用篇
12 | 基於知識圖譜的語言認知
12.1 概述
12.2 實體理解
12.3 概念理解
12.4 屬性理解
13 | 基於知識圖譜的搜尋與推薦
13.1 概述
13.2 基於知識圖譜的搜尋
13.3 基於知識圖譜的推薦
14 | 基於知識圖譜的問答
14.1 概述
14.2 基於範本的KBQA
14.3 基於圖模型的KBQA
14.4 基於深度學習的KBQA
第5 篇 實作篇
15 | 知識圖譜實作
15.1 概述
15.2 知識圖譜系統
15.3 知識圖譜專案
16 | 開放性問題
16.1 知識表示
16.2 知識取得
16.3 知識應用
序
前言
自2012 年Google 發佈知識圖譜以來,知識圖譜技術高速發展,其理論系統日趨增強,應用效果日益明顯。在知識圖譜技術的領導下,知識工程新的歷史篇章——巨量資料知識工程已初具輪廓;在知識圖譜技術的推動下,各行各業的智慧化升級與轉型的宏偉藍圖正逐步展開。回溯半個多世紀,以物理符號系統為代表的人工智慧符號主義理論思潮與以專家系統建設為核心的知識專案實作相得益彰、大放異彩。再回溯到2000 多年前,追根溯源,古希臘哲學三賢開創了偉大的邏輯思維時代,其思維直接或間接地影響了從符號主義到知識工
程再到知識圖譜的歷史延承與發展。
發生在當下的以巨量資料、人工智慧為代表的一系列技術革命很可能是人類誕生以來最為宏大也是影響最為深遠的技術革命。站在當下這一重要時間節點,回望過去,展望未來,每個親歷者都不免心潮澎湃,感慨時代變遷之偉大,個人沉浮之渺小。然而,偉大的時代常常是由星星點點的思維與細小而堅實的實作鑄就而成的。本書就是這樣一條涓涓細流,願其最後匯入時代的大江大河。
可以言說的即是可以思考的,可以思考的問題終究是簡單的問題。隨著人工智慧的發展,越來越多難以言說的「難題」逐漸浮出水面,例如意識難題。突破思維的邊界對於解決人工智慧難題而言顯得日益重要。縱觀歷史,任何一家之言終究會湮沒在歷史洪流之中。在此成書之際,筆者提醒讀者不要將自己的思維囿於任何一隅,即使某個思潮、某種技術、某個方法在當下如火如荼。如果將人工智慧的實現視作一場曠日持久的戰爭,我們可能還要發起很多次衝鋒才能取得這場戰爭的決定性勝利。而每一次衝鋒都將是某一種思維、某一種技術在人工智慧發展史中的一次華麗亮相。