描述
內容簡介
|
作者簡介
陳家宏(Laurence Chen)
現任睿博資訊負責人,專精於資訊顧問服務。他尤其擅長透過優化基礎設施,提升工程師在資料工程與應用軟體開發領域的生產力。自 2021 年起,他已成功協助多家台灣上市企業及新創公司導入現代資料棧(Modern Data Stack),顯著提升其資料處理與分析效率。 現亦任職於歐洲軟體顧問公司 Gaiwan GmbH,在國際專案中接觸前沿技術,累積豐富的跨國協作經驗。他也在多場台灣技術會議擔任講者,分享專業見解與實踐經驗,並積極推動社群發展,為 Clojure Taiwan 及 Taipei dbt Meetup 的線下活動主辦人之一。 網站: https://replware.dev 電子報: https://replware.substack.com/ —— 分享最新技術觀點與實踐經驗。 |
目錄
▌第一部 資料工程
第1章 我還想要更懶惰 需求概述 既有的作法:試算表流水生產線 相對合理的設計 軟體開發 業務報表 專案的後續與感想
第2章 現代資料棧(Modern Data Stack) 可程式化工具 資料基礎建設 資料基礎建設的發展階段 應用現代資料棧還有其它優點嗎? 選SQL 而非MapReduce ELT 取代ETL 函數式資料轉換 理想的解決方案:現代資料棧 之後的章節
第3章 View Layer(視覺化層):Metabase 自助式資料服務的必要條件 Metabase 安裝 Metabase 自動分析 Metabase 基礎操作 Metabase 進階操作 Metabase 圖表/ 視覺化 Metabase 互動儀表板與嵌入式分析 Metabase 自動化(Automation) 本章小結
第4章 Transformation Layer(資料轉換層):dbt 與SQL 三個常見的SQL 難題與對應作法 dbt 安裝 DuckDB 安裝 dbt 基本操作 dbt 資料建模 dbt 進階操作 本章小結
第5章 Transformation Layer:SQL 概論 SQL 起步 SQL 進階語法 SQL 效能改進 本章小結
第6章 EL 與ETL EL 是普遍的需求 ETL 仍然是重要的選項 EL 工具 Meltano 簡介 dlt 簡介 ETL 設計原則 ETL 開發實務 本章小結
第7章 資料可靠性(Data Reliability) 除錯方法論 dbt 套件- Elementary dbt test Recce 兩難問題的因果分析 本章小結
第8章 即時資料(Real Time Data) 不同的應用、不同的即時 變更資料擷取(Change Data Capture) 資料倉儲內的Lambda 視圖 簡易資料湖與查詢引擎 本章小結
第9章 將複雜度往下移動 機敏資料 隨著時間而變動的資料 即時資料的查詢延遲 本章小結
第10章 資料工程的挑戰 資料工程的思考:搬移程式到資料端 資料工程的思考:簡單與可擴展性的並存之道 隱而不現的資料工程問題 採用新技術時的準備 本章小結
▌第二部 資料分析
第11章 ChatGPT 作為一種資料分析工具 什麼是資料分析? 什麼是ChatGPT? 應用ChatGPT 的後設技巧(Meta-skill) 資料分析活用ChatGPT 進階議題:形式語言學的應用 本章小結
第12章 管理與統計 管理實務 量化與統計學的連結 貝氏定理(Bayesian Theorem) Z 檢定 費米估算(Fermi Estimation) 信賴區間 蒙地卡羅法 線性模型 探索式資料分析(EDA, Exploratory Data Analysis) 本章小結
第13章 各領域的資料分析 引導決策的指標 可信度 編碼 本章小結
▌第三部 管理實務
第14章 資料團隊 結果優先vs 流程優先 複雜度轉換:往下層移動 三種常見的資料團隊組織架構 資料團隊的發展 資訊的價值 向上管理vs 向上資訊管理 逆向工作 本章小結
第15章 變革管理 評估新技術 向上溝通:原理 向上溝通:從現在到未來 從想法到行動 本章小結
結語 寫給想要更懶惰的人 |
序
|