去年,資料分析媒體 KDnuggets 為讀者提供許多學習資料分析的免費電子書單,2021 年 KDnuggets 同樣精選 15 本與數據科學、資料分析和機器學習有關的電子書清單。想要在今年規劃一些讀書計畫的工程師們,不妨從中挑選幾本不錯、符合自己需求的電子書吧!
1.《Data Science and Machine Learning: Mathematical and Statistical Methods》
這本書走的是實用路線,將重點放在資料科學和 Python 的運用來實踐機器學習模型;同時,這本書也將許多理論以清楚、易懂的方式說明,也會適時地融入一些數學來幫助理解,作為實務路線的書籍,算是讀起來非常舒適。
2.《Welcome to Text Mining with R》
這本書清楚地解釋了 R 語言的概念,從書名大概就可以理解。《Welcome to Text Mining with R》將重點放在 R 語言的資料探勘實際運用,對於新手來說,這本書可以幫助你理解如何利用 R 語言中各式套件進行文字、資料探勘。
3.《Causal Inference: What If》
這本書探討的主題是讓許多人都非常頭痛的因果推理。近期因果推理在人工智慧研究社群中也有相當高的討論熱門度,作者嘗試用他們認為最重要的基本概念濃縮出約 300 頁的文字。
坊間很少有專門針對這個主題的書籍,所以如果是想特別針對這塊領域加強基礎概念的人,這本書絕對是不二首選。
4.《Statistics with Julia: Fundamentals for Data Science, Machine Learning and Artificial Intelligence》
這本書將 Julia 和統計的概念融入進章節,從信賴區間、統計推斷、假設考驗乃至於線性回歸與機器學習,這些概念都相互關連,透過這本電子書,將可以更有效率地用 Julia 來學習資料科學。
5.《Foundations of Data Science》
在當代的許多書籍裡,資料科學常常被簡化為一系列編寫程式的工具,好像只要掌握了這些工具,就能夠完成資料分析,但卻鮮少討論那些除了編寫程式以外的基本概念和理論。
這本書就是針對上述的問題,把從事資料科學必須擁有的理論知識進行整理,可以做為新手、初學者們奠定紮實資料科學基礎的入門書籍。
6.《Understanding Machine Learning: From Theory to Algorithms》
要徹底地了解機器學習,這本書用有系統的方式介紹了機器學習及它提供的算法範例。適合喜歡靠數學理解,覺得抽象思考太不具體的人。
對於機器學習的基礎知識,這本書爬梳其原理後轉化為實用的數學推導來進行解釋,除了介紹基礎知識外,它也涵蓋了過往教科書並未涉及到的各種主題,包含討論機器學習的計算複雜性及穩定性概念,演算法則包含隨機梯度下降、類神經網路和結構畫輸出學習等。
7.《Natural Language Processing with Python》
本書花滿多篇幅來講解 NLP,包含如何用 Python 來寫 NLP,或是用自然語言來處理等等。文本分類、資訊過濾和詞幹提取等都被認為是經典的 NLP 主題。
掌握了 NLP 的基礎知識之後,就可以繼續用更現代和前沿的技術諸如史丹佛大學一些開放式課程之類的材料來進行練習。
8.《Deep Learning for Coders with fastai and PyTorch: AI Applications Without a PhD》
這本書透過真實案例來講述書中幾乎所有內容,這本書用循序漸進的方式描述這些案例,並且以此衍生該如何使自己的程式撰寫越來越好。
這意味著你可以一邊閱讀一邊逐步學習所需的所有理論基礎,進而了解其重要性和使用方式。作者花了多年的時間建立一套有系統的教學方法,使以前複雜的主題變得淺顯易懂。
9.《Python For Everybody》
從這本書在 Amazon 的 1514 個評分(平均評分為 4.6,滿分 5 分)來看,應該不難發現它的受歡迎程度,許多人都知道 Python for Everybody 的優點。簡單地說,這本書很快地涵蓋了 Python 學習上會遇到的基本概念,同時,作者又用一種更平易近人、易於理解的方式進行講解,並且在所有概念上都可以很快速地在書中找到對應的頁數。
10.《Automated Machine Learning: Methods, Systems, Challenges》
如果你對於自動化機器學習幾乎可以說是一無所知,不用擔心,這本書首先對這個主題進行了紮實的介紹,並逐章明確列出內容,這在由獨立的單獨章節組成的書中是很重要的。
在本書的一開始就單刀直入地切進有關現代自動化機器學習的重要主題,接下來再針對這些工具中的六種演練實現自動化機器學習相關概念。最後一部分則是對 2015 年至 2018 年間存在多年的自動化機器學習挑戰系列進行分析。
11.《Deep Learning》
這是來自麻省理工學院,提供給學生和相關從業人員能更快速、全面地進入機器學習領域而設計的電子教科書。它不算是一本充滿程式碼和對應解釋的書,也不是一本關於神經網絡的觀念概述,而是從數學來深入解釋深度學習這個領域。
12.《Dive Into Deep Learning》,作者:Aston Zhang, Zachary C. Lipton, Mu Li and Alexander J. Smola
深入研究深度學習(D2K)的獨特之處在於,我們走了“邊做邊學”的思想,即整本書本身都包含可運行的代碼。我們試圖將教科書的最佳方面(清晰度和數學)與動手教程的最佳方面(實踐技能,參考代碼,實現技巧和直覺)結合起來。每章的每一節都通過多種方式,交織的散文,數學和一個自包含的實現教您一個關鍵思想,可以輕鬆地抓取和修改該實現以使您的項目有個良好的開端。我們認為這種方法對於教授深度學習至關重要,因為深度學習中的很多核心知識都來自實驗
13.《Mathematics for Machine Learning》
來自劍橋大學 2020 年出版的機器學習數學教科書,本書的第一部分從純數學概念角度切入,並沒有講到機器學習。第二部分才將注意力轉至這些新發現的數學技能,如何將其應用於機器學習問題。
你可以根據自己的需求,決定要用什麼樣的方法來學習機器學習和相關基礎數學觀念,也可以只選用其中一部份做為學習重點。
14.《The Elements of Statistical Learning》
這本書一直被公認是機器學習領域中的經典教材,在機器學習、統計推理和模式識別領域都非常具有影響力。2019 年也有了中文翻譯,是一本非常值得拿來學習的機器學習教科書。
15.《An Introduction to Statistical Learning, with Applications in R》
同樣來自史丹佛統計學著名教授 Trevor Hastie 和 Robert Tibshirani 所撰,也是一本非常好用的統計學習方法入門學習書籍。
書中包含一系列 R 語言應用工具,與前一本《The Elements of Statistical Learning》最大的不同之處在於,除了兩者所涉及的內容的深度不同之外,這本書亦將這些主題與程式語言編寫上的實際實現(在本書中為 R 語言)一起引入、融會貫通。
參考資料
(本文提供合作夥伴轉載;首圖來源:pixabay CC Licensed。)
延伸閱讀
- 【我媽問我為什麼跪著】看過來!數據分析師的履歷這樣寫才吸睛
- 給 Python 初學者的 11 道練習題,讓你由淺入深掌握 coding 技術!
- 沒有相關工作經驗,要如何取得數據分析師的 offer?
- 想當數據分析師?你可以先去考這 6 個證書