【為什麼我們要挑選這篇文章】對一個不時需要加班的上班族來說,實在沒時間上課取得機器學習相關經歷。這些人通常在家自學、看書、看影片,但卻不一定有效。
一位 22 歲數據科學家從零開始自學,他最推薦哪些學習資源?新手趕快存起來!(責任編輯:陳伯安)
「《科技報橘》徵才中!跟我們一起定位台灣產業創新力 >> 詳細職缺訊息
快將你的履歷自傳寄至 jobs@fusionmedium.com」
本文經 AI 新媒體量子位(公眾號 ID:QbitAI)授權轉載,轉載請聯繫出處
作者:量子位/曉查
厭倦了現在的工作,想轉行做數據科學,但是卻沒有電腦專業的相關學歷,應該怎樣才能入門?
這類的教程已經有很多。最近一位 22 歲的數據科學家 Dario,以自學經歷中用到的資源告訴你,如何從零開始學習數據科學。
所謂從零開始自學,是針對那些可以自主學習在線課程和閱讀書籍,卻沒有上班之餘接受課堂教育的人士。
在學習之前,如果你對線性代數、微積分、概率論與統計學、程式設計都不太熟悉,Dario 建議先去學習一下這幾門數學課程,然後再學習 Python。
在學完以上內容後可以進入下面的學習。
你該看書還是看影片?
如果想進入數據科學領域,每天一兩個小時的學習是必不可少的,是看書還是選擇看影片?
很多人都不想在每天工作 8 小時後還看書,因此影片教程是個不錯的選擇,而且可以在通勤路上觀看。
Dario 首先推薦的是 Udemy 的《數據科學與機器學習 Python 訓練營》,這是他第一次接觸數據科學的時候學習的課程。
課程中用 Pandas 和 Numpy 進行數據分析,並用 Matplotlib 和 Seaborn 進行一些數據可視化。雖然內容不多也不深入,但已經足夠入門數據科學了。
Dario 還推薦了 Coursera 上由吳恩達主講的《機器學習》課程,學習時長大概十多個星期。課程以英文講述,但是提供中文字幕。
這門課程的質量絕對有保障,大約 12 萬名用戶平均評分為 4.9(滿分 5),人氣也超高,共有 260 多萬用戶註冊。
推薦三本機器學習入門必看書
如果你更喜歡讀書,Dario 還推薦了 3 本入門數據科學的優秀教材。
第一本是《Python 數據科學手冊》。這本書從 Jupyter Notebook 入手,內容涵蓋了 Numpy、Pandas,、Matplotlib 和 Scikit-Learn 等數據科學中最重要的部分。
該書的中文版去年已經出版,網上評分 9.3,網友都說這是本優秀的入門級教材,非常適合非電腦專業的學生。
輕鬆 KO 機器學習企業導入難題!
11/27《AWS Innovate 2019》,技術問題一次破解
《馬上報名》
第二本是《統計學習導論》,它的內容會有點數學,但是也很容易閱讀。
對於機器學習這樣一個廣泛的領域,這本書能將篇幅控制在 400 頁左右很不容易。唯一的缺點是程式碼是用 R 語言而不是 Python 編寫的。
這本書的 英文版提供免費下載 ,評分為 9.5 分,中文版 8.3 分。
第三本是《Scikit-Learn 與 TensorFlow 機器學習實用指南》,這本書能幫助你深入瞭解機器學習的概念和演算法。目前,該書的英文影印版和中文版都已經出版。
課程結束後,去 GitHub 找個數據集練練吧
學完所有課程後,Dario 建議初學者建立一個 GitHub 存檔,並尋找 5 個數據集來練手,在這個過程中寫出自己的結論和思考過程。
對於你未來要投遞的公司來說,讓他們看到你的工作很重要。因為你沒有相關學位,因此需要以某種方式展示自己在數據科學中的工作,而 GitHub 是一個不錯的選擇。
好資源傳送門
下載《An Introduction to Statistical Learning》
(本文經 AI 新媒體 量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈95 后数据科学家教你从零自学机器学习,这有 3 本入门必看书籍 〉,首圖來源:Pixabay, CC Licensed。)
你可能感興趣
【GitHub 年度報告】JavaScript 登最熱門程式語言,Python 首次擊敗 Java 當第二
衝上 GitHub 熱門第四名!Python 機器學習最強教學資源,新手工程師快存起來
最新「數據科學」自學清單:六個月無師自通,菜鳥新手趕快存起來
【12 點真心建議】這位機器學習工程師在入職一年後,寫了這封信給初學者
輕鬆 KO 混合雲搬遷難題!
AWS 年度雲端技術精華統整馬上報名 11/27《AWS Innovate 2019》
破解企業常見的 IT 技術坎