【為什麼我們要挑選這篇文章】自學機器學習的工程師們沒有博士學位的光環,他們該如何在面試中脫穎而出?履歷怎麼寫?什麼又是企業真正在乎的重點項目?(責任編輯:陳伯安)
「《科技報橘》徵才中!跟我們一起定位台灣產業創新力 >> 詳細職缺訊息
快將你的履歷自傳寄至 jobs@fusionmedium.com」
本文經 AI 新媒體量子位(公眾號 ID:QbitAI)授權轉載,轉載請聯繫出處
作者:量子位/栗子
做機器學習工程師,通常都要讀過博士。
即便沒有寫成職位的必要條件,卻也慢慢變成了自然規律。
那自學成才的人類,要寫怎樣的經歷,才能讓面試官相信,自己也是有同等能力的呢?
一個叫做 AdditionalWay 的網友,在 Reddit 提出了這個直擊靈魂的問題,引發了大量討論,兩天熱度已經超過 500。
討論版上,有許多人提出了中肯的建議:
99% ML 博士生有個致命弱點
有位叫做 po-handz 的網友,他發表的意見收穫了 80 分的高度認可,佔據了評論區的頂樓:
把自己的項目投入生產環節(launch into production),就能超越 99% 的應屆生,也能超越大部分在位的 ML 工程師了。
對此,有人 (moravak) 表達了強烈贊同:
這個「大部分」,其實就是 ≥99.9%。
頂樓又補充說,很多人就算讀到博士畢業,可能也沒有自己把一個項目做到生產環節的經驗。
那麼,怎樣才算有這樣的經歷呢?
沒有讀博士的你,唯一優勢就在「業界經驗」
網友(BernieFeynman)簡約地解釋了一下:
搭些模型,不用非常厲害。但要讓人能看到,模型在哪跑起來的樣子,比如有個 API 可以調用之類的。
當然,做起來並不是一句話的事,頂樓詳細描述了,一整個過程究竟能有多難:
比如,一般你不會只有一個模型,是有一組。所以,需要讓這些大模型,加載在服務器的 RAM 上。
還要接受新輸入的數據。這些數據,要和測試數據的格式保持一致,還要 scale,該怎麼 scale 呢?
推理要用 GPU 麼?那樣的話在 AWS 上每月可能要花 1000 人民幣(約 5000 台幣),預算能支持麼?
時序數據怎麼辦呢?你需要一個連續更新的模型,還要一直跟蹤調整參數。
除此之外,你需要一個實時的、可維護的數據管道(data pipeline)。搞這個,比處理一個清晰乾淨的數據集要難多了。
最後的最後,你還需要一整套 UI,網站,nginx 推疊,要做成用戶友善的樣子。
別說是剛畢業的博士,許多有經驗的數據科學家也對這些東西一竅不通,因為他們可能只在自己專業的領域里工作,都是別人把乾淨的數據集交到他們手上。
你如果在這點上打贏他們,對企業來說就有更高的價值了。
機器學習是 2019 熱門題目,那 2030 機器學習可能變什麼樣子?
8/10(六)【TechOrange 科技報橘 2019 年度論壇】CONNECT to the Future,帶你看見 2030 年最重要科技趨勢
一人早鳥 75 折、雙人早鳥 6 折優惠票 全面開賣 !
ML 工程師履歷,千萬注意這十大雷區
訓練實用技能,只是一方面。
如果不想在履歷篩選環節見光死,網友(rudiXOR) 在一家「正在招聘 ML 工程師的中型企業」,總結了十大雷區,供大家參考:
第一,拿著一大堆 MOOC 證書。沒用,我試過,quiz 一路點下去誰都做得到。
第二,對 Kaggle 成績過於自豪。許多大學生都參加過 Kaggle 比賽,他們也知道這種比賽和 ML 工程師的工作,基本沒什麼共同點。
第三,去了 3 個月訓練營,從 PCA 到 LSTM,幾乎所有 ML 技術都修煉到了。真的沒人相信。
第四,GitHub 項目都是只提交過一次程式碼的那種。根本看不出是不是自己做的。
第五,GitHub 主頁是新的,一個項目都沒有。
第六,模型只在 toy datasets 上測試過,沒有再嚴肅點的項目了。
第七,每種語言都說「精通」。比如 C++、Python、Java、C#……
第八,對照職位要求精心匹配履歷(「Buzzword optimization for HR algorithms」。
第九,沒有證明自己的數學 / 統計學知識水平。
第十,沒有軟體開發的經歷。
就算前九條你都忘了,也可以嚴肅地參考第十條。網友在細數了雷區之後強調:
如果你是自學的,不要一上來就投數據科學家,或者 ML 工程師。
可以先申請數據分析師,或者軟體工程師。
如果是自學 ML,又沒有軟體開發的經歷,我是不會請你的。
參考前文,如果沒有讀過博士,就要比博士多點業界的經驗才更有利。
不過,自學什麼時候都不晚。
比如,谷歌大腦的研究員 David Ha,在投入機器學習的懷抱之前,已經做到高盛的董事總經理(MD) 了。
那麼,各位也要加油啊。
(本文經 AI 新媒體 量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈自学机器学习,怎么才能找到工作啊?至少要避开十大雷区 | Reddit 高热 〉,首圖來源:unsplash, CC Licensed。)
延伸閱讀
工程師好用資源來了!超完整 Python 查詢表,程式碼複製貼上不用自己寫
AI 工程師最佳入門資源!史丹佛公布「自然語言理解」免費課程,新手們趕快存起來
衝上 GitHub 熱門第四名!Python 機器學習最強教學資源,新手工程師快存起來
【科技報橘 2019 年度論壇】CONNECT to the Future 早鳥售票中!
2030 年全球進入一個由科技主導發展的世界局勢,而台灣無法置身事外。
儘早抓穩世界科技趨勢,儲備十年 AI、能源與製造的科技戰力,才是台灣小國大戰略的重要核心。
8/10(六)【TechOrange 科技報橘 2019 年度論壇】CONNECT to the Future,帶你破解 2030 產業趨勢。 手刀購票 >>> 一人早鳥 75 折、雙人早鳥 6 折優惠票全面開賣!