今天要和大家推薦5本每個數據科學家都應該閱讀的書籍:
1. 《The Data Science Handbook》
這本書絕對應該放在每個數據科學家的書架上,它包含了對25位來自不同公司、行業和經驗水平的數據科學家的采訪。他們會給你一些寶貴的意見,告訴你如何長遠規劃自己的職業生涯,為哪家公司工作,如何保持學習,以及他們如何看待未來幾年這個領域的變化。這本書里還有很多很有價值的見解,尤其如果你是一個初學者。
建議你從書中找到一些些有趣的問題,然后在你真正想為之工作的公司工作的數據科學家提問,這樣你也可以得到不一樣的見解,但還是要根據你的實際情況而定。
2. 《面向數據科學家的實用統計學》
如果你有一定的技術背景,需要了解更多關于統計數據,或者你有一定的學術背景,掌握一定的統計相關的理論知識,但在實踐中并不常用,這本書將帶你過一遍統計的主要概念,如分布和機器學習,并向你展示如何使用Python,這是一本很好的中級水平的書,重點是應用,而不是理論。
我強烈建議你仔細閱讀這本書中的代碼,嘗試復制其中的一些代碼片段,并對它們進行調整,看看它們是如何運行的。
3. 《精通特征工程》
特征工程可以說是數據科學工作流程中最重要的步驟之一。一旦你對工作流程和主要算法有了良好的總體認識,你就應該開始提高你的功能工程技能。這基本上意味著要掌握許多不同的工具以及何時使用它們,這取決于你的數據和目標。
這本書很好地結合了理論、應用,我建議你一邊閱讀一邊做筆記,然后它放在身邊作為參考指南。
4. 《機器學習精講》
這是了解數學背后的主要ML算法最好的書籍之一,全書概念解釋清楚,介紹精簡,它應該是你開始機器學習之旅時首先要讀的書之一,尤其是當你已經有一定數學基礎的時候。如果你真的想詳細研究這本書,我建議你嘗試用自己熟悉的編程語言來實現其中的算法,從而幫助自己鞏固知識。
5. 《貝葉斯思維》
一旦你開始學習統計學,你就會經常讀到貝葉斯和某些貝葉斯算法,如果你不知道這兩種方法的區別,一旦你理解了這種區別,學習貝葉斯統計就會非常有用,以便掌握貝葉斯算法并將其添加到你的工具庫當中去,我特別推薦這本書,如果你有統計學背景,但之前從未詳細學習過貝葉斯方法,它沒有深入這個主題,但它已經足夠讓你在Python中使用貝葉斯統計。
原文地址:https://mp.weixin.qq.com/s?__biz=MzA5NDMzOTExMw==&mid=2455359691&idx=2&sn=e9513b29e92dc7929c2607f1918c5d94&chksm=87fd598db08ad09b276a4e1a34270ef4e704dd290af8f3e8798f705215fa80d2cf4a83779474&mpshare=1&s