新書推薦:

《
容易受傷不是錯:建立專屬於你的安全基地,不受他人評價左右的幸福人生
》
售價:HK$
103.9

《
萬能鑰匙:世界最神奇的24堂課
》
售價:HK$
83.1

《
美女保健室:胡心瀕的全方位中醫調理
》
售價:HK$
95.0

《
聽風的歌(創作40周年紀念新版)
》
售價:HK$
74.2

《
圖解RPA機器人流程自動化入門:10堂基礎課程+第一線導入實證,從資料到資訊、從人工操作到數位勞動力,智慧化新技術的原理機制、運作管理、效益法則
》
售價:HK$
148.1

《
爆笑娘的厭世育兒日誌:你家的豬隊友會比我的神嗎.
》
售價:HK$
118.5

《
聰明人都實踐的輸出力法則:用1% 投入做到99.9%產出,徹底翻轉工作與人生
》
售價:HK$
103.9

《
木構造全書:世界頂尖日本木構造權威40年理論與實務集大成
》
售價:HK$
890.6
|
內容簡介: |
需要處理大量資料的人必備的案頭書
對於許多研究人員來說,Python是首選的工具,因為它擁有豐富的儲存、操作、以及洞察資料的程式庫。這些資源散布在資料科學的領域中,但藉由本書,你可以一口氣取得這些資源,包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn等等。
對於需要處理大量資料的人而言,這是一本非常有價值的案頭書,可以有效率地處理每天面對的問題,像是操作、轉換,以及清理資料、視覺化不同形式的資料,建立統計學或機器學習的模型等等。
藉由這本手冊,你將可以學習到如何使用:
.IPython和Jupyter:提供資料科學家使用的Python計算環境。
.NumPy:在Python中進行高效儲存以及操作密集資料陣列的ndarrys。
.Pandas:在Python中進行對於標籤式欄位式的資料高效率儲存與操作。
.Matplotlib:在Python中進行彈性範圍的資料視覺化的能力。
.Scikit-Learn:提供機器學習演算法以及簡潔的Python實作。
名人推薦:
”如果你想要藉由Python學習資料科學,本書是一個極佳的起點。我用來教授電腦科學以及統計學獲得極大的成功。Jake在這些開放源碼的工具上的基礎上更進一步;使用了清晰的語言以及易懂的解釋闡述資料科學基礎的概念、範式、以及抽象的內容。“--BrianGranger,Jupyter計畫聯合創始人
|
關於作者: |
JakeVanderPlas
Python科學端的長期使用者以及開發者,目前是一位在Washington大學跨學科資料科學研究者。他主導自己的天文學研究,而且也會為來自於廣泛領域的本地科學家提供建議以及接受諮詢。
|
目錄:
|
第一章IPython:更好用的Python
Shell還是Notebook
IPython的求助與說明文件
在IPythonShell中的快捷鍵
IPython的Magic命令
輸入和輸出的歷程
IPython和Shell命令
和Shell相關的Magic命令
錯誤以及除錯
剖析和測定程式碼的時間
第二章NumPy介紹
瞭解Python的資料型態
NumPy陣列基礎
NumPy陣列屬性
陣列索引:存取單一個陣列元素
在NumPy陣列中的計算:UniversalFunctions
聚合操作:Min、Max、以及兩者間的所有事
在陣列上的計算:Broadcasting
比較、遮罩以及布林邏輯
Fancy索引
排序陣列
結構化的資料:NumPy的結構化陣列
更多進階的複合型態
第三章使用Pandas操作資料
安裝並使用Pandas
Pandas物件的介紹
資料的索引和選擇
在Pandas中操作資料
處理缺失資料
階層式索引
資料集的合併:Concat和Append
合併資料集:Merge以及Join
聚合計算與分組
樞紐分析表
向量化字串操作
使用時間系列
高效率Pandas:eval以及query
第四章使用Matplotlib進行視覺化
通用的Matplotlib技巧
買一送一的介面
簡單的線條圖形
簡單的散佈圖
視覺化誤差
密度圖和等高線圖
直方圖、分箱法及密度
自訂圖表的圖例
自訂色彩條
多重子圖表
文字和註解
自訂刻度
客製化Matplotlib:系統配置和樣式表
在Matplotlib中的三維繪圖法
Basemap的地理資料
使用Seaborn進行視覺化
第五章機器學習
什麼是機器學習?
Scikit-Learn簡介
超參數以及模型驗證
特徵工程
深入探究:NaiveBayesClassification
深入探究:線性迴歸(LinearRegression)
深入探究:SupportVectorMachines
深入探究:決策樹(DecisionTree)和隨機森林(RandomForest)
深入探究:主成份分析(PrincipalComponentAnalysis)
深入探究:流形學習(ManifoldLearning)
深入探究:k-平均集群法
深入探究:高斯混合模型(GaussianMixtureModels)
深入探究:核密度估計(KernelDensityEstimation)
應用:臉部辨識的管線
|
|