●Contents
章編程語言 001
節Python 語言 002
第二節R 013
第三節SQL 023
第四節Git 027
第王節Shel1 031
第二章數據分析 041
第節NumPy 042
第二節Scipy Basics 045
第三節Pandas 050
第四節數據清洗 059
第五節StatsModels 063
第三章數學統計理論 068
第節概率 069
第二節統計 074
第三節矩陣微分 079
第四節線性代數 084
第五節圖模型 091
第六節凸優化 095
第四章撤據可視化 106
節Matplotlib 107
第二節Seabom 111
第三節Basemap 115
第五章機器學習 119
節特征工程 120
第二節機器學習建模 125
第三節Scikit-learn 135
第四節PyTorch 141
第六章圄像處理 149
節基本概念 150
第二節像素的空間關繫 151
第三節圖像增強 152
第四節圖像變換 156
第五節圖像恢復 157
第六節圖像分割 157
第七節圖像編碼 158
第七章分布式計算 159
節Haoop 160
第二節spark 166
內容簡介
數據科學是一門新興的交叉學科.數據科學人纔需要同時具備理論性、實踐性和應用性等多方面的素質.數據科學的知識點涵蓋了編程語言、數學基礎、數據清洗、數據可視化、數據分析和分布式計算等.為了幫助數據科學從業人員快速地查閱這些知識和工具的使用,提高實踐效率,本書對數據科學的相關知識進行了歸納整理,形成數十份速查表.
靠前章編程語言
Python是一種面向對像、動態數據類型的解釋型語言,是數據分析師/數據科學家優選編程語言之一.
R 屬於GNU 繫統,是一個自由、免費、源代碼開放的軟件,主要用於統計分析、繪圖、數據挖掘,另外R 在可視化方面也十分出色
SQ 是Structured Query angu唔e(結構化查詢語言)的縮寫.SQ 是專為數據庫而建立的操作命令集, 是一種功能齊全的數據庫語言. 在使用它時,隻需要發出"做什麼"的命令, " 怎麼做"是不用使用者考慮的SQ 功能強大、簡單易學、使用方便,巴經成為數據庫操作的基礎,並且現在幾乎所有的數據庫均支持SQ.
&n......
"