出版社:機械工業出版社 ISBN:9787111603702 商品編碼:1060018965 品牌:文軒 出版時間:2018-07-01 代碼:119 作者:韋斯·麥金尼(WesMcKinney)著徐敬
" 作 者:(美)韋斯·麥金尼(Wes McKinney) 著;徐敬一 譯 著 定 價:119 出 版 社:機械工業出版社 出版日期:2018年07月01日 頁 數:476 裝 幀:平裝 ISBN:9787111603702 ●前言1 章 準備工作7 1.1 本書內容7 1.1.1 什麼類型的數據7 1.2 為何利用Python進行數據分析8 1.2.1 Python作為膠水8 1.2.2 解決“雙語言”難題8 1.2.3 為何不使用Python9 1.3 重要的Python庫9 1.3.1 NumPy9 1.3.2 pandas10 1.3.3 matplotlib11 1.3.4 IPython與Jupyter11 1.3.5 SciPy12 1.3.6 scikit-learn12 1.3.7 statsmodels13 1.4 安裝與設置13 1.4.1 Windows14 1.4.2 Apple(OS X和macOS)14 1.4.3 GNU/Linux14 1.4.4 安裝及更新Python包15 1.4.5 Python 2和Python 316 1.4.6 集成開發環境和文本編輯器16 1.5 社區和會議17 1.6 快速瀏覽本書17 1.6.1 代碼示例18 1.6.2 示例數據18 1.6.3導入約定18 1.6.4術語19 第2章 Python語言基礎、IPython及Jupyter notebook20 2.1 Python解釋器21 2.2 IPython基礎22 2.2.1 運行IPython命令行22 2.2.2 運行 Jupyter notebook23 2.2.3 Tab補全25 2.2.4 內省27 2.2.5 %run命令28 2.2.6 執行剪貼板中的程序30 2.2.7 終端快捷鍵30 2.2.8 關於魔術命令31 2.2.9 matplotlib集成33 2.3 Python語言基礎34 2.3.1 語言語義34 2.3.2 標量類型42 2.3.3 控制流49 第3章 內建數據結構、函數及文件54 3.1 數據結構和序列54 3.1組54 3.1.2 列表57 3.1.3 內建序列函數61 3.1.4 字典64 3.1.5集合67 3.1.6 列表、集合和字典的推導式69 3.2 函數72 3.2.1 命名空間、作用域和本地函數72 3.2.2 返回多個值73 3.2.3 函數是對像74 3.2.4 匿名(Lambda)函數75 3.2.5 柯裡化:部分參數應用76 3.2.6 生成器77 3.2.7 錯誤和異常處理79 3.3 文件與操作繫統82 3.3.1 字節與Unicode文件85 3.4 本章小結86 第4章 NumPy基礎:數組與向量化計算87 4.1 NumPy ndarray:多維數組對像89 4.1.1 生成ndarray90 4.1.2 ndarray的數據類型92 4.1.3 NumPy數組算術94 4.1.4 基礎索引與切片95 4.1.5 布爾索引100 4.1.6 神奇索引103 4.1.7 數組轉置和換軸104 4.2 通用函數:快素數組函數106 4.3 使用數組進行面向數組編程109 4.3.1 將條件邏輯作為數組操作110 4.3.2 數學和統計方法111 4.3.3 布爾值數組的方法113 4.3.4 排序114 4.3.5 唯一值與其他集合邏輯115 4.4 使用數組進行文件輸入和輸出115 4.5 線性代數116 4.6 偽隨機數生成118 4.7 示例:隨機漫步120 4.7.1 一次性模擬多次隨機漫步121 4.8 本章小結122 第5章 pandas入門123 5.1 pandas數據結構介紹123 5.1.1 Series123 5.1.2 DataFrame128 5.1.3 索引對像134 5.2 基本功能135 …… 閱讀本書可以獲得關於在Python下操作、處理、清洗、規整數據集的完整說明。本書第2版針對Python3.6進行了更新,並增加了實際案例向你展示如何高效地解決一繫列數據分析問題。你將在閱讀過程中學習到新版本的pandas、NumPy、IPython和Jupyter。 (美)韋斯·麥金尼(Wes McKinney) 著;徐敬一 譯 著 韋斯·麥金尼是流行的Python開源數據分析庫pandas的創始人。他是一名活躍的演講者,也是Python數據社區和Apache軟件基金會的Python/C++開源開發者。目前他在紐約從事軟件架構師工作。 前言第2版新內容本書版出版於2012年,彼時基於Python的開源數據分析庫(例如pandas)仍然是一個發展迅速的新事物。在本次更新、拓展的第2版中,我在一些章節內進行了修改,以解釋過去5年中發生的不兼容的變更、棄用和一些新特性。此外,我還添加了新內容,用以介紹在2012年還不存在或者不成熟的工具。最後,我會避免把一些新興的或者不太可能走向成熟的開源項目寫入本書。我希望本版的讀者能夠發現本書內容在2020年或者2021年仍然幾乎像在2017年一樣適用。 第2版中的主要更新包括: 所有的代碼,包括把Python的教程更新到了Python 3.6版本(版中使用的是Python 2.7)更新了Python第三方發布版Anaconda和其他所需Python包的安裝指引更新pandas庫到2017年的近期新版新增一章,關於更多不錯pandas工具和一些使用提示新增statsmodels等
" |