作 者:朱雪寧 等 著
定 價:59
出 版 社:北京大學出版社
出版日期:2021年08月01日
頁 數:192
裝 幀:平裝
ISBN:9787301323427
1.從R語言的下載與安裝講起,真正實現零基礎學習統計分析。2.詳細介紹R 語言中數據管理及預處理操作方法,輔以大量有梗有趣的實例,講解深入淺出,通俗易懂,富有趣味性。3.從數據選擇、數據清洗、數據處理到數據可視化,全流程專業講解,挖掘主流算法與模型,解決實際問題,理論基礎與實用性並重。4.每章設有課後習題,學習鞏固兩不誤;詳細答案講解,解決學習路上的所有疑惑。5.超完整數據打包文件、課程講解PPT課件、軟件包、案例代碼,“保姆式”服務,全方位為讀者學習保駕護航。
●統計分析與R語言
1.1 統計分析簡介
1.1.1 了解數據及業務問題
1.1.2 數據清洗與預處理
1.1.3 數據描述及探索性分析
1.1.4 模型構建及解讀
1.2 R語言簡介
1.2.1 為何要使用R語言
1.2.2 R語言的下載與安裝
1.2.3 R語言的使用
1.2.4 工具包
1.3 本章小結
1.4 本章習題
R 語言中的數據管理及預處理
2.1 基本數據類型
2.1.1 數值型
2.1.2 字符型
2.1.3 邏輯型
2.1.4 因子型
2.1.5 時間型
2.2 數據結構
2.2.1 向量
2.2.2 矩陣
2.2.3 數組
2.2.4 數據框
2.2.5 列表
2.3 數據的讀入及寫出
2.3.1 直接輸入數據
2.3.2 從帶分隔符的文本文件中導入數據
2.3.3 導入Excel 數據
2.3.4 逐行讀入數據
2.3.5 數據的寫出
2.4 數據集管理及預處理
2.4.1 了解數據概況
2.4.2 變量類型轉換
2.4.3 時間型數據的操作
2.4.4 數據集合並
2.4.5 數據缺失、異常
2.5 本章小結
2.6 本章習題
基本統計分析
3.1 基本描述統計量
3.1.1 頻數統計
3.1.2 均值
3.1.3 分位數
3.1.4 方差、標準差
3.1.5 協方差與相關繫數
3.1.6 優選值、最小值
3.1.7 峰度和偏度
3.2 彙總分析
3.2.1 交叉列聯表
3.2.2 描述統計量的分組統計
3.3 本章小結
3.4 本章習題
數據描述與可視化
4.1 統計表格
4.1.1 變量說明表
4.1.2 分組統計表
4.2 數據可視化基礎
4.2.1 統計圖形
4.2.2 柱狀圖
4.2.3 餅圖
4.2.4 直方圖
4.2.5 折線圖
4.2.6 箱線圖
4.2.7 散點圖
4.2.8 相關繫數圖
4.3 數據可視化進階
4.3.1 ggplot2 包
4.3.2 交互可視化
4.4 本章小結
4.5 本章習題
參數估計與假設檢驗
5.1 總體、樣本和樣本量
5.1.1 總體
5.1.2 樣本
5.1.3 統計量
5.2 參數估計
5.2.1 矩估計
5.2.2 優選似然估計
5.2.3 區間估計
5.3 假設檢驗
5.3.1 假設檢驗的基本步驟
5.3.2 假設檢驗的p 值
5.3.3 假設檢驗問題的基本類型
5.3.4 正態總體的假設檢驗
5.4 單因素方差分析
5.4.1 單因素方差分析的基本思路
5.4.2 實例分析
5.5 本章小結
5.6 本章習題
線性回歸
6.1 模型形式
6.2 模型理解
6.2.1 回歸繫數的理解
6.2.2 定性變量轉換及回歸繫數理解
6.2.3 交互項的解讀
6.2.4 σ2 的理解
6.3 基本假定
6.4 回歸參數的估計
6.4.1 普通最小二乘估計
6.4.2 優選似然估計
6.5 假設檢驗
6.5.1 回歸繫數的t 檢驗
6.5.2 回歸方程的F 檢驗
6.6 模型評價
6.7 回歸診斷
6.7.1 異方差
6.7.2 強影響點
6.7.3 多重共線性
6.7.4 正態性
6.8 變量選擇
6.8.1 逐步回歸法
6.8.2 信息準則
6.9 模型實現
6.9.1 R語言中的基本函數
6.9.2 實例分析
6.10 小結
6.11 本章習題
邏輯回歸
7.1 模型形式
7.2 模型估計
7.2.1 參數估計
7.3 模型評價
7.3.1 準確率、準確率及召回率
7.3.2 ROC 曲線和AUC值
7.4 實例分析
7.5 本章小結
7.6 本章習題
降維分析
8.1 主成分分析
8.1.1 主成分分析原理
8.1.2 主成分個數選擇
8.1.3 樣本的主成分及主成分得分
8.1.4 R語言中的主成分分析
8.2 因子分析
8.2.1 正交因子模型
8.2.2 模型估計
8.2.3 因子得分
8.2.4 因子分析和主成分分析的異同
8.2 因子分析
8.2.1 正交因子模型
8.2.2 模型估計
8.3 小結
8.4 本章習題
本書圍繞經典的統計方法與R語言工具,從基本的統計描述分析方法出發,講解了參數估計與假設檢驗、線性回歸、邏輯回歸、降維分析方法,每一章重點介紹一種經典方法或統計模型,對其基本定義、模型形式、統計方法的推導與解讀等都給出了細致的講解。此外,為了將理論與實踐緊密結合,本書每一章均提供了不同業務場景下的R語言編程實例,幫助讀者練習鞏固。本書適合相關學科本科生及研究生,以及對數據分析及建模感興趣的讀者。
朱雪寧 等 著
朱雪寧,復旦大學大數據學院副教授。2017年獲得北京大學光華管理學院商務統計與經濟計量繫博士學位,入選2019年度上海市青年科技英纔揚帆計劃,主持並參與多項國家自然科學基金。主要研究領域為網絡數據分析及商務統計應用等,在國內外期刊發表論文二十餘篇,著有《R語言:從數據思維到數據實戰》。任怡萌,倫敦政治經濟學院博士張桂維,復旦大學大數據學院碩士米汶權,復旦大學大數據學院碩士