第1章 數據概述 001 1.1 數字化社會與數據思維 002 1.1.1 數字的社會早已到來 002 1.1.2 人人都該提升數據素養 004 1.1.3 化無形為有形,化抽象為具體 006 1.2 數據的含義與類型劃分 007 1.2.1 數據的狹義含義 007 1.2.2 數據的廣義含義 009 1.2.3 數據類型的劃分 010 1.3 人工智能與數據 011 1.3.1 新時代的金礦——數據 011 1.3.2 將數據轉化為洞見 012 1.3.3 警惕選擇偏見與數據偏見 013 第2章 隨機世界中的數據規律 016 2.1 隨機現象 017 2.1.1 生活中的隨機現象 017 2.1.2 隨機試驗 019 2.2 隨機變量與數據中的隨機 024 2.2.1 隨機變量及其分布 024 2.2.2 數據中的隨機性 028 2.3 數據的形態與中心極限定理 030 2.3.1 正態分布 030 2.3.2 中心極限定理 033 第3章 數據收集與整理 036 3.1 如何獲取數據 037 3.1.1 獲取一手數據 037 3.1.2 獲取二手數據 048 3.2 “二維”視角看數據 054 3.2.1 二維表 054 3.2.2 二維表的基本操作 059 3.3 如何清洗數據 063 3.3.1 數據的格式化與結構化 064 3.3.2 缺失值與異常值 066 第4章 數據的描述與可視化 070 4.1 數據的集中、離中趨勢 071 4.1.1 數據的集中趨勢 071 4.1.2 數據的離中趨勢 075 4.2 數據的變換 077 4.2.1 數據的無量綱化 077 4.2.2 連續型變量的變換 080 4.2.3 類別特征的變換 083 4.3 數據的可視化 084 4.3.1 科學繪圖 084 4.3.2 可視化的重要性 096 4.3.3 數據形態看數據 104 第5章 特征的構建與關聯 112 5.1 特征的創建與選取 113 5.1.1 特征的創建 113 5.1.2 與時俱進選取指標 115 5.2 特征的擴充與降維分析 117 5.2.1 特征的擴充 117 5.2.2 降維分析 121 5.3 特征間的關系 126 5.3.1 相關≠因果 126 5.3.2 相關系數 128 5.3.3 從相關到回歸 132 第6章 非結構化數據的結構化 141 6.1 用“二維表”的結構理解數據 142 6.2 圖像即矩陣 145 6.2.1 用矩陣視角打開圖像 145 6.2.2 圖像特征的處理 150 6.3 文本的向量之路 156 6.3.1 文本的分詞、清洗與整理 156 6.3.2 從句子到向量的詞袋模型 167 6.3.3 Word2Vec讓詞語變向量 171 第7章 無數據,不課堂 176 7.1 數據與算法,打開另一扇窗 177 7.1.1 語文——水滸傳 177 7.1.2 物理——伏安法測電阻 178 7.1.3 生物——鳶尾花分類 180 7.2 可視化,讓內容更加圖強 183 7.2.1 數學——二次函數性質分析 183 7.2.2 英語——I have a dream 185 7.2.3 化學——繪制元素周期表 186 7.2.4 歷史——中國歷史人口數據可視化 189 7.2.5 地理——衛星影像圖 193 附錄 196 附錄一 抽樣分布與參數估計 197 附錄二 假設檢驗 208 附錄三 騰訊扣叮Python實驗室:Jupyter Lab使用說明 214
ISBN:978-7-122-43497-5
語種:漢文
開本:32
出版時間:2023-09-01
裝幀:平
頁數:222