培訓(xùn)內(nèi)容:
第一講 數(shù)據(jù)挖掘,Python和R簡(jiǎn)介
1.1數(shù)據(jù)挖掘
1.*****on語言
1.3 R語言
1.4 Iris數(shù)據(jù)集
1.5 Bodyfat數(shù)據(jù)集
第二講 數(shù)據(jù)的導(dǎo)入與導(dǎo)出
2.1 R數(shù)據(jù)的保存與加載
2.2 CSV文件的導(dǎo)入與導(dǎo)出
2.3 通過ODBC從數(shù)據(jù)庫(kù)中讀取數(shù)據(jù)
2.4 從Excel中導(dǎo)入與導(dǎo)出數(shù)據(jù)
2.5 Python的數(shù)據(jù)操作
第三講 數(shù)據(jù)可視化展現(xiàn)
3.1 查看數(shù)據(jù)
3.2 單個(gè)變量展現(xiàn)
3.3 多個(gè)變量展現(xiàn)
3.4 更多探索
3.5 將圖表保存到文件中
第四講 決策樹與隨機(jī)森林
4.1 使用party包構(gòu)建決策樹
4.2 使用rpart包構(gòu)建決策樹
4.3 隨機(jī)森林
4.4 Python中的決策樹實(shí)現(xiàn)
4.5 Python決策樹實(shí)例
第五講 回歸分析
5.1 線性回歸
5.2 邏輯回歸
5.3 廣義線性回歸
5.4 非線性回歸
5.5 Python中的回歸實(shí)現(xiàn)
5.6 Python回歸實(shí)例
第六講 聚類分析
6.1 k-means聚類
6.2 k-medoids聚類
6.3 層次聚類
6.4 基于密度的聚類
6.5 Python中的聚類實(shí)現(xiàn)
6.6 Python聚類實(shí)例
第七講 離群點(diǎn)檢測(cè)
7.1單變量的離群點(diǎn)檢測(cè)
7.2局部離群點(diǎn)因子檢測(cè)
7.3用聚類方法進(jìn)行離群點(diǎn)檢測(cè)
7.4時(shí)間序列數(shù)據(jù)的離群點(diǎn)檢測(cè)
7.5 Python中的孤立點(diǎn)實(shí)例
第八講 時(shí)間序列分析
8.1 R中的時(shí)間序列數(shù)據(jù)
8.2 時(shí)間序列分解
8.3 時(shí)間序列預(yù)測(cè)
8.4 時(shí)間序列聚類
8.5 時(shí)間序列分類
8.6 Python中的時(shí)間序列實(shí)例
第九講 關(guān)聯(lián)規(guī)則
9.1 關(guān)聯(lián)規(guī)則的基本概念
9.2 Titanic數(shù)據(jù)集
9.3 關(guān)聯(lián)規(guī)則挖掘
9.4 消除冗余
9.5 解釋規(guī)則
9.6 關(guān)聯(lián)規(guī)則的可視化
9.7 Python中的關(guān)聯(lián)規(guī)則實(shí)例
第十講 社交網(wǎng)絡(luò)分析
10.1 詞項(xiàng)網(wǎng)絡(luò)
10.2 推文網(wǎng)絡(luò)
10.3 雙模式網(wǎng)絡(luò)
10.4 Python中的社交網(wǎng)絡(luò)分析實(shí)例