益阳痪上旅行社

Python數(shù)據(jù)分析系列課程:學習數(shù)據(jù)挖掘
體系課

Python數(shù)據(jù)分析系列課程:學習數(shù)據(jù)挖掘

  • 數(shù)據(jù)挖掘與分析

全面掌握數(shù)據(jù)挖掘的關鍵數(shù)據(jù)模型,通過多項訓練,提升數(shù)據(jù)建模能力

¥199.9
本課程包括
  • 11小時24分鐘的視頻隨時觀看
  • 課程包含 5 道測試題
  • 可在APP隨時觀看
  • 結(jié)業(yè)證書
你將收獲
  • 掌握Python機器學習與數(shù)據(jù)挖掘相關技術
  • 提升專業(yè)的數(shù)據(jù)預處理
  • 學會特征的篩選與信息濃縮
  • 掌握多種模型的訓練、集成與參數(shù)優(yōu)化
課程介紹

本課程以CRISP-DM為理論指導,系統(tǒng)介紹了sklearn在數(shù)據(jù)挖掘/機器學習各個環(huán)節(jié)的功能實現(xiàn),從數(shù)據(jù)挖掘?qū)崙?zhàn)的角度出發(fā)詳細介紹如何在sklearn中完成數(shù)據(jù)預處理、數(shù)據(jù)降維、數(shù)據(jù)建模、模型評估等各種操作,并突出特征選擇、模型調(diào)參,模型集成等在數(shù)據(jù)挖掘?qū)崙?zhàn)環(huán)境中的重要課題。

課程弱化了各種統(tǒng)計模型的基本原理,強化其具體操作及衍生模型 。學習完本課程后,學員將能夠獨立使用sklearn完成數(shù)據(jù)挖掘或機器學習實際項目。

適合人群
  • 轉(zhuǎn)行大數(shù)據(jù)處理的小伙伴
  • 想要深入學習數(shù)據(jù)挖掘的同學
  • 適合企業(yè)中高級數(shù)據(jù)分析師提升數(shù)據(jù)挖掘硬技能
  • 適合Python數(shù)據(jù)分析師掌握數(shù)據(jù)挖掘能力
講師介紹
博士,數(shù)據(jù)分析與挖掘?qū)V淖髡?/div>
擅長領域:
  • 數(shù)據(jù)挖掘與分析
張文彤老師擁有20+年數(shù)據(jù)分析/統(tǒng)計軟件商業(yè)培訓經(jīng)驗,精通業(yè)內(nèi)廣泛使用的SAS、SPSS、Modeler、R、Tableau、Python等數(shù)據(jù)分析/挖掘工具,曾作為SPSS官方培訓師,從2001年起一手協(xié)助SPSS中國建立其培訓體系 。
課程大綱
共0節(jié) 時長0分鐘 全部收起
第1章 python機器學習與數(shù)據(jù)挖掘概述
共4節(jié) | 48分鐘
  • 1-1 如何用python做機器學習或數(shù)據(jù)挖掘?
    10分鐘
  • 1-2 課程內(nèi)容介紹
    9分鐘
  • 1-3 使用sklearn的樣本數(shù)據(jù)集
    10分鐘
  • 1-4 sklearn基本操作入門
    19分鐘
第2章 數(shù)據(jù)的預處理
共6節(jié) | 55分鐘
  • 2-1 連續(xù)變量的標準化
    18分鐘
  • 2-2 考慮異常分布的標準化
    10分鐘
  • 2-3 分類變量的預處理
    14分鐘
  • 2-4 缺失值的填充
    5分鐘
  • 2-5 生成多項式特征
    5分鐘
  • 2-6 自定義轉(zhuǎn)換器
    3分鐘
第3章 特征選擇與信息濃縮
共5節(jié) | 41分鐘
  • 3-1 特征篩選概述
    8分鐘
  • 3-2 基于簡單統(tǒng)計特征進行篩選
    8分鐘
  • 3-3 基于統(tǒng)計誤差進行篩選
    6分鐘
  • 3-4 基于建模結(jié)果進行篩選
    5分鐘
  • 3-5 數(shù)據(jù)降維與信息濃縮
    14分鐘
第4章 回歸類模型的訓練
共10節(jié) | 1小時48分鐘
  • 4-1 回歸類模型概述
    21分鐘
  • 4-2 回歸類模型的種類
    11分鐘
  • 4-3 線性回歸的sklearn實現(xiàn)
    6分鐘
  • 4-4 多項式回歸
    5分鐘
  • 4-5 嶺回歸的基本原理
    8分鐘
  • 4-6 嶺回歸的實現(xiàn)
    14分鐘
  • 4-7 LASSO回歸與彈性網(wǎng)絡
    14分鐘
  • 4-8 最小角回歸
    13分鐘
  • 4-9 梯度下降法的基本原理
    10分鐘
  • 4-10 隨機梯度下降回歸
    6分鐘
第5章 類別預測模型的訓練
共9節(jié) | 1小時47分鐘
  • 5-1 類別預測模型概述
    10分鐘
  • 5-2 類別預測模型的實現(xiàn)原理
    15分鐘
  • 5-3 類別預測模型的種類
    10分鐘
  • 5-4 logistic回歸
    13分鐘
  • 5-5 神經(jīng)網(wǎng)絡的基本原理
    16分鐘
  • 5-6 神經(jīng)網(wǎng)絡的實現(xiàn)
    12分鐘
  • 5-7 樹模型的基本原理
    15分鐘
  • 5-8 樹模型的實現(xiàn)
    12分鐘
  • 5-9 隨機梯度下降分類
    4分鐘
第6章 聚類模型的訓練
共5節(jié) | 1小時9分鐘
  • 6-1 聚類分析概述
    15分鐘
  • 6-2 聚類分析的種類
    10分鐘
  • 6-3 K均值聚類
    14分鐘
  • 6-4 birch聚類
    16分鐘
  • 6-5 DBSCAN聚類
    14分鐘
第7章 評估模型效果
共8節(jié) | 1小時12分鐘
  • 7-1 類別預測模型的評價
    11分鐘
  • 7-2 分類模型評價:混淆矩陣
    7分鐘
  • 7-3 分類模型評價:準確率與召回率
    12分鐘
  • 7-4 分類模型評價:結(jié)果的匯總
    5分鐘
  • 7-5 分類模型評價:ROC曲線
    5分鐘
  • 7-6 回歸模型的評價
    7分鐘
  • 7-7 聚類模型的評價
    18分鐘
  • 7-8 將模型結(jié)果與隨即預測結(jié)果相比較
    8分鐘
第8章 數(shù)據(jù)的拆分
共4節(jié) | 42分鐘
  • 8-1 數(shù)據(jù)拆分方法概述
    17分鐘
  • 8-2 二分法的sklearn實現(xiàn)
    6分鐘
  • 8-3 交叉驗證的sklearn的實現(xiàn)1
    11分鐘
  • 8-4 交叉驗證的sklearn實現(xiàn)2
    8分鐘
第9章 模型參數(shù)優(yōu)化
共5節(jié) | 52分鐘
  • 9-1 如何改進數(shù)據(jù)挖掘模型的效果
    13分鐘
  • 9-2 參數(shù)的網(wǎng)格搜索
    12分鐘
  • 9-3 參數(shù)的隨機搜索
    10分鐘
  • 9-4 驗證曲線
    6分鐘
  • 9-5 學習曲線
    11分鐘
第10章 模型集成
共7節(jié) | 1小時29分鐘
  • 10-1 用模型集成改進效果的基本思路
    11分鐘
  • 10-2 投票分類器
    12分鐘
  • 10-3 模型集成的基本原理
    13分鐘
  • 10-4 Bagging方法的sklearn實現(xiàn)
    11分鐘
  • 10-5 隨機森林
    15分鐘
  • 10-6 adaboost方法
    12分鐘
  • 10-7 GBDT方法
    16分鐘
測試題
共5題
購課須知

課程有效期:

自購買課程之日起 365 天,部分參與營銷活動產(chǎn)品以活動規(guī)則為準,請同學在有效期內(nèi)學習、觀看課程。

上課模式:

課程采取錄播模式,請注意自學課無班級微信群、班主任帶班及助教批改服務。

注:自學課不支持退款,確保你是真的需要再進行報名,報完名之后還請認真學習。