在數據挖掘中,數學建模發揮著重要作用。數學建模是將現實問題抽象為數學模型,利用數學方法分析和求解。而在數據挖掘中,根據數據分析者的目標,可以將數據挖掘任務分為模式挖掘(包括頻繁模式、異常模式等)和模型挖掘(如預測建模、描述建模等)。預測建模是指根據數據線建立一個模型,然后應用這個模型來對未來的數據進行預測。根據被預測的變量的不同,可以區分為分類和回歸。分類用于對離散的數據進行預測,典型應用包括信譽評估、醫學診斷等;回歸也用于對離散的數據進行預測,典型應用如性能預測。分類簡單分為建立模型階段和使用模型階段,第一步是建立模型,用來構建模型的數據集被稱為訓練集,模型一般表示為分類規則、決策樹或者數學公式;第二步是使用模型階段,首先要測試模型的準確性,將測試集和由模型進行分類的結果進行比較,兩個結果相同所占比率稱為準確率,并且測試集和訓練集必須不相關,以便對新數據進行分類,并進行數據預處理和分類方法評價。常用的分類方法有決策樹分類、貝葉斯分類、支持向量機、神經網絡、K 近鄰分類等。
點擊前往免費閱讀更多精彩小說