21. 某金融科技公司正開發一套違約風險預測系統,需大量處理不同客戶的財務特徵資料。考量到資料特徵數量眾多,且希望提升預測的穩定性與泛化能力,下列哪一種鑑別式 AI 模型最適合?
(A)邏輯迴歸(Logistic Regression);
(B)支援向量機(Support Vector Machine);
(C)決策樹(Decision Tree);
(D)隨機森林(Random Forest)

答案:登入後查看
統計: A(6), B(11), C(8), D(56), E(0) #3869564

詳解 (共 1 筆)

#7368266

這題的正確答案是 (D) 隨機森林 (Random Forest)

以下是針對題目需求與各選項的邏輯推理分析:

  • ✅ (D) 隨機森林 (Random Forest) 是最佳選擇:

    • 應對特徵數量眾多: 隨機森林在建立每一棵決策樹的分支時,會隨機抽取一部分特徵來進行評估,這使得它非常擅長處理高維度(特徵多)的資料,且能自帶特徵重要性評估的功能。

    • 提升穩定性與泛化能力(題幹核心要求): 這是隨機森林最大的優勢。它屬於「集成學習(Ensemble Learning)」中的 Bagging 方法,透過結合多棵決策樹的預測結果(多數決或平均),大幅降低了模型的變異數(Variance),有效防止過擬合(Overfitting),從而提供極佳的穩定性與泛化能力。

  • ❌ (C) 決策樹 (Decision Tree) 不適合:

    • 雖然決策樹解釋性強,但它最大的致命傷就是極容易過擬合(導致泛化能力差),並且對資料的微小變動非常敏感(穩定性極差)。這完全違背了題目「提升預測的穩定性與泛化能力」的要求。隨機森林正是為了解決單一決策樹的這些缺點而誕生的。

  • ❌ (A) 邏輯迴歸 (Logistic Regression) 較不適合:

    • 邏輯迴歸是一個很好的基準模型(Baseline),但在處理「特徵數量眾多」且特徵之間可能存在複雜非線性關係的財務資料時,它的表達能力通常不如樹狀模型,且容易欠擬合(Underfitting)。

  • ❌ (B) 支援向量機 (Support Vector Machine, SVM) 較不適合:

    • SVM 在高維度空間中確實表現不錯,但題目特別提到需要「大量處理」資料。傳統 SVM 在面臨大規模資料集時,訓練時間與運算資源的消耗會呈現幾何級數增長,實務上效率較低。此外,針對表格型(Tabular)的財務數據,隨機森林在穩定性、準確度與調參難易度上的綜合表現通常優於 SVM。

0
0

私人筆記 (共 1 筆)

私人筆記#8081015
未解鎖
這道題目的正確答案是 (D) 隨機森林 ...
(共 467 字,隱藏中)
前往觀看
0
0