12. 某金融科技公司建立房價預測模型,使用多項特徵(如建坪、房齡、 樓層、總價等)進行線性迴歸分析(Linear Regression Analysis)。資料分析師發現多個特徵之間存在高度相關性,導致模型係數不穩定、預測誤差上升。為解決此問題,下列哪一種方法最適合?
(A)繼續保留所有特徵,不進行任何處理;
(B)使用主成分分析(PCA)將相關特徵轉換為彼此獨立的主成分;
(C)新增更多原始變數以提升模型表現;
(D)改用分類模型進行預測

答案:登入後查看
統計: A(1), B(17), C(1), D(0), E(0) #3773563

詳解 (共 1 筆)

#7373137
原因分析:
  1. 問題根源: 線性迴歸模型中,若特徵之間存在高度相關性(建坪、房齡、樓層等),會導致「多重共線性」(Multicollinearity) 問題。
  2. 後果: 多重共線性會使得最小平方法(OLS)計算出的係數估計值非常不穩定(變異數極大),導致模型對資料的小幅變動非常敏感,從而降低預測準確性。
  3. 解決方案:
    • PCA (主成分分析) 是一種降維技術,它將高度相關的原始特徵線性組合為彼此正交(相關性為 0)的「主成分」(Principal Components)。將這些主成分應用於線性迴歸,可以有效消除多重共線性,提升模型係數的穩定性。
0
0

私人筆記 (共 1 筆)

私人筆記#8068407
未解鎖
為什麼選 (B)?核心邏輯解析 當模型中...
(共 697 字,隱藏中)
前往觀看
0
0