20. 某醫院希望開發一個系統,根據患者的年齡、血壓與 BMI 等資訊,預測其罹患糖尿病的機率(0~1),並依據預測值是否超過 0.5 做出風險警示。下列哪一種模型最適合用於此分類任務?
(A)邏輯迴歸(Logistic Regression);
(B)支援向量機(Support Vector Machine);
(C)決策樹(Decision Tree);
(D)K 平均演算法(K-means)
統計: A(50), B(17), C(16), D(16), E(0) #3869563
詳解 (共 1 筆)
這題的正確答案是 (A) 邏輯迴歸 (Logistic Regression)。
以下是針對題目需求與各選項的邏輯推理分析:
-
✅ (A) 邏輯迴歸 (Logistic Regression) 是最適合的模型:
-
依據: 邏輯迴歸雖然名稱中有「迴歸」,但它是一種標準的二元分類演算法。它的核心是利用 Sigmoid 函數,將特徵(如年齡、血壓、BMI)的線性組合結果,映射到 0 到 1 之間的連續數值。
-
契合度: 這個 0 到 1 的輸出值,在數學與實務上就代表著「發生特定事件(如罹患糖尿病)的機率」。實務上,我們通常預設以 0.5 作為閾值(Threshold):大於 0.5 判定為正類(有風險),小於 0.5 判定為負類(無風險)。這與題目描述的系統需求完全吻合。
-
-
❌ (B) 支援向量機 (Support Vector Machine, SVM) 較不適合:
-
依據: SVM 是一種強大的分類模型,其原理是尋找一個最佳的「超平面」來最大化兩類資料的邊界。
-
不契合點: SVM 的原生輸出是資料點到決策邊界的「距離」,而不是直接的機率值。雖然可以透過額外的技術(如 Platt Scaling)將距離轉換為機率,但這並非其原生設計,在「直接預測 0~1 機率」的需求上不如邏輯迴歸直觀與標準。
-
-
❌ (C) 決策樹 (Decision Tree) 較不適合:
-
依據: 決策樹是透過一系列的特徵判斷(如「BMI 是否大於 25?」)來進行分支,最終抵達葉節點以決定分類結果。
-
不契合點: 決策樹的最終輸出通常是確定的類別標籤(例如:患病或不患病)。雖然它可以透過計算落入該葉節點的樣本比例來推算「機率」,但這種機率是階梯式、不連續的,無法像邏輯迴歸那樣提供一個平滑的數學機率函數。
-
-
❌ (D) K 平均演算法 (K-means) 完全不適用:
-
依據: K-means 是一種非監督式學習 (Unsupervised Learning) 的集群演算法,主要用於將「沒有標籤」的資料依據特徵相似度分成 K 個群體。
-
不契合點: 題目明確要預測「是否罹患糖尿病」,這代表資料是有標籤的,屬於監督式學習 (Supervised Learning) 的分類任務。因此,K-means 在此情境下無法發揮作用。
-