24. 某電商平台導入強化學習(Reinforcement Learning)技術優化商品推薦策略，AI 代理(AI Agent)會根據使用者的點擊與購買行為持續調整推薦內容。技術團隊在討論中發現，系統面臨一個核心挑戰：若 AI Agent 總是推薦過去表現良好的商品，可能會錯失發掘更高潛力商品的機會；但若頻繁嘗試未知商品，又可能影響短期的推薦成效與使用者體驗。請問上述情境敘述的是強化學習中哪一個核心問題？ (A)探索與利用的權衡(Exploration vs. Exploitation)； (B)偏差與變異的權衡(Bias vs. Variance)； (C)梯度爆炸與消失(Vanishing and Exploding Gradients)； (D)過擬合與欠擬合(Overfitting and Underfitting)