24. 某電商平台導入強化學習(Reinforcement Learning)技術優化商品推薦策略,AI 代理(AI Agent)會根據使用者的點擊與購買行為持續調整推薦內容。技術團隊在討論中發現,系統面臨一個核心挑戰:若 AI Agent 總是推薦過去表現良好的商品,可能會錯失發掘更高潛力商品的機會;但若頻繁嘗試未知商品,又可能影響短期的推薦成效與使用者體驗。請問上述情境敘述的是強化學習中哪一個核心問題?
(A)探索與利用的權衡(Exploration vs. Exploitation);
(B)偏差與變異的權衡(Bias vs. Variance);
(C)梯度爆炸與消失(Vanishing and Exploding Gradients);
(D)過擬合與欠擬合(Overfitting and Underfitting)
答案:登入後查看
統計: A(1), B(0), C(0), D(0), E(0) #3922918
統計: A(1), B(0), C(0), D(0), E(0) #3922918