20 下列何種神經傳導物質與強化學習的神經機制最密切相關?
(A)腦內啡(endorphin)
(B)多巴胺(dopamine)
(C)麩氨酸(glutamate)
(D)甘胺酸(glycine)
答案:登入後查看
統計: A(68), B(476), C(241), D(18), E(0) #2763262
統計: A(68), B(476), C(241), D(18), E(0) #2763262
詳解 (共 3 筆)
#7369659
(A) 錯誤:腦內啡(endorphin)主要在控制疼痛以及調節情緒行為(如焦慮、緊張、愉悅)上扮演重要角色。雖然它參與了獎賞體驗中「喜歡」(liking,即獲得獎賞時的主觀愉悅感)的層面,但主導強化與行為學習的核心機制仍是多巴胺。
ㅤㅤ
(B) 正確:多巴胺(dopamine)與獎賞學習及強化的神經基礎最為密切相關。在操作制約中,多巴胺的釋放決定了強化物(reinforcer)的價值。此外,大腦獎賞區域的多巴胺活動是產生「預測誤差」(prediction error)的神經基礎,當行為帶來出乎意料的獎賞時,多巴胺釋放會增加,進而引導動物與人類從獎賞中學習並強化該行為。
ㅤㅤ
(C) 錯誤:麩氨酸(glutamate)是大腦中最常見的興奮性神經傳導物質,在整體的「學習與記憶」歷程(例如促進神經元間的長期增益效應 LTP)中扮演非常關鍵的角色。但若特別指稱針對「獎賞與強化」的學習機制,多巴胺的關聯性最為直接。
ㅤㅤ
(D) 錯誤:課本中並未指稱甘胺酸(glycine)與強化學習神經機制有密切關聯。 [Gerrig_Ch03_行為的生物與進化基礎; Phelps_Ch07_記憶]
ㅤㅤ
ㅤㅤ
----------
預測誤差(prediction error)是指有機體「預期的結果」與「實際發生的結果」之間的差異,它是決定古典制約與操作制約學習成效的核心機制。而預測誤差的神經基礎主要在於大腦獎賞區域(如基底核中的伏隔核)的多巴胺(dopamine)活動。
大腦透過多巴胺神經元發放頻率的改變,來反映預測誤差的狀態,其運作機制如下:
- 正向預測誤差(Positive Prediction Error)與多巴胺爆發: 當出現完全未預期的獎賞,或是實際的獎賞比預期中還要強烈時,會產生「正向預測誤差」。此時,大腦獎賞區域會出現多巴胺活動的短暫「爆發」(spike),這種多巴胺的大量釋放會強化該環境線索(制約刺激,CS)與獎賞(非制約刺激,US)之間的聯結。
- 制約完成後的反應轉移(預測成功): 隨著學習的進行,當動物學會某個提示(如燈光或聲音)能完全準確預測獎賞(如果汁)的到來時,獎賞本身就不再帶來「驚喜」(沒有預測誤差)。這時,多巴胺的爆發性活動會轉移到「提示(CS)出現時」發生;而在實際接收到預期的獎賞(US)時,反而不會有多巴胺的顯著活動。
- 負向預測誤差(Negative Prediction Error)與多巴胺下降: 如果提示出現了,但預期中的獎賞最終「沒有」送達,就會產生「負向預測誤差」。這時候,在原本預期獎賞該出現的時間點,多巴胺神經元的活動量會明顯低於基準線(多巴胺活動減少),這種下降的訊號會削弱原本建立的聯結,讓大腦學到該提示不再是個可靠的信號。
總結來說,大腦中的多巴胺系統就像是一個「預測與校對」的機制。多巴胺傳遞的預測誤差訊號能提醒我們注意環境中出乎意料的重要事件,進而引導我們學習去預測獎賞(古典制約),或學習能帶來獎賞的行為(操作制約)。這種機制也解釋了為什麼那些能預測獎賞的線索(例如金錢、好成績),最終它們本身也能引發多巴胺活動,成為具有價值的次級強化物。 [Phelps_Ch06_學習]
0
0