37. 某公司正在訓練一個大型語音合成模型,開發團隊使用多台 GPU 進行訓練,但經常出現 GPU 記憶體不足問題。由於模型架構已固定且無法更換硬體,團隊希望在維持模型效能與收斂品質的前提下,下列哪 一種方法最有效降低單張 GPU 的記憶體壓力?
(A)減少訓練資料量以降低記憶體使用;
(B)採用較小的批次大小(Batch Size)並搭配資料分片(Data Sharding)分散訓練負載;
(C)增加學習率(Learning Rate)以加快收斂速度;
(D)改用測試資料集(Test Set)進行部分訓練以節省空間

答案:登入後查看
統計: A(2), B(10), C(0), D(1), E(0) #3773588

私人筆記 (共 1 筆)

私人筆記#8066103
未解鎖
為什麼選 (B)?核心邏輯分析 當模型...
(共 887 字,隱藏中)
前往觀看
0
0