
值得注意的是,OPT-30B模型應用傳統的自我評估方法Self-eval和P(True),選擇性預測的效能並沒有明顯提高,反而是較小的OPT-2.7B模型在使用ASPIRE進行強化後,優於其他模型,也就是說,運用傳統自我評估技術的較大型語言模型,選擇性預測效果不如採用ASPIRE強化方法的小模型。
研究人員實驗強調了ASPIRE對於大型語言模型的重要改變,語言模型的能力並非其表現的最終效能,透過調整策略就可以大幅提高模型有效性,即便是較小的模型,也可以進行準確且有自信的預測。
Google新框架ASPIRE有效讓AI自我評估輸出對錯
分享
2024-01-23
Google開發ASPIRE框架提升大型語言模型的選擇性預測與自我評估能力,有效提高問答任務的準確性
值得注意的是,OPT-30B模型應用傳統的自我評估方法Self-eval和P(True),選擇性預測的效能並沒有明顯提高,反而是較小的OPT-2.7B模型在使用ASPIRE進行強化後,優於其他模型,也就是說,運用傳統自我評估技術的較大型語言模型,選擇性預測效果不如採用ASPIRE強化方法的小模型。
研究人員實驗強調了ASPIRE對於大型語言模型的重要改變,語言模型的能力並非其表現的最終效能,透過調整策略就可以大幅提高模型有效性,即便是較小的模型,也可以進行準確且有自信的預測。
热门精选