
ScreenAI僅擁有50億參數卻非常高效,在處理用戶介面和資訊圖表相關任務WebSRC和MoTIF,與當前規模相近的先進模型相比,得到最高的分數,而在圖表問答相關的任務Chart QA、DocVQA和InfographicVQA,也是當前同類模型中表現最佳者。
Google發表當前最佳UI與資訊圖表理解模型ScreenAI
Share
2024-03-22
Google ScreenAI模型結合視覺和語言處理能力,採用彈性區塊處理策略(Flexible Patching Strategy)強化,並且經特製資料集訓練,成為目前圖表理解能力最佳的模型
ScreenAI僅擁有50億參數卻非常高效,在處理用戶介面和資訊圖表相關任務WebSRC和MoTIF,與當前規模相近的先進模型相比,得到最高的分數,而在圖表問答相關的任務Chart QA、DocVQA和InfographicVQA,也是當前同類模型中表現最佳者。
Popular selection
Copyright 2022 HUIDU