第二種方式中,當用戶查詢DataGemma時,它會運用Gemini 1.5長脈絡空間,先從Data Commons取得上下文資訊,再生成回應,藉此減少幻覺、提升回應品質。
Google之前已利用開源的Gemma和Gemma 2為基礎,使用RIG和RAG微調出變種版本,而這次則是以Gemma 2為基礎,再以RIG及RAG方法,分別生成DataGemma 2個27B版本變種,現已分別在Hugging Face平臺公開。Google計畫持續改善方法,最後會將這些方法學整合到開源的輕量模型Gemma,以及Gemini家族模型。一開始將局部開放給少數人試用,再階段性逐步擴大開放。



2024-09-16
