第二种方式中,当用户查找DataGemma时,它会运用Gemini 1.5长脉络空间,先从Data Commons取得上下文信息,再生成回应,借此减少幻觉、提升回应品质。
Google之前已利用开源的Gemma和Gemma 2为基础,使用RIG和RAG微调出变种版本,而这次则是以Gemma 2为基础,再以RIG及RAG方法,分别生成DataGemma 2个27B版本变种,现已分别在Hugging Face平台公开。Google计划持续改善方法,最后会将这些方法学整合到开源的轻量模型Gemma,以及Gemini家族模型。一开始将局部开放给少数人试用,再阶段性逐步扩大开放。



2024-09-16
