此外,Gemini 1.5 Flash/Pro拥有一个更简洁的表达方式,不管是在回答问题、进行摘要或汲取内容上,新模型的默认输出长度都比前一版短了5~20%,以方便使用并降低成本。
本周Google亦宣布调降Gemini 1.5 Pro价格,前提是提示少于12.8万个Token,那么其输入Token价格调降了64%,输出Token则调降52%,添加缓存Token价格亦降低了64%,且自今年的10月1日起生效,届时每100万个输入Token的价格为1.25美元,每100万个Token的输出价格为2.5美元,可望降低使用Gemini 1.5 Pro的成本。

而所谓的速率限制指的是开发人员每分钟可发送请求的次数(Requests Per Minute,RPM),其中,Gemini 1.5 Flash的速率限制从1000 RPM提高到2000 RPM,Gemini 1.5 Pro则从360 RPM提高到1000 RPM,且Google预计未来几周将持续提高Gemini API的速率限制。
Gemini 1.5 Flash在速度上的改善则较为明显,它的输出速度是最初版本的2倍,延迟则只有原来的1/3。



2024-09-25
