HUIDU.io- Find Resources, Discuss Cooperation, Join HUIDU

xAI強調Grok-2在盲測的LMSYS聊天機器人平臺曾拿下社群評比第三名，但用戶發現該模型缺乏拒絕生成有害內容的安全機制

／Large Model Systems Organization

xAI也採用一系列的學術基準來評估Grok-2，發現Grok-2與Grok-2 mini明顯優於Grok-1.5，在研究生水準科學知識（GPQA）、常識（MMLU、MMLU-Pro）及數學競賽問題（MATH）等領域可與GPT-4 Turbo、Claude 3 Opus及Gemini Pro 1.5等模型比美，並在視覺數學推理（MathVista）及基於文件的問題（DocVQA）上提供了最先進的性能。

付費的X Premium與Premium+用戶可率先存取Grok-2與Grok-2 mini。xAI表示，Grok-2在各種任務上都更為直覺，也更通用及更容易操作，亦整合來自X平臺上的即時資訊，而Grok-2 mini為一精簡版模型，以於速度及品質間取得平衡。xAI亦計畫於8月透過新的企業API平臺釋出Grok-2與Grok-2 mini。

不過，已經有人發現Grok-2圖像生成功能的安全護欄不太牢靠，例如AI開發人員Benjamin De Kraker不僅利用Grok-2生成了拿著兩把槍的川普，也用它生成正在吸毒的美國前總統布希（George Bush）。

The Verge的測試則發現，即使Grok-2承諾它具備安全護欄，可避免生成色情、暴力、仇恨或危險圖片，但事實上它並未拒絕許多涉及暴力、吸毒或名人裸露的圖像生成要求。不過，缺乏護欄的圖像生成模型並不只Grok-2，開源的Stable Diffusion對於危險內容的生成也幾乎毫無防備。