Sign in

Member Benefits

Get Demands

View Business Cards

Exclusive Service

Noble Identity

AS LOW AS 1.5U /DAY

xAI開始測試具備圖像生成能力的Grok-2與Grok-2 mini

Share

支付動態

2024-08-15

xAI強調Grok-2在盲測的LMSYS聊天機器人平臺曾拿下社群評比第三名,但用戶發現該模型缺乏拒絕生成有害內容的安全機制

/Large Model Systems Organization

xAI也採用一系列的學術基準來評估Grok-2,發現Grok-2與Grok-2 mini明顯優於Grok-1.5,在研究生水準科學知識(GPQA)、常識(MMLU、MMLU-Pro)及數學競賽問題(MATH)等領域可與GPT-4 Turbo、Claude 3 Opus及Gemini Pro 1.5等模型比美,並在視覺數學推理(MathVista)及基於文件的問題(DocVQA) 上提供了最先進的性能。

付費的X Premium與Premium+用戶可率先存取Grok-2與Grok-2 mini。xAI表示,Grok-2在各種任務上都更為直覺,也更通用及更容易操作,亦整合來自X平臺上的即時資訊,而Grok-2 mini為一精簡版模型,以於速度及品質間取得平衡。xAI亦計畫於8月透過新的企業API平臺釋出Grok-2與Grok-2 mini。

不過,已經有人發現Grok-2圖像生成功能的安全護欄不太牢靠,例如AI開發人員Benjamin De Kraker不僅利用Grok-2生成了拿著兩把槍的川普, 也用它生成正在吸毒的美國前總統布希(George Bush)。

The Verge的測試則發現,即使Grok-2承諾它具備安全護欄,可避免生成色情、暴力、仇恨或危險圖片,但事實上它並未拒絕許多涉及暴力、吸毒或名人裸露的圖像生成要求。不過,缺乏護欄的圖像生成模型並不只Grok-2,開源的Stable Diffusion對於危險內容的生成也幾乎毫無防備。

Disclaimer:
Details
HUIDU.io

GROWTH DRIVEN GLOBAL PTE. LTD. 202618650K

101 THOMSON ROAD, #28-03A, UNITED SQUARE, SINGAPORE 307591

Copyright 2026 HuiDu