日日躁夜夜躁狠狠躁超碰97,无码国内精品久久综合88 ,热re99久久精品国99热,国产萌白酱喷水视频在线播放

歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺(tái)電子信息窗口

xAI 發(fā)布 Grok 4:AI 領(lǐng)域的新里程碑

2025-07-11 來源:深圳市電子商會(huì)
163

關(guān)鍵詞: Grok 4 發(fā)布 馬斯克 跑分?jǐn)?shù)據(jù) 單代理 四代理

馬斯克在直播當(dāng)中.jpg

北京時(shí)間 7 月 10 日,xAI 的 Grok 4 在萬眾矚目中正式發(fā)布。


本次發(fā)布會(huì)原定于上午 11 點(diǎn)開始,卻 “鴿” 了觀眾整整一小時(shí),不過這并未削減大家的熱情,140 萬觀眾在線催更,評論數(shù)飆升至 4200 條,轉(zhuǎn)發(fā)超 2000 次,點(diǎn)贊破萬。


埃隆?馬斯克親自為 Grok 4 站臺(tái),他略顯憔悴,可見為這次發(fā)布準(zhǔn)備已久。

馬斯克的ai的對比數(shù)據(jù)2.jpg

馬斯克的ai的對比數(shù)據(jù)1.jpg

在發(fā)布會(huì)上發(fā)布的Grok4數(shù)據(jù)(部分)

Grok 4 依托 xAI 自建的超級計(jì)算集群 “Colossus” 進(jìn)行研發(fā)。從官方公布的跑分?jǐn)?shù)據(jù)來看,Grok 4 表現(xiàn)卓越。在 “人類的最后考試”(Humanity's Last Exam)中,Grok 4 在無需 “工具” 的情況下取得了 25.4% 的準(zhǔn)確率,超過了谷歌 Gemini 2.5 Pro 的 21.6% 和 OpenAI o3(高版本)的 21%。配備 “工具” 的 Grok 4 Heavy 更是獲得 44.4% 的得分,優(yōu)于配備工具的 Gemini 2.5 Pro 的 26.9%。在 ARC - AGI - 2 測試中,Grok 4 取得了新的最高得分,得分為 16.2%。此外,在 GPQA、AIME25、LCB(Jan - May)、HMMT25 等多項(xiàng)測評中,Grok 4 都超越了 OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus 等模型,并且xAI 宣稱 Grok 4 “在幾乎所有學(xué)科領(lǐng)域已超越人類博士水平”


Grok 4 系列包含兩款產(chǎn)品。Grok 4 是單代理推理引擎,響應(yīng)速度提升了 100%,支持 128K 上下文窗口的實(shí)時(shí)長文檔分析。Grok 4 Heavy 采用四代理并行架構(gòu),擁有 256K 超長上下文和工具原生內(nèi)化能力,能實(shí)時(shí)接入 X 平臺(tái)數(shù)據(jù)流,在 5 秒內(nèi)完成 MLB 世界大賽冠軍概率分析。


Grok 4 還首次引入多模態(tài)信息處理功能,可處理圖像、視頻等信息,還能從社交媒體整合信息生成市場預(yù)測。語音模式也有改進(jìn),端到端延遲減半,同時(shí)新增五種聲音模式。


開發(fā)者生態(tài)方面,xAI 計(jì)劃 8 月推出 Grok4 Code。其集成專業(yè)編程工具,支持代碼生成、錯(cuò)誤檢測等功能。


價(jià)格方面,Grok 4 API 每百萬 tokens 輸入 3 美元,輸出 15 美元。SuperGrok 的月費(fèi)為 30 美元,可解鎖 Grok 4 的能力;Super Grok Heavy 會(huì)員月費(fèi)高達(dá) 300 美元,能訪問 Grok 4 和多智能體版本 Grok 4 Heavy。


不過,Grok 4 的發(fā)布也引發(fā)了一些爭議。此前 Grok 曾出現(xiàn)過發(fā)布冒犯性內(nèi)容的情況。對此,馬斯克在發(fā)布會(huì)上也提到,Grok 4 有時(shí)可能缺乏常識,但他相信隨著時(shí)間推移,Grok 4 會(huì)不斷完善。