北京時(shí)間18日中午,美國企業(yè)家埃隆·馬斯克創(chuàng )辦的人工智能公司xAI推出了新一代AI模型Grok 3,馬斯克稱(chēng)其“聰明得可怕”。Grok 3擁有更高的推理、計算和適應能力,代表著(zhù)AI模型向前邁出重要一步。
馬斯克在直播演講中表示:“Grok 3的能力比Grok 2高出一個(gè)數量級,它是一種最大程度尋求真相的人工智能?!?/p>
xAI公司稱(chēng),Grok 3在包括AIME(評估模型在數學(xué)問(wèn)題樣本上的表現)和GPQA(博士專(zhuān)家水平的物理、生物和化學(xué)問(wèn)題評估模型)在內的基準測試中勝過(guò)了GPT-4o。
更準確地說(shuō),Grok 3代表一個(gè)模型系列,而非單一的模型型號。xAI公司表示,Grok 3的推理模型處于測試階段(Beta版),并且仍在訓練中。該公司推出了推理模型的迷你版本,即Grok 3 mini,它可以更快地回答問(wèn)題,但準確性可能不高。
此外,Grok 3還引入了“DeepSearch”,該公司稱(chēng)其為一種新型搜索引擎,同時(shí)也是類(lèi)似代理功能的早期版本。
原計劃在此次發(fā)布中推出的語(yǔ)音模式并未如期上線(xiàn),馬斯克稱(chēng)其最快將在大約一周后推出。幾個(gè)月后,當Grok 3模型成熟之時(shí),xAI將開(kāi)源Grok 2。
據xAI此前報告稱(chēng),其僅用8個(gè)月時(shí)間打造的Colossus超級計算機加速了Grok 3的開(kāi)發(fā)進(jìn)程。該系統搭載了10萬(wàn)臺英偉達H100 GPU,提供了2億GPU小時(shí)的訓練時(shí)長(cháng),相較其前身Grok 2提升了10倍。算力的顯著(zhù)提升使Grok 3能高效處理大型數據集,縮短訓練時(shí)間并提高準確性。xAI還表示,已在Grok 3中引入人類(lèi)反饋循環(huán)和情境訓練,從而確保其回答更加自然和準確。
為了增強Grok 3的能力,xAI還調整了訓練方法?,F在,該模型通過(guò)整合合成數據集、引入自我校正機制和強化學(xué)習,來(lái)全面提升性能表現。據xAI方面和馬斯克介紹,這些改進(jìn)將通過(guò)多重驗證步驟減少錯誤回答(即“幻覺(jué)”現象),通過(guò)核對可靠信息源來(lái)提高邏輯準確性,并通過(guò)持續自我評價(jià)和學(xué)習實(shí)現更有效的適應。 (記者張佳欣)