近日,OpenAI 再次驚艷全球,重磅發(fā)布了全新的 AI 模型——o3。這次發(fā)布的的 o3 系列模型是 o1 的迭代版本,考慮到可能與英國電信運營(yíng)商 O2 存在版權或商標沖突,OpenAI 決定跳過(guò)「o2」命名,直接采用「o3」。
o3 系列包含兩款重磅模型:
OpenAI o3:旗艦版本,具備強大的性能表現
OpenAI o3 mini:輕量級模型,但能更快,更便宜,主打性?xún)r(jià)比
OpenAI聲稱(chēng),至少在某些條件下,o3模型可以接近實(shí)現AGI。
所謂AGI,即“通用人工智能”(artificial general intelligence)的縮寫(xiě),泛指能完成人類(lèi)所能完成的任何任務(wù)的人工智能。OpenAI對此有著(zhù)自己的定義:“在最具經(jīng)濟價(jià)值的工作上勝過(guò)人類(lèi)的高度自主系統”。
按照OpenAI的說(shuō)法,o3模型在A(yíng)RC-AGI圖形邏輯推理基準上獲得了破紀錄的分數,低計算場(chǎng)景中,o3得分為75.7%,而在高計算測試中,它達到了87.5%——超過(guò)了標志著(zhù)達到人類(lèi)水平的門(mén)檻85%。作為對比,o1模型的得分僅在25%到32%之間。o3的表現幾乎是o1三倍。
根據openAI展示的內容來(lái)看,目前可知的O3提升地方大概有幾處:
一是在軟件任務(wù)組成的基準測試當中,O3準確率達到71.7%,比上一代提升了20% 以上;
二是在競賽代碼方面,O3得到的最高ELO 分數是2727分,比O1高893分,還比openAI目前最厲害的競賽程序員和指導員高227分;
三是在數學(xué)競賽基準測試中,O3的AIMI準確率約為 96.7%,比O1提升了13.4%;
第四個(gè),O3在在博士水平科學(xué)問(wèn)題上測試,獲得的準確率為87.7%,這是與人類(lèi)博士水平基本一致的,比O1提升了近10%;
在rkg Pub上,O3是新的第一名。
OpenAI發(fā)布o3,再次突破 AI 極限,為全球 AI 的發(fā)展注入了新的活力。這一模型的問(wèn)世,不僅預示著(zhù)人工智能正逐漸走向成熟,還為我們展示了未來(lái) AI 世界的無(wú)限可能。