OpenAI推出o3模型系列,AGI測試能力暴漲

智能AI
TIME
2024-12-23 12:02
科技在線(xiàn)
分享

  近日,OpenAI 再次驚艷全球,重磅發(fā)布了全新的 AI 模型——o3。這次發(fā)布的的 o3 系列模型是 o1 的迭代版本,考慮到可能與英國電信運營(yíng)商 O2 存在版權或商標沖突,OpenAI 決定跳過(guò)「o2」命名,直接采用「o3」。

  o3 系列包含兩款重磅模型:

  OpenAI o3:旗艦版本,具備強大的性能表現

  OpenAI o3 mini:輕量級模型,但能更快,更便宜,主打性?xún)r(jià)比

  OpenAI聲稱(chēng),至少在某些條件下,o3模型可以接近實(shí)現AGI。

  所謂AGI,即“通用人工智能”(artificial general intelligence)的縮寫(xiě),泛指能完成人類(lèi)所能完成的任何任務(wù)的人工智能。OpenAI對此有著(zhù)自己的定義:“在最具經(jīng)濟價(jià)值的工作上勝過(guò)人類(lèi)的高度自主系統”。

  按照OpenAI的說(shuō)法,o3模型在A(yíng)RC-AGI圖形邏輯推理基準上獲得了破紀錄的分數,低計算場(chǎng)景中,o3得分為75.7%,而在高計算測試中,它達到了87.5%——超過(guò)了標志著(zhù)達到人類(lèi)水平的門(mén)檻85%。作為對比,o1模型的得分僅在25%到32%之間。o3的表現幾乎是o1三倍。

b7.png

  根據openAI展示的內容來(lái)看,目前可知的O3提升地方大概有幾處:

  一是在軟件任務(wù)組成的基準測試當中,O3準確率達到71.7%,比上一代提升了20% 以上;

  二是在競賽代碼方面,O3得到的最高ELO 分數是2727分,比O1高893分,還比openAI目前最厲害的競賽程序員和指導員高227分;

  三是在數學(xué)競賽基準測試中,O3的AIMI準確率約為 96.7%,比O1提升了13.4%;

  第四個(gè),O3在在博士水平科學(xué)問(wèn)題上測試,獲得的準確率為87.7%,這是與人類(lèi)博士水平基本一致的,比O1提升了近10%;

  在rkg Pub上,O3是新的第一名。

  OpenAI發(fā)布o3,再次突破 AI 極限,為全球 AI 的發(fā)展注入了新的活力。這一模型的問(wèn)世,不僅預示著(zhù)人工智能正逐漸走向成熟,還為我們展示了未來(lái) AI 世界的無(wú)限可能。


THE END
免責聲明:本文系轉載,版權歸原作者所有;刊載之目的為傳播更多信息,如內容不適請及時(shí)通知我們。

相關(guān)熱點(diǎn)

  當前沿科技與冰雪文化相遇,黑龍江的冰雪世界煥發(fā)出前所未有的活力。全感VR帶著(zhù)人們穿越到冰河世紀,人工智能創(chuàng )意生成冰雪萬(wàn)花筒空間,81米的“九九消寒圖”可讓上千人...
業(yè)界
  據分析師Mark Gurman透露,蘋(píng)果正緊鑼密鼓地研發(fā)第三代AirPods Pro無(wú)線(xiàn)耳機,這款新品將首次融入心率及體溫監測等健康監測功能,進(jìn)一步拓寬了AirPods系列的應用場(chǎng)景?!?..
數碼

相關(guān)推薦

1
3
人人狠狠综合久久亚洲88_国产超薄丝袜足底脚交国产_日本wvvw高清中文字幕_97国产品香蕉在线观看