OpenAI勁敵出手！Claude 3正式發(fā)布，超越GPT-4，一口氣讀15萬(wàn)單詞

TIME

2024-03-05 10:10

36氪

分享

　　OpenAI創(chuàng )始人奧特曼都還沒(méi)來(lái)得及和馬斯克掰扯完新仇舊恨，沒(méi)關(guān)系，還有其他人會(huì )悄悄出手——

　　北京時(shí)間3月4日晚間，Anthropic，毫無(wú)預警地發(fā)布了最新一代大模型Claude 3，距離上一代的Claude 2發(fā)布，僅相隔8個(gè)月。

　　Anthropic是OpenAI的勁敵，其核心團隊同樣是OpenAI的創(chuàng )業(yè)原班人馬。團隊因為與OpenAI理念不合而分家，于2021年成立了新公司Anthropic。

　　僅在2023年，Anthropic就連續獲得五輪，共計73億美元的融資。在大模型訓練上，Anthropic可以說(shuō)是業(yè)內第一梯隊，同樣備受硅谷關(guān)注。

　　這次，毫無(wú)疑問(wèn)，Claude 3直接對標OpenAI當前最強大的模型GPT-4，多模態(tài)能力配齊，并且直接甩出超過(guò)46頁(yè)的技術(shù)報告，自豪表示：

全面超越GPT-4！

　　△來(lái)源：Claude來(lái)源：

　　新一代的Claude 3分為三個(gè)版本，分別為Haiku、Sonnet、Opus三款模型。從模型尺寸來(lái)看，可以理解為模型的中杯、大杯、超大杯。

　　雖然Anthropic并沒(méi)有給出模型的具體參數，不過(guò)給出了三款模型所適用的場(chǎng)景：

Haiku：是相應速度最快的模型，也是成本最低的選項，在大多數純文本任務(wù)上的表現仍然相當出色，也同時(shí)包含多模態(tài)能力（比如視覺(jué)）
Sonnet：適用于需要平衡性能和成本的場(chǎng)景，它在純文本任務(wù)上的表現與后面的Opus相當，但在成本上更為經(jīng)濟，適合于那些需要性能稍微好點(diǎn)，但預算有限的企業(yè)和個(gè)人用戶(hù)
Opus：具有強大的推理、數學(xué)和編碼能力，接近人類(lèi)的理解能力，適用于需要高度智能和復雜任務(wù)處理的場(chǎng)景，如企業(yè)自動(dòng)化、復雜金融預測、研究和開(kāi)發(fā)等。

　　從本周開(kāi)始，Claude會(huì )向159個(gè)國家開(kāi)放。其中，Opus和Sonnet模型的API均已上線(xiàn)，開(kāi)發(fā)者已經(jīng)可以直接使用。經(jīng)濟性能兼顧的Sonnet，就在官網(wǎng)上提供免費體驗，Opus則可供Claude Pro訂閱者使用。

　　盡管OpenAI憑借Sora在文生視頻領(lǐng)域打了一場(chǎng)漂亮的翻身仗，但視頻賽道所在的發(fā)展階段更早。如今的主戰場(chǎng)仍在大語(yǔ)言模型（LLM）上，離產(chǎn)品化也更近。

　　圈內人也看熱鬧不嫌事大。近期不少報道顯示，馬斯克將OpenAI告上法庭，讓OpenAI不得不內部推遲有關(guān)GPT-5的發(fā)布——GPT-5被認為能夠實(shí)現AGI（通用人工智能）。著(zhù)名AI圈網(wǎng)紅、英偉達的首席AI科學(xué)家Jim Fan就表示：

Claude 3剛剛發(fā)布了，坐等幾個(gè)小時(shí)后OpenAI精心安排的GPT-5發(fā)布。

　　△來(lái)源：Twitter（X）

　　2024年才剛剛過(guò)去兩個(gè)月，我們就已經(jīng)見(jiàn)證谷歌Gemini Pro、OpenAI的Sora，再到如今的Claude發(fā)布……巨頭混戰再度拉開(kāi)序幕，大有愈演愈烈之勢。

一口氣讀15萬(wàn)單詞，還能自己拆解復雜問(wèn)題

　　如果是OpenAI是大模型領(lǐng)域的“六邊形戰士”，無(wú)論是模型視頻、商業(yè)化綜合水平一騎絕塵，那么Anthropic從風(fēng)格上看更為低調，也更強調專(zhuān)才，但這次的能力提升確實(shí)巨大。

　　有看客甚至表示：

Claude 3終結了GPT-4時(shí)代。

　　這次Claude 3的兩大更新亮點(diǎn)，一個(gè)是長(cháng)文本，二是多模態(tài)能力。

　　長(cháng)文本就是Anthropic的一個(gè)顯著(zhù)優(yōu)勢，體現為在讀論文、小說(shuō)等字數更多的文本時(shí)，Anthropic更擅長(cháng)理解和回答用戶(hù)的相關(guān)問(wèn)題。

　　這次，Claude 3大大提升了上下文對話(huà)窗口，達到200k——可以理解為單次和模型對話(huà)能夠輸入的文本。

　　具體而言，Claude 3 200k的對話(huà)長(cháng)度，相當于能夠單次處理超過(guò)15萬(wàn)英文單詞，而GPT-4 Turbo的上下文窗口為128k，大約是9.6萬(wàn)個(gè)英文單詞。

　　并且，Claude 3也第一次允許圖像和文檔上傳。和ChatGPT一樣，Claude 3能夠“認”出來(lái)圖里的是什么東西，直接描述，回答用戶(hù)的問(wèn)題。

　　而更令人印象深刻的還是，Claude 3在分析一些復雜問(wèn)題時(shí)，已經(jīng)能夠和人一樣，先拆解問(wèn)題，并且交由子模型來(lái)進(jìn)行調度。

　　在A(yíng)nthropic的演示視頻里，就舉了一個(gè)需要用python模擬經(jīng)濟形勢走向的例子。當把“分析美國十年GDP未來(lái)趨勢”的任務(wù)交給Claude 3之后，Claude就默默地做了這些事：

先打開(kāi)一個(gè)名為“webview”的工具，跳到這個(gè)問(wèn)題相關(guān)的資料網(wǎng)址里
因為有多模態(tài)能力，所以能夠把“看到”的信息，無(wú)論是文字還是圖表，都扒拉下來(lái)，用來(lái)解決問(wèn)題
然后自己寫(xiě)python程序、渲染趨勢圖，讓人類(lèi)看是否正確

　　最有趣的就是，網(wǎng)頁(yè)中如果看到一個(gè)數據圖表，沒(méi)有明確數據的，Claude 3甚至能通過(guò)識別圖像，來(lái)估算每個(gè)階段大概數據是多少，進(jìn)行還原。

　　△搜索引擎中的數據圖表

　　△Claude 3還原的折線(xiàn)圖，估算了每個(gè)時(shí)間節點(diǎn)的具體GDP

　　AI安全也是Anthropic區別于OpenAI的一點(diǎn)。在OpenAI和Anthropic團隊分家的時(shí)候，其最重要分歧正是包含對AI安全的考慮，Anthropic希望建立一個(gè)“更可信”的模型，而OpenAI顯然希望用商業(yè)化驅動(dòng)模型更快地前進(jìn)，路線(xiàn)上更為激進(jìn)。

　　對此，Anthropic采取的措施包括但不限于：制定了一套框架，用于評估和減輕 AI 模型可能帶來(lái)的潛在災難性風(fēng)險，比如繼續擰自動(dòng)化評估和紅隊測試，以確保AI不會(huì )發(fā)展出可能造成傷害的能力。

　　2023年4月，Anthropic甚至開(kāi)源憲法人工智能（Constitutional AI）引起了圈內轟動(dòng)，這是一個(gè)限制模型行為遵守特定憲法原則的AI。

　　以及2024年也是美國大選年， Anthropic 也在準備開(kāi)發(fā)和執行關(guān)于在政治和選舉背景下使用工具的政策，評估模型對選舉錯誤信息、偏見(jiàn)和其他濫用的反應，確保用戶(hù)能夠在選定國家獲得準確和最新的投票信息。

　　不過(guò)，Anthropic也因為太過(guò)重視AI安全，很多問(wèn)題的評估上很謹慎，甚至直接不回答，惹來(lái)一片用戶(hù)吐槽。這次，Anthropic表示，Claude 3在這個(gè)問(wèn)題上大有改進(jìn)。

　　比如，Claude 3的對無(wú)害信息的拒絕回復率，普遍來(lái)到了10%附近，比Claude2.1和2.0都有進(jìn)步。

　　△來(lái)源：Anthropic

　　據CNBC，Anthropic拒絕透露訓練 Claude 3 到底花了多少時(shí)間和多少錢(qián)，但表示 Airtable 和 Asana 等知名SaaS公司有幫忙對模型進(jìn)行了A/B測試，讓模型的可控性也有所改善。

技術(shù)以外，Anthropic商業(yè)化還要再提速

　　盡管Anthropic技術(shù)上又一次拿出了看家實(shí)力，但大模型領(lǐng)域如今已經(jīng)走過(guò)了一年多時(shí)間的技術(shù)競爭。如何從模型走向實(shí)際的產(chǎn)品落地，創(chuàng )造更大的商業(yè)價(jià)值，是懸在所有廠(chǎng)商頭上的劍。

　　如今Anthropic背后站著(zhù)谷歌云、亞馬遜，已經(jīng)和OpenAI（背靠微軟）形成鮮明的陣營(yíng)對比。但從商業(yè)化角度，當前Anthropic遠趕不上OpenAI，這意味著(zhù)Anthropic在2024年會(huì )面臨更大壓力。

　　和ChatGPT一樣，Anthropic也是To B和To C兩條腿走路。在企業(yè)側，Anthropic已經(jīng)服務(wù)了包括 Slack、Notion 和 Quora等用戶(hù)。

　　而據The Information 2023年12月報道， Anthropic預計到2024年底將產(chǎn)生超過(guò)8.5億美元的年化收入。相比起來(lái)，同樣截至2023年底，OpenAI由于ChatGPT的強勁增長(cháng)，年化收入從10月中旬的13億美元就增至16億美元。

　　往后，隨著(zhù)OpenAI商業(yè)化提速，差距還可能越來(lái)越大。The Information援引一些 OpenAI 領(lǐng)導者的觀(guān)點(diǎn)，到 2024 年底，他們預計OpenAI年化收入可以達到50億美元，而其他人則認為可以達到更高的數字。

　　技術(shù)上的軍備競賽遠未結束。在2023年12月，Anthropic還在進(jìn)行新一輪高達7.5億美元的融資，估值為184億美元，相比2023年初41億美元的估值，漲了4.5倍。

THE END

免責聲明：本文系轉載，版權歸原作者所有；刊載之目的為傳播更多信息，如內容不適請及時(shí)通知我們。

相關(guān)熱點(diǎn)

油價(jià)年內第三次上調加一箱油多花約5元

　　據國家發(fā)展改革委網(wǎng)站，根據近期國際市場(chǎng)油價(jià)變化情況，按照現行成品油價(jià)格形成機制，自2024年3月4日24時(shí)起，國內汽、柴油價(jià)格（標準品，下同）每噸分別提高125元、120元?！　?..

汽車(chē)

蘋(píng)果或發(fā)布特別版本

　　近期，有關(guān)蘋(píng)果即將發(fā)布iOS17.4系統的消息引發(fā)了廣泛關(guān)注。據科技記者古爾曼透露，蘋(píng)果公司計劃于2024年3月底發(fā)布一款支持新款硬件的iOS17.4“特別版本”。這個(gè)版本之...

數碼

最新文章

相關(guān)推薦

東京奧運會(huì )中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙航天員劉伯明成功開(kāi)啟天和核心艙節點(diǎn)艙出艙艙門(mén)

微信顯示“正在輸入”，其實(shí)不是在回復消息，背后原因挺“傷人”

科技世界網(wǎng)創(chuàng )立于2009年，宗旨是科技創(chuàng )造財富，網(wǎng)絡(luò )改變世界。多年來(lái)力爭通過(guò)自主創(chuàng )新的技術(shù)實(shí)現為科技企業(yè)創(chuàng )造最大的價(jià)值。

關(guān)于我們 | 聯(lián)系我們 | 版權申明 | 投稿須知 | 網(wǎng)站地圖

認證聯(lián)盟：創(chuàng )宇信用百度企業(yè)

內容投訴：gold_ant@qq.com

數據合作：阿里云科協(xié)產(chǎn)業(yè)園

增值許可證：遼B2-20150256

關(guān)注我們

科技世界官方百家號

關(guān)注官方微信公眾號
探索科技與商業(yè)的邏輯

商務(wù)合作、媒體邀約
趕緊聯(lián)系我們

Copyright ? 2009-2022 twwtn.com 科協(xié)聯(lián)盟榮譽(yù)成員科技世界網(wǎng)僅提供信息傳播載體，所刊登文章僅供參考鄂ICP備2022015873號-1

人人狠狠综合久久亚洲88_国产超薄丝袜足底脚交国产_日本wvvw高清中文字幕_97国产品香蕉在线观看