首位“AI軟件工程師”亮相引爆科技圈

智能AI
TIME
2024-03-15 09:46
科技日報
分享

  一家成立不到兩個(gè)月但擁有十名天才工程師的初創(chuàng )公司Cognition,搞了一個(gè)引爆科技圈的大動(dòng)作。

  他們推出了一款名為Devin的人工智能(AI)助手,可以協(xié)助人類(lèi)軟件工程師完成諸多開(kāi)發(fā)任務(wù)。Devin不同于現有其他AI編碼者,它可以從零構建網(wǎng)站、自行部署應用、修復漏洞、學(xué)習新技術(shù)等,人類(lèi)只需扮演一個(gè)下指令和監督的角色。

  這是第一個(gè)真正意義上完全自主的AI軟件工程師,一亮相即掀起軒然大波,因為人們擔心:人類(lèi)程序員是不是真要失業(yè)了?

  測試表現超越“同輩”

  據Cognition官網(wǎng)報道,Devin只需一句指令,即可端到端地處理整個(gè)開(kāi)發(fā)項目。

  按照用戶(hù)需求,Devin可以同時(shí)執行多步驟工作流程,人類(lèi)工程師則可以實(shí)時(shí)觀(guān)察其進(jìn)度,發(fā)現錯誤時(shí),跳出指令進(jìn)行修正。這便于工程師們將大部分工作“外包”給AI,自己則可以潛心于創(chuàng )意性工作。

  在SWE-bench基準測試中,Devin的表現遠超Claude 2、Llama、GPT-4等選手,能夠完整正確地處理13.86%的問(wèn)題。相較之下,GPT-4只能處理1.74%的問(wèn)題。更重要的是,Devin在測試中沒(méi)有得到任何幫助,而其他所有模型都需要幫助,即人們要準確告知模型需要編輯哪些文件。

  這一進(jìn)展,標志著(zhù)AI在自主理解和解決軟件開(kāi)發(fā)問(wèn)題方面取得了顯著(zhù)進(jìn)步。目前,Devin已經(jīng)成功通過(guò)一家AI公司面試,并且在Upwork上完成了實(shí)際工作。

  運作幾乎完全自主

  Devin的厲害之處,還在于可以規劃和執行異常復雜的工程任務(wù),這類(lèi)任務(wù)通常需要數千個(gè)決策才能完成。在這之中,無(wú)論進(jìn)行到任何一步,它都可以回調所有相關(guān)的上下文信息,保證任務(wù)的邏輯性,也便于隨時(shí)校正。

  更讓人震撼的是,Devin不僅能幫人們解決代碼,還囊括了與之相關(guān)的整個(gè)工作流。

  譬如,當工程師需要設計一個(gè)網(wǎng)頁(yè)游戲時(shí),Devin首先能生成網(wǎng)頁(yè),接著(zhù)還能完成服務(wù)端的部署,最后直接發(fā)布上線(xiàn),省去了中間大量人工操作。甚至在發(fā)現漏洞之后,Devin還會(huì )回溯報錯出現的位置及對應的數據,然后分析原因并給出解決方案。

  此外,作為一個(gè)AI全能助手,Devin還可以幫助人類(lèi)訓練和微調其他AI。對于一些常見(jiàn)的模型,你只需要提及模型的名稱(chēng),Devin自己就知道要怎樣去訓練。

  那人們需要做什么呢?按設想,最終的Devin會(huì )讓人類(lèi)只需要發(fā)號施令,其他什么也不用做。

  對軟件開(kāi)發(fā)業(yè)影響深遠

  初創(chuàng )公司Cognition雖然只有十名員工,但他們手中卻握著(zhù)十塊IOI(國際信息學(xué)奧林匹克競賽)金牌,核心創(chuàng )始團隊為3名華人。

  Devin現處于內測階段,有意用戶(hù)可申請提前試用。目前,團隊尚未透露更多核心技術(shù)細節,但他們表示,Devin源于其長(cháng)期推理及規劃研究的進(jìn)展。編碼只是第一步,這一AI助手其實(shí)可推廣到更寬領(lǐng)域。

  Devin的出現,可能對軟件開(kāi)發(fā)行業(yè)產(chǎn)生深遠影響,甚至可能減少對人類(lèi)開(kāi)發(fā)者的需求。但須注意到,該技術(shù)仍處于早期階段,其成熟度和效果需要業(yè)界作進(jìn)一步評估。

  就目前而言,Devin的成功可以說(shuō)為當今軟件開(kāi)發(fā)人員帶來(lái)更新更好的AI協(xié)作體驗。人們從繁瑣工作中“解放”,只需監督AI系統去處理,而自己將精力投入到創(chuàng )新性任務(wù)上,實(shí)現生產(chǎn)力的真正提高。


THE END
免責聲明:本文系轉載,版權歸原作者所有;刊載之目的為傳播更多信息,如內容不適請及時(shí)通知我們。

相關(guān)熱點(diǎn)

  日前,家住上海普陀區的王先生夫婦正在考慮裝修新房子,但還未開(kāi)始就已經(jīng)“困難重重”。首先是糾結選擇買(mǎi)什么,什么樣的家電能滿(mǎn)足全家人的需求,家電與家居怎樣才能風(fēng)格...
互聯(lián)網(wǎng)
  據新華網(wǎng)報道,3月13日20時(shí)51分,我國在西昌衛星發(fā)射中心使用長(cháng)征二號丙運載火箭/遠征一號S上面級發(fā)射DRO-A/B衛星,運載火箭一二級飛行正常,上面級飛行異常,衛星未準確進(jìn)...
業(yè)界

相關(guān)推薦

1
3
人人狠狠综合久久亚洲88_国产超薄丝袜足底脚交国产_日本wvvw高清中文字幕_97国产品香蕉在线观看