近年來(lái),生成式人工智能的發(fā)展如火如荼,從通用大模型、行業(yè)大模型,到智能體、智能機器人。大模型和智能體的方式都有研發(fā)和應用之意,前者研發(fā)的理論性多些,后者更傾向應用研發(fā),都力圖盡快進(jìn)入應用。但發(fā)展過(guò)程難免存在認知和操作上的一些矛盾。將AI研發(fā)與應用統一起來(lái),旨在提升人工智能水平、促進(jìn)人工智能產(chǎn)業(yè)發(fā)展。
生成式AI在研發(fā)與應用過(guò)程的矛盾
?? AI發(fā)展無(wú)疑會(huì )帶來(lái)巨大潛力和廣闊的應用前景。對AI大模型、行業(yè)模型、智能體、機器人的研發(fā),是科學(xué)、技術(shù),還是工程,有不同的說(shuō)法,也引發(fā)研發(fā)和應用上的若干分歧。
1、大模型研發(fā)擴張與應用減緩的矛盾
大模型的出現顛覆了人們的認知,在驚嘆其大突破的同時(shí),不少公司將大模型研發(fā)作為投資熱點(diǎn),搶占制高點(diǎn),但起初對大模型規律并不清晰,研發(fā)中面對龐大的算力、規模數據和算法的要求,200多家公司從事大模型研發(fā)有可能造成重復建設、資源浪費。雖然通用大模型在營(yíng)銷(xiāo)、辦公、客服、人力資源、基礎作業(yè)等領(lǐng)域也開(kāi)始一些應用,但對AI已有成果的應用有所減緩。而且通用大模型更適合to-c,面向產(chǎn)業(yè)轉化較少,而投資、科技、企業(yè)、社會(huì )、媒體都將眼光盯在模型的功效上。以至有人呼吁不要卷模型,要卷應用。沒(méi)有應用,大模型將一文不值。事實(shí)上,也不能讓人們的注意力長(cháng)期停留在對大模型的爭論和焦慮中,要讓搞科技的人關(guān)注AI深入研發(fā),讓更多企業(yè)集中在A(yíng)I已有成果的應用,在發(fā)揮各自作用中推進(jìn)人工智能的探索和發(fā)展。
2、通用大模型與行業(yè)大模型的差異
AI大模型研發(fā)從全面探索轉向規模試點(diǎn)和特定領(lǐng)域的智能生成,需要根據不同領(lǐng)域的需求定制AI解決方案。通用大模型、行業(yè)大模型,都是生成式AI的嶄新探索,前者傾向廣泛領(lǐng)域和理論研發(fā),后者多是特定領(lǐng)域的應用研發(fā)。由于研發(fā)通用大模型數據需求量大,算力損耗多,很難較快地應用落地,于是不少公司轉向行業(yè)、產(chǎn)業(yè)和企業(yè)的垂直模型研發(fā),這是探索和實(shí)踐中的選擇。圍繞大模型的深入研發(fā)和已有成果的盡快應用,在爭論中逐漸形成兩種較為明顯的態(tài)度:一種是追求技術(shù),主張走通用大模型之路,提高“更大更強的AI能力”;一種是將AI成果盡快用到市場(chǎng),要多發(fā)展行業(yè)模型,走產(chǎn)業(yè)之路,認為將“足夠的AI能力”投入快速變現到商業(yè)場(chǎng)景,用市場(chǎng)龐大而獨特的數據構筑壁壘。兩者都有道理,但易走極端,應該倡導兩者相互理解吸收,把力量集中在符合我國實(shí)際的研發(fā)和應用上,推進(jìn)“人工智能+”的落地和發(fā)展。
3、開(kāi)源模式與閉源模式的張力
大模型的開(kāi)源和閉源是研發(fā)企業(yè)選擇的不同模式。開(kāi)源是開(kāi)放源代碼,允許任何人獲得并修改軟件的源代碼,通過(guò)更大范圍的開(kāi)發(fā)者、研究者和愛(ài)好者的合作,拓寬技術(shù)創(chuàng )新邊界,為人工智能發(fā)展注入活力。閉源是將軟件源代碼僅由軟件編寫(xiě)者或系統開(kāi)發(fā)商掌握,通過(guò)核心技術(shù)和商業(yè)模式的保護,使企業(yè)從技術(shù)成果中獲得經(jīng)濟回報,在涉及敏感信息和高安全要求領(lǐng)域,閉源形式尤為重要。兩種模式反映技術(shù)進(jìn)步與社會(huì )價(jià)值、經(jīng)濟效益與安全保障之間的平衡探索。開(kāi)源和閉源之爭實(shí)際是對這種平衡的不同選擇和追求。選擇開(kāi)源的企業(yè)希望通過(guò)全球合作推動(dòng)技術(shù)創(chuàng )新和應用發(fā)展;選擇閉源的企業(yè)以保護其技術(shù)和商業(yè)利益為主。例如,Open AI 發(fā)布的o1模型,在交互過(guò)程中默認隱藏了思維鏈,也可能不想讓其他開(kāi)發(fā)者和用戶(hù)看到模型思考過(guò)程。開(kāi)源和閉源彼此的張力,體現在商業(yè)模式和技術(shù)選擇上,反映不同企業(yè)對未來(lái)發(fā)展的戰略考慮。
黑石集團董事長(cháng)蘇世民認為,企業(yè)更有利于研發(fā)大模型,從數據積累、算力投入、研發(fā)本身的技術(shù)和工程性質(zhì),似乎企業(yè)比大學(xué)研發(fā)更有優(yōu)勢,更易突破。而且通用大模型研發(fā)還可給行業(yè)模型、智能體以及各行各業(yè)賦能,應用中各行業(yè)豐富的場(chǎng)景、海量的數據、優(yōu)勢的資源投入,又在強化通用大模型研發(fā),使科技研發(fā)和應用相輔相成,達到統一。
如何將AI研發(fā)與應用統一起來(lái)
AI的研發(fā)和應用是邏輯發(fā)展的統一,出現上述現象有著(zhù)特殊背景和原因,需在深入發(fā)展中化解。
1、發(fā)展鏈路將研發(fā)與應用統一起來(lái)
大模型出現以來(lái),生成式人工智能逐漸形成“大模型—行業(yè)模型—智能體—機器人”的發(fā)展鏈路。各環(huán)節都有相對獨立性,按照技術(shù)邏輯,它們排列有序地發(fā)展。
一要重點(diǎn)發(fā)展幾家通用大模型,提高我國AI技術(shù)競爭力。對通用大模型尚無(wú)統一的定義,多數人理解的大模型,包括大語(yǔ)言模型和多模態(tài)大模型。通用大模型在技術(shù)和理論上展現出強大能力,可為各個(gè)領(lǐng)域賦能并帶來(lái)機遇,是重塑人類(lèi)社會(huì )的重要因素。通用大模型不僅需要的參數規模大,算力規模大,而且在遇到數據瓶頸、算力瓶頸的情況下,走到無(wú)盡的前沿,不知道還要多長(cháng)時(shí)間、還需多大投入,才能有新的突破。月之暗面的CEO楊植麟認為解,Open AI o1模型就是在天然數據不夠用時(shí),用較好的基礎模型強化學(xué)習,創(chuàng )造出很多非天然數據,提高了數據質(zhì)量和計算效率,進(jìn)而產(chǎn)生出更深入的思考和推理,實(shí)際上他們創(chuàng )新出一種新的范式。
深入研發(fā)通用大模型,需要不斷挑戰,奔向通用人工智能的目標。因此,搞大模型研發(fā)的企業(yè)不必過(guò)多。由于美國對我采取AI技術(shù)限制,我國必須要有一些具備世界競爭力的通用大模型。人工智能專(zhuān)家吳軍認為,“現在全世界大模型成規模的沒(méi)幾家,美國大概5-10家,歐洲基本上就法國一家,若每個(gè)國家建一個(gè)大模型不可能,這很燒錢(qián),我國應重點(diǎn)扶植不超過(guò)10家?!蹦壳?,我國的baichuan3、智譜glm-4、騰訊混元、通義千問(wèn)2.1、文心一言4.0、華為盤(pán)古、月之暗面的Kimi、抖音的豆包、阿里通義千問(wèn)Qwen2、可靈AI等大模型走在前列,除上述大模型做得好的公司,我國互聯(lián)網(wǎng)大廠(chǎng)、相關(guān)大型企業(yè)擁有規模數據,有實(shí)力解決算力問(wèn)題,也符合大模型研發(fā)的條件。
大模型具備通識和泛化能力,由于應用中存在數據隱私和算法偏見(jiàn)、數學(xué)和邏輯推理能力不足等問(wèn)題,通用大模型很難滿(mǎn)足具體行業(yè)的特定需求、專(zhuān)業(yè)性能和經(jīng)濟效率,缺少細分度更高的產(chǎn)品,在公有云提供服務(wù)中會(huì )造成企業(yè)私有數據、敏感數據安全性的擔憂(yōu),使用中還需通過(guò)傳統的磨合流程來(lái)實(shí)現產(chǎn)品與市場(chǎng)的契合,將通用大模型融入核心業(yè)務(wù)流程的案例不多,而行業(yè)大模型更有利于發(fā)展專(zhuān)業(yè)能力和精準賦能。但也有專(zhuān)家認為,現在的產(chǎn)品很大程度由模型能力決定,要把產(chǎn)品和模型更緊密地結合起來(lái)去思考。比如產(chǎn)品上想做一個(gè)功能,背后需要對應模型能力的支撐。還有互聯(lián)網(wǎng)大廠(chǎng)的企業(yè)家強調大模型賦能智能體,其實(shí)踐意義更大,應用前景廣闊。
二要大力發(fā)展行業(yè)模型和業(yè)務(wù)模型,發(fā)揮我國產(chǎn)業(yè)齊全和技術(shù)應用的優(yōu)勢。行業(yè)模型“利用通用大模型技術(shù),針對特定數據和任務(wù)進(jìn)行訓練或優(yōu)化,形成具備專(zhuān)用知識與能力的模型及應用。國際上更多用垂直模型來(lái)表示,我國還有垂類(lèi)模型、領(lǐng)域模型、專(zhuān)屬模型等稱(chēng)謂?!?行業(yè)模型本質(zhì)上是解決方案。從用戶(hù)在乎產(chǎn)品而非技術(shù)的實(shí)際出發(fā),盡快把技術(shù)轉化成產(chǎn)品,才有利解決問(wèn)題。行業(yè)大模型提供的不僅是產(chǎn)品和工具,還有定制服務(wù)與支持,需要客戶(hù)參與共建。
一方面,企業(yè)為提升競爭力和智能化轉型,滿(mǎn)足市場(chǎng)需求,想將數據轉化為核心驅動(dòng),主動(dòng)尋找最佳模型;另一方面,AI技術(shù)公司也在選擇對人工智能提升發(fā)展質(zhì)量有需求的特定行業(yè)、企業(yè)、產(chǎn)業(yè)開(kāi)展合作。研發(fā)方和需求方結合,共同深耕 “人工智能+行業(yè)\產(chǎn)業(yè)\企業(yè)”,利用行業(yè)專(zhuān)業(yè)數據或私有數據、特色應用場(chǎng)景等獨特資源,對模型定制調整和優(yōu)化,會(huì )較快地進(jìn)入應用,針對性地解決問(wèn)題,產(chǎn)生價(jià)值。行業(yè)模型和智能體是相互關(guān)聯(lián)和互補的技術(shù),共同推動(dòng)AI技術(shù)的產(chǎn)業(yè)化。
三要把智能體和機器人作為智能發(fā)展的重點(diǎn),培植和壯大智能產(chǎn)業(yè)。智能體是具有智能的實(shí)體。以云為基礎,以AI為核心,構建一個(gè)立體感知、全域協(xié)同、精準判斷、持續進(jìn)化、開(kāi)放的智能系統。智能體包括智能行為的物理實(shí)體和虛擬存在,比如物理形態(tài)的機器人和虛擬形態(tài)的數字人。
智能體遠超近年國內使用的Siri、小愛(ài)同學(xué)、天貓精靈等智能助手。智能體可以幫助我們處理更加復雜的任務(wù)。在大模型技術(shù)加持下,智能體將具有自主性、感知性和行動(dòng)能力,在復雜環(huán)境中自主決策、學(xué)習進(jìn)化,更接近人類(lèi)智能本質(zhì)。隨著(zhù)新型芯片技術(shù)的涌現,將會(huì )出現無(wú)人汽車(chē)、無(wú)人機、機器人等顛覆性的智能體,將實(shí)現更高層次的智能化。這種應用驅動(dòng)的AI研發(fā),目的使智能體成為人類(lèi)廣泛使用的商品,并根據使用環(huán)境和用處,按需求定制形狀、大小及功能不同的智能體。
機器人是智能體中重要的一種,跟傳統機器人相比,具身智能機器人有泛化性?xún)?yōu)勢。傳統工業(yè)機器人可解決固定搬運、固定點(diǎn)位的焊接、噴涂等相對固定的方式的問(wèn)題,但在工序復雜的總裝過(guò)程,工業(yè)機器人還不如人工安裝。大模型賦能的智能機器人就可應對此類(lèi)問(wèn)題。工業(yè)用智能機器人會(huì )快于家用機器人落地應用,約在3到7年可批量生產(chǎn)。家用機器人因任務(wù)復雜程度高,任務(wù)完成的滿(mǎn)意程度不同,需要5到10年才可量產(chǎn)。
上述智能方式都需技術(shù)研發(fā),都有很高應用價(jià)值,共同構成人工智能發(fā)展格局。研發(fā)為應用打基礎,應用是研發(fā)的目的,宏觀(guān)上體現了研發(fā)與應用的統一。
?2、揚長(cháng)避短將AI研發(fā)和應用統一起來(lái)
AI發(fā)展有研發(fā)、應用等環(huán)節,但并非每個(gè)企業(yè)都要按順序將各環(huán)節做一遍。在全球化、數智化、市場(chǎng)化條件下,要揚長(cháng)避短才能在A(yíng)I的發(fā)展中相互成就和發(fā)展。目前,在人工智能各環(huán)節,美國處于研發(fā)領(lǐng)先地位并帶動(dòng)著(zhù)應用。美國去工業(yè)化后,其產(chǎn)業(yè)結構以金融和服務(wù)業(yè)為主,通用大模型的應用,主要覆蓋金融、財務(wù)、審計、研發(fā)、法律、醫療等領(lǐng)域。我國產(chǎn)業(yè)齊全、制造業(yè)發(fā)達,更適合AI快速應用于產(chǎn)業(yè)、行業(yè)和社會(huì )。加之我國具有互聯(lián)網(wǎng)應用、數字技術(shù)應用的經(jīng)驗,在通用大模型研發(fā)帶動(dòng)下,已在金融、服務(wù)、文教、醫療、創(chuàng )作等通用模型易應用的領(lǐng)域廣泛落地。
現在除加大幾家通用大模型研發(fā)力度外,要發(fā)揮我國技術(shù)應用優(yōu)勢,重點(diǎn)加強AI行業(yè)大模型、業(yè)務(wù)模型、智能體、機器人等不同方式的應用研究。使少數骨干公司的大模型研發(fā)成為賦能各項AI應用的“蓄水池”,使AI各種方式的應用直接服務(wù)于具體產(chǎn)業(yè),使它們既承接通用大模型的技術(shù)賦能,又能結合行業(yè)、企業(yè)和社會(huì )應用的場(chǎng)景和需要,向著(zhù)智能產(chǎn)業(yè)、智能應用的方向發(fā)展,并將豐富的應用場(chǎng)景等資源和問(wèn)題反哺大模型、行業(yè)模型的研發(fā),形成通用大模型與AI應用“相輔相成、相互促進(jìn)”的良性循環(huán)。
3.運用靈活方式將研發(fā)與應用統一起來(lái)
2023年中期,我國200多家公司相對集中在通用大模型的研發(fā)上,在全球研發(fā)大模型的數量最多。隨著(zhù)AI技術(shù)邏輯的演進(jìn),不斷深化對大模型的認識,無(wú)論從能力、需求、成本、市場(chǎng)等方面看,不需要更多公司都擠在大模型研發(fā)的獨木橋。當初一些研發(fā)大模型的公司,轉變到AI應用研究或AI應用的方向。一種方式是,原先做大模型的公司改做行業(yè)大模型,它們積累了扎實(shí)的知識基礎和豐富的交互體驗,知道如何承接大模型的技術(shù)賦能,從而做好行業(yè)模型。另一種方式是,基于一些通用大模型的開(kāi)源模式,開(kāi)展行業(yè)大模型研發(fā),能對模型結構、參數等按需調整,更好地適配個(gè)性化應用需要?!笆袌?chǎng)上諸多金融、法律、教育、傳媒、文旅等行業(yè)模型,大多是在Llama、SD、GLM、Baichuan等國內外主流開(kāi)源大模型基礎上構建的?!?兩種方式都不用過(guò)大的算力和數據,省去很多訓練時(shí)間和成本,又能放心地利用私有數據提升應用效果,減少數據安全疑慮,很好地將AI技術(shù)研發(fā)轉化到應用研究上來(lái)。
還有一種方式,就是開(kāi)發(fā)比行業(yè)模型更靈活的領(lǐng)域模型或業(yè)務(wù)模型,它適合國內市場(chǎng)極度豐富的業(yè)務(wù)場(chǎng)景,能促成生成式人工智能商業(yè)化。領(lǐng)域模型更適合超大規模的AI應用市場(chǎng)和多種服務(wù)模式。中國信息通信研究院公布的數據顯示,2023年我國人工智能產(chǎn)業(yè)應用進(jìn)程持續推進(jìn),核心產(chǎn)業(yè)規模達到5784億元。不少屬于行業(yè)大模型和領(lǐng)域模型以及AI工具的應用。有家公司2023年做AI視頻面試,比上年翻了一倍以上?,F在校招面試成本很貴,他們用AI視頻取代微信私域營(yíng)銷(xiāo),面試打分客觀(guān),還會(huì )追問(wèn)應試者,場(chǎng)景很多,達到降本增效的目的。義烏一個(gè)女老板應用前沿的AI視頻,化身語(yǔ)言達人,熟練切換多國外語(yǔ),介紹自家生意,打造了全新的應用場(chǎng)景。諸如此類(lèi)的AI研發(fā)和應用,都值得推廣。
提升人工智能發(fā)展質(zhì)量和價(jià)值的建議
我國人工智能的研發(fā)勢頭正旺,智能產(chǎn)業(yè)前景樂(lè )觀(guān),AI應用將會(huì )蓬勃發(fā)展。從目前的探索和實(shí)踐看,尚需夯實(shí)AI的基礎建設,致力于技術(shù)創(chuàng )新,拓寬商用渠道,統籌處理AI的研發(fā)、產(chǎn)業(yè)化和應用的關(guān)系。
1、營(yíng)造良好的政策和服務(wù)環(huán)境
我國已就AI的標準、能力、倫理、創(chuàng )新、治理等方面,出臺了相關(guān)政策和法律,以確保技術(shù)發(fā)展符合社會(huì )的價(jià)值觀(guān)和倫理標準,形成擁抱AI發(fā)展的社會(huì )環(huán)境,政府部門(mén)、行業(yè)協(xié)會(huì )和市場(chǎng)監管方面,對剛起步的生成式AI的研發(fā)和應用,應多包容,多服務(wù),逐漸引導規范,使其走上健康的智能發(fā)展路子。
2、AI技術(shù)產(chǎn)業(yè)化要為產(chǎn)業(yè)的智能化開(kāi)路
網(wǎng)絡(luò )運營(yíng)商、軟硬件設備終端提供商、互聯(lián)網(wǎng)企業(yè),是大模型應用的先行者。它們數字化程度高、數據積累豐富、技術(shù)接受能力強,會(huì )成為大模型落地較早的行業(yè)。這些行業(yè)的大模型應用場(chǎng)景廣泛,覆蓋了營(yíng)銷(xiāo)、客服、內容生成等諸多環(huán)節,目前已有豐富和成熟的經(jīng)驗,它們的帶動(dòng)示范和提供的大模型服務(wù)、工具、產(chǎn)品,正在傳導到制造等產(chǎn)業(yè),促進(jìn)企業(yè)從數字化向智能化轉型升級。隨著(zhù)各種智能方式和載體逐漸成熟落地,企業(yè)會(huì )在改造、提升傳統產(chǎn)業(yè)的同時(shí),向著(zhù)產(chǎn)業(yè)智能化快速發(fā)展。
3、打造堅實(shí)的AI技術(shù)底座
加大算力中心建設力度,促進(jìn)算力統籌協(xié)同,隨著(zhù)國產(chǎn)算力性能和易用性的提升,將會(huì )獲得AI公司和應用企業(yè)的青睞;要有效地積聚高質(zhì)量的數據,擴大數據交易,發(fā)揮數據的資源和要素作用;以創(chuàng )新精神研發(fā)智能產(chǎn)業(yè)的不同載體,避免同質(zhì)化,體現技術(shù)、產(chǎn)業(yè)和應用的特點(diǎn)和優(yōu)勢,創(chuàng )造與眾不同的產(chǎn)品和服務(wù),提升價(jià)值,積極推廣。
*本文刊載于《通信世界》
總第956期 2024年11月25日 第22期