在無(wú)數科幻游戲、科幻電影以及小說(shuō)中,當科技爆發(fā)到了一定階段,總少不了AI的身影。它們不吃不喝,卻又無(wú)所不知,扮演著(zhù)人類(lèi)身邊“完美搭檔”的角色。
微軟游戲《光環(huán)》中角色——科塔娜(圖源網(wǎng)絡(luò ))
正如一切幻想都需要建立在認知之上,人們對于A(yíng)I的終極思考和幻想,無(wú)論如何也是繞不開(kāi)現實(shí)世界的。
實(shí)際上,盡管人工智能代表了最前沿科學(xué)技術(shù),但它距離我們并不遙遠,對大部分人來(lái)說(shuō),日常用到AI的次數,其實(shí)遠比大家想象中多得多。
AI,隨處可見(jiàn)
眼下談及AI,大家會(huì )想到以ChatGPT代表的眾多生成式AI應用。它們可以自動(dòng)生成文本、摘要、翻譯、對話(huà),也可以用于生成逼真的圖像、視頻和動(dòng)畫(huà),甚至協(xié)助用戶(hù)創(chuàng )作音樂(lè ),幫助開(kāi)發(fā)者撰寫(xiě)代碼等等。
AI能做的事情遠不止這些,只不過(guò)ChatGPT的到來(lái),讓人們對于A(yíng)I能做什么有了切實(shí)體驗。
手機人臉識別
其實(shí)在日常生活中,AI應用隨處可見(jiàn),比如在A(yíng)I視覺(jué)方面,小區的門(mén)禁系統,手機的人臉解鎖,超市的人臉支付等等都用到了AI人臉識別技術(shù)。
還有每個(gè)人都離不開(kāi)的智能手機,同樣應用了大量的AI技術(shù)。最典型的就是影像場(chǎng)景,手機以遠不及相機的光學(xué)素質(zhì)卻能拍出媲美專(zhuān)業(yè)設備的夜景照片和視頻,AI在其中起到了決定性的作用。
以最新的驍龍8Gen2第二代驍龍8旗艦手機為例,高通給第二代驍龍8移動(dòng)平臺注入了強悍的AI“靈魂”,使得智能手機的拍照體驗得到了進(jìn)一步的提升。高通在驍龍平臺打造了業(yè)內首個(gè)“認知ISP”,由此還實(shí)現了一種叫“實(shí)時(shí)語(yǔ)義分割”的技術(shù),該技術(shù)有點(diǎn)類(lèi)似PS中的圖像分層,可針對圖像中的不同區域進(jìn)行獨立優(yōu)化,大到背景,小到面部細節,都能進(jìn)行獨立優(yōu)化。
具體來(lái)說(shuō),大家平時(shí)拍照時(shí)用到的背景虛化,或者更換風(fēng)格化背景圖案,以及針對人像用到的一些美顏、美膚處理等等,借助實(shí)時(shí)語(yǔ)義分割實(shí)現起來(lái)將變得更加輕松。
這是AI在移動(dòng)影像中的簡(jiǎn)單用例,但透過(guò)這個(gè)例子,不難發(fā)現今天的智能手機早已和AI深深綁定。事實(shí)上,除了OCR掃描、智能語(yǔ)音助手、圖庫分類(lèi)、屏幕識別、面部識別這類(lèi)比較常見(jiàn)的手機AI應用外,AI還在網(wǎng)絡(luò )連接、音頻、游戲、續航方方方面發(fā)揮著(zhù)重要作用,比如上網(wǎng)時(shí),合理分配網(wǎng)絡(luò ),讓蜂窩信號、Wi-Fi更穩定;玩游戲時(shí),智能調用系統資源,讓畫(huà)面更流暢等等。
終端側算力大漲,AI大模型下沉
和智能手機一樣,AI在汽車(chē)、XRP、PC、物聯(lián)網(wǎng)領(lǐng)域同樣有著(zhù)廣泛的應用,也正是基于這種“AI+”的形式,從而涌現出了更多創(chuàng )新的應用場(chǎng)景,進(jìn)一步豐富用戶(hù)體驗。
無(wú)論是手機還是汽車(chē),作為獨立的終端產(chǎn)品,與AI相結合確實(shí)有那么點(diǎn)天作之合的意思。但必須承認,盡管此前業(yè)界討論AI的聲量很大,但距離大模型AI真正落地終端側,還是有一段距離的。
不同于云端AI,在終端側部署AI不是說(shuō)想做就能輕易實(shí)現的,比如算力問(wèn)題。和云端可以提供的算力相比,終端側所能提供的算力就很有限了,像目前比較火的一些大模型,過(guò)去就很難在智能手機這樣的終端產(chǎn)品上運行。這就意味著(zhù),想要AIGC應用在智能手機上有個(gè)很好的體驗,其實(shí)很不容易,正如在云端生成一張AI圖片可能只需要十幾秒,但在手機上可能就要幾分鐘甚至更久,體驗可以說(shuō)是大打折扣。
不過(guò)“有難度”并不代表“沒(méi)可能”。其實(shí)早在今年2月份,高通就已經(jīng)發(fā)布了全球首個(gè)運行在A(yíng)ndroid手機上的Stable Diffusion終端側演示,Stable Diffusion本身就是一個(gè)基于輸入的文本生成圖片的AI模型,它的參數超過(guò)10億,這樣的參數規模過(guò)去只能在云端計算集群內運行,現如今也終于可以在終端側運行了。
很顯然,沒(méi)有強力的算力作為支撐,實(shí)現這樣的“壯舉”幾乎是不可能的。而高通之所以可以首個(gè)實(shí)現,這里不得不說(shuō)到驍龍移動(dòng)平臺。
以最新的第二代驍龍8移動(dòng)平臺為例,這款芯片的AI計算能力已經(jīng)是天花板級別的了。
根據全球知名的AI基準測試網(wǎng)站AI-Benchmark排名統計,我們發(fā)現在前十位的智能手機中,搭載第二代驍龍8移動(dòng)平臺的機型就占據了八席,其中就包括第一到第七名。
事實(shí)上,第二代驍龍8移動(dòng)平臺能夠在A(yíng)I計算方面大殺四方并不令人感到意外,它搭載最新的高通AI引擎,全新升級了Hexagon處理器,支持更高規格的張量加速器,并且增加硬件加速,從而可以快速高效地運行Transformer網(wǎng)絡(luò ),這也使得第二代驍龍8在自然語(yǔ)言處理應用上有著(zhù)更突出的優(yōu)勢。
除此之外,驍龍移動(dòng)平臺一向具備出色的可拓展性,大部分驍龍移動(dòng)平臺通常都有一個(gè)Hexagon處理器,但如果面向的對象對AI計算量需求更高,比如汽車(chē),則會(huì )使用兩個(gè)甚至多個(gè)Hexagon處理器來(lái)提高算力,這無(wú)疑為在更多元的終端設備上部署AI提供了強大的算力支持。
高通AI軟件棧,跨終端部署利器
借助第二代驍龍8移動(dòng)平臺,讓我們看到了高通在硬件方面的一些優(yōu)勢,其實(shí)在推動(dòng)終端側AI部署過(guò)程中,高通在軟件方面所提供的技術(shù),同樣起到至關(guān)重要的作用。
此前高通發(fā)布了可使AI由單一終端較容易地擴展到其他各種終端的高通AI軟件棧(Qualcomm AI Stack),它為OEM廠(chǎng)商和開(kāi)發(fā)者提供一套完整的AI解決方案,這套方案是集成所有AI框架、開(kāi)發(fā)者庫、操作系統的整合平臺,也同時(shí)具備了“一次開(kāi)發(fā),多終端使用”的特點(diǎn),簡(jiǎn)單來(lái)說(shuō),用戶(hù)只需要開(kāi)發(fā)一次模型,就能在不同的高通產(chǎn)品創(chuàng )建、優(yōu)化和部署其AI應用,充分利用高通AI引擎的性能。
前面我們提到了高通AI Research利用高通AI軟件棧執行全棧AI優(yōu)化,這一全棧優(yōu)化最終讓Stable Diffusion能夠在智能手機上運行,在15秒內執行20步推理,生成一張512x512像素的圖像。
而在智能手機上運行Stable Diffusion只是開(kāi)始。目前,高通已經(jīng)能夠實(shí)現在搭載驍龍計算平臺的筆記本電腦上運行Stable Diffusion,憑借行業(yè)領(lǐng)先的高通AI引擎,基于驍龍計算平臺的筆記本電腦在MLCommons V3.0上率先實(shí)現了出色的MLPerf基準測試結果。在終端側運行如此大規模AI用例,高通再一次走在了行業(yè)前面。
最后:
作為終端側AI的重要推動(dòng)者,高通已經(jīng)成為推動(dòng)終端側AI規?;l(fā)展的關(guān)鍵力量,相關(guān)技術(shù)正在賦能數十億的終端產(chǎn)品。如今看來(lái),無(wú)論是單一產(chǎn)品優(yōu)秀的性能功耗表現,還是規?;晒?,以及跨AI應用、模型、硬件與軟件的全棧終端側AI優(yōu)化,高通都存在著(zhù)顯著(zhù)優(yōu)勢。
很顯然,在A(yíng)I即將迎來(lái)“質(zhì)變”的關(guān)鍵時(shí)刻,高通正扮演著(zhù)愈發(fā)關(guān)鍵的角色。甚至就在不久前,高通正式發(fā)布《混合AI是AI的未來(lái)》白皮書(shū),明確提出了云邊一體混合AI發(fā)展路徑。從架構設計來(lái)看,混合AI適用于幾乎所有生成式AI應用和終端領(lǐng)域,而且具備低成本、高效率、低能耗、運行穩定、隱私性強等優(yōu)勢,對開(kāi)發(fā)者,對用戶(hù),都可以說(shuō)是非常值得期待的。
無(wú)論如何,AI發(fā)展的終極目標還是更好服務(wù)于人,這個(gè)過(guò)程肯定艱難的,不過(guò)也正因為有了更多人的努力,才讓目標離我們越來(lái)越近,直至觸手可及。