5月23日,業(yè)內首款存算一體大算力AI元器件在南京后摩智能公司成功點(diǎn)亮,并成功跑通智能駕駛算法模型。該器件基于架構創(chuàng )新,采用SRAM(靜態(tài)隨機存取存儲器)作為存算一體介質(zhì),通過(guò)存儲單元和計算單元的深度融合,實(shí)現了高性能和低功耗,樣片算力達20TOPS,可擴展至200TOPS,計算單元能效比高達20TOPS/W。與傳統架構下的大算力器件相比,它在算力、能效比等方面都具有顯著(zhù)的優(yōu)勢。
在智能駕駛等計算場(chǎng)景中,除了對算力需求高外,對器件的功耗和散熱也有很高的要求。目前,常規架構器件設計中,內存系統的性能提升速度大幅落后于處理器的性能提升速度,有限的內存帶寬無(wú)法保證數據高速傳輸,無(wú)法滿(mǎn)足高級別智能駕駛的計算需求。其次,數據來(lái)回傳輸又會(huì )產(chǎn)生巨大的功耗。
為此,后摩智能通過(guò)走差異化創(chuàng )新之路,在國內率先通過(guò)底層架構創(chuàng )新,進(jìn)行大算力AI器件設計。研發(fā)人員根據傳統存儲器件重新設計電路、單元陣列、工具鏈等,同時(shí)突破了多項物理和結構上的技術(shù)難題。
據悉,該款器件采用22納米成熟工藝制程,在提升能效比的同時(shí),還能有效把控制造成本。同時(shí),首次在存內計算架構上跑通了智能駕駛場(chǎng)景下多場(chǎng)景、多任務(wù)算法模型,為高級別智能駕駛提供了一條全新的技術(shù)路徑。未來(lái)有可能用W級別的功耗提供P級別的計算能力,更好地滿(mǎn)足高級別智能駕駛時(shí)代的需求。此外,在靈活性方面,它不但支持市面上的主流算法,還可以支持不同客戶(hù)定制,更加適配于算法的高速迭代。