近日,深度求索(DeepSeek)旗下DeepSeek-R1、V3、Coder等全系列大模型正式接入國家超算互聯(lián)網(wǎng)平臺。據介紹,DeepSeek-R1專(zhuān)注于自然語(yǔ)言處理,具備強大的文本生成能力;DeepSeek-V3聚焦于圖像生成,能夠生成高分辨率和細節豐富的圖像,適用于廣告、藝術(shù)創(chuàng )作等多個(gè)場(chǎng)景;DeepSeek-Coder是一款代碼生成模型,能夠協(xié)助開(kāi)發(fā)者快速構建程序,提高開(kāi)發(fā)效率。
超算互聯(lián)網(wǎng)是以互聯(lián)網(wǎng)思維運營(yíng)超算中心,并連接產(chǎn)業(yè)生態(tài)中的算力供給、應用開(kāi)發(fā)、運營(yíng)服務(wù)、用戶(hù)等各方能力和資源,構建一體化超算算力網(wǎng)絡(luò )和服務(wù)平臺。其目標是緊密連接供需雙方,通過(guò)市場(chǎng)化的運營(yíng)和服務(wù)體系,實(shí)現算力資源統籌調度,降低超算應用門(mén)檻,并帶動(dòng)計算技術(shù)向更高水平發(fā)展,推動(dòng)自主核心軟硬件技術(shù)深度應用,輻射帶動(dòng)自主可控產(chǎn)業(yè)生態(tài)的發(fā)展與成熟。
為促進(jìn)超算算力一體化運營(yíng)、打造國家算力底座,國家超算互聯(lián)網(wǎng)平臺去年4月正式上線(xiàn),覆蓋科學(xué)計算、工業(yè)仿真、人工智能(AI)模型訓練等各個(gè)領(lǐng)域。
記者從國家超算互聯(lián)網(wǎng)平臺了解到,截至今年1月,平臺上已有各類(lèi)算力商品超6500款,其中模型服務(wù)近240款,既有DeepSeek、Qwen等國內開(kāi)源大模型,也有Llama、Stable Diffusion、Gemma、Mistral、StarCoder、ChatGLM等國外開(kāi)源模型。
對于DeepSeek的上線(xiàn),國家超算互聯(lián)網(wǎng)平臺相關(guān)負責人表示,先進(jìn)的國產(chǎn)AI技術(shù)與國家級綜合算力服務(wù)平臺融合,是加速?lài)a(chǎn)AI技術(shù)生態(tài)發(fā)展與普及的前沿實(shí)踐,其將在市場(chǎng)、技術(shù)、創(chuàng )新、產(chǎn)品及用戶(hù)方面推動(dòng)AI技術(shù)生態(tài)創(chuàng )新及成果落地,促進(jìn)AI+的多樣化,推動(dòng)中國乃至全球AI市場(chǎng)的應用落地和產(chǎn)業(yè)化進(jìn)程。通過(guò)國家超算互聯(lián)網(wǎng)平臺,用戶(hù)無(wú)需本地下載,可在線(xiàn)部署、推理、定制化訓練與開(kāi)發(fā)DeepSeek等國內外知名開(kāi)源大模型,降低了AI技術(shù)使用門(mén)檻。與此同時(shí),算力服務(wù)的普惠性也得到提升,國家超算互聯(lián)網(wǎng)平臺依托國產(chǎn)深算智能加速卡與全國一體化算力服務(wù)體系,為DeepSeek等模型提供豐富的異構算力資源,為國產(chǎn)AI應用與創(chuàng )新提供持續算力保障。
DeepSeek系列模型在性能上與世界頂尖的大模型不相上下,但在成本上卻具有顯著(zhù)優(yōu)勢。DeepSeek系列通過(guò)算法優(yōu)化顯著(zhù)降低計算資源消耗,結合國家超算互聯(lián)網(wǎng)平臺“普惠易用、豐富好用”的能力,使得更多企業(yè)和用戶(hù)能夠負擔得起AI技術(shù)的應用,加速AI技術(shù)普及。
業(yè)界普遍認為,DeepSeek模型在超算互聯(lián)網(wǎng)平臺的規?;涞?,或將改變國內AI行業(yè)依賴(lài)海外閉源模型的現狀。(記者 楊 雪)