“搜索”長(cháng)久以來(lái)都是互聯(lián)網(wǎng)居民的剛需,是如同“水電煤”一般的基礎設施。而隨著(zhù)用戶(hù)需求日益多樣化,搜索引擎的供給形態(tài)日益多元化,使用搜索的渠道入口也在延伸。憑借AI大模型在搜索領(lǐng)域率先應用,百度勇攀搜索技術(shù)新高地,持續領(lǐng)跑行業(yè)賽道。
近日,百度搜索聯(lián)合北京大學(xué)、山東大學(xué)、湖南人工智能學(xué)會(huì )、西安電子科技大學(xué)等各地高校、學(xué)會(huì ),共同啟動(dòng)“新智能·新搜索”為主題的首屆搜索技術(shù)創(chuàng )新挑戰賽(STI)。大賽旨在促進(jìn)業(yè)內交流、產(chǎn)教融合,推動(dòng)算法和技術(shù)應用創(chuàng )新,更好的激發(fā)人工智能、檢索技術(shù)領(lǐng)域的創(chuàng )新性、突破性,同時(shí)挖掘和培育更多搜索人才,推動(dòng)搜索領(lǐng)域不斷進(jìn)化。
搜索技術(shù)領(lǐng)域“最高賽事”
當前,用戶(hù)搜索目的從單純的信息答案獲取向服務(wù)獲取、商品交易等方向升級,搜索表達形式從文字向語(yǔ)音、視覺(jué)等多元化方向發(fā)展,搜索終端由PC端/手機端向智能家居、智能車(chē)載等設備延伸。搜索引擎需要在算法、計算資源及搜索技術(shù)等方面不斷創(chuàng )新,打造“新基建”以迎接搜索新時(shí)代到來(lái)。
但全國性的基礎建設非一企之力可及,更需要充足的人才儲備。這也是百度聯(lián)合各地頂級高校、學(xué)會(huì )共同舉辦此次大賽的重要出發(fā)點(diǎn):以創(chuàng )新競賽模式+頂級資源為全國人才打造業(yè)界“最高舞臺”,激發(fā)人工智能、檢索技術(shù)領(lǐng)域的創(chuàng )新和突破性,推動(dòng)搜索領(lǐng)域不斷進(jìn)化。
具體來(lái)看,本次競賽在賽題設計上進(jìn)行了整體創(chuàng )新?;诎俣人阉鞯募夹g(shù)優(yōu)勢和數據優(yōu)勢,大賽將從真實(shí)的搜索業(yè)務(wù)場(chǎng)景出發(fā),選擇搜索引擎中核心的“搜索問(wèn)答”與“搜索推理模型優(yōu)化”作為兩大賽題方向,以此激勵參賽者學(xué)習相關(guān)知識并在大賽中應用,以推動(dòng)前沿搜索技術(shù)滲透、同步提升實(shí)踐性和實(shí)操性。
同時(shí),大賽選用國內領(lǐng)先的人工智能學(xué)習與實(shí)訓社區飛槳AI Studio作為賽事平臺,為全球開(kāi)發(fā)者免費提供功能強大的線(xiàn)上訓練環(huán)境、云端超強 GPU 算力及存儲資源。
此外,作為大賽獨家贊助商的NVIDIA也將提供有力的硬件及技術(shù)支持。其中,包括最新的NVIDIA Hopper GPU架構與新一代Ada Lovelace GPU架構,皆能為搜索相關(guān)的Transformer計算提供近6倍的加速;軟件方面,NVIDIA也提供了眾多由 GPU加速的SDK與解決方案,包括能用于大模型訓練/推理/數據處理的框架—— NeMo Megatron、Triton 推理服務(wù)器以及專(zhuān)用于大數據處理與機器學(xué)習庫的RAPIDS等。
據悉,大賽賽程主要分為區域賽、復賽及總決賽三部分。其中,區域賽將由四大賽區獨立排名及頒獎,各區域排名靠前選手將進(jìn)入全國復賽及決賽,依據總排名進(jìn)行選拔和評比。大賽已從即日起啟動(dòng)報名,區域賽時(shí)間截至12月15日,復賽時(shí)間截至12月22日,總決賽及頒獎典禮時(shí)間為12月25日。即日起,上百度APP搜索“百度搜索技術(shù)大賽”即可進(jìn)入大賽專(zhuān)題頁(yè)面,獲取更多信息。
夯實(shí)硬科技基建,培育AI生力軍
除了以頂級資源構筑起頂級的人才“吸引力”以外,本次大賽在匯聚人才的同時(shí)兼顧了從遴選到培育、從吸收到輸出的加速轉化。
為幫助參賽者深度掌握搜索引擎技術(shù)知識,大賽期間,百度首次向參賽者提供了搜索開(kāi)源技術(shù)、開(kāi)放機器運算資源、以及海量脫敏業(yè)務(wù)數據。與此同時(shí),百度還開(kāi)設了5場(chǎng)直播和10余課程,提供海量學(xué)習資料,搜索技術(shù)專(zhuān)家也將提供全程的技術(shù)輔導。最終,優(yōu)勝選手還將有機會(huì )獲得百度搜索提供的工作和實(shí)習機會(huì )。
長(cháng)期在加速計算及AI領(lǐng)域實(shí)現重大突破的NVIDIA,也將為參賽選手提供多角度技術(shù)培訓,包括且不限于推理優(yōu)化、性能分析工具Nsight的使用等;另外,大賽評審團隊也包含來(lái)自 NVIDIA 加速計算團隊的專(zhuān)家,為選手提供更完整、更具實(shí)操性的專(zhuān)業(yè)意見(jiàn),以人才培育驅動(dòng)GPU加速領(lǐng)域內容與技術(shù)創(chuàng )新。
透過(guò)此次大賽,也充分反映出一個(gè)行業(yè)共識:加速AI復合型人才培養勢在必行。而在這一方面,百度也已率先布局。
目前,百度正積極建設“人工智能+X”復合型人才培養生態(tài)。以百度飛槳為核心,百度圍繞學(xué)習、就業(yè)、認證、實(shí)踐、比賽等環(huán)節創(chuàng )立起完善的AI人才培養標準,構建起產(chǎn)教融合的AI人才培養體系。據統計,百度已經(jīng)為社會(huì )培養了超過(guò)200萬(wàn)AI人才。未來(lái),百度還將持續加大投入力度,面向各類(lèi)高校推動(dòng)校企聯(lián)合、產(chǎn)教融合,助力AI人才培養體系的構建,實(shí)現為社會(huì )培養500萬(wàn)AI人才的戰略目標。
AI大模型率先應用,百度搜索年規模增長(cháng)17%
人才的吸引力、行業(yè)的號召力,始終需要以企業(yè)自身的引領(lǐng)實(shí)力為前提。
過(guò)去一年,不論是技術(shù)層面還是商業(yè)應用層面,人工智能都實(shí)現了巨大的跨越式發(fā)展。而百度搜索自PC互聯(lián)網(wǎng)時(shí)代向移動(dòng)互聯(lián)網(wǎng)時(shí)代、乃至今天的數據時(shí)代一路走來(lái),始終致力于將自身領(lǐng)先的AI技術(shù)“基因”賦予用戶(hù)所需,藉此建立了強大的技術(shù)壁壘和完備的產(chǎn)品矩陣。
在每一個(gè)時(shí)代到來(lái)之前,百度始終能夠率先起身,全身心擁抱新需求、引領(lǐng)新業(yè)態(tài)。正如百度集團副總裁、搜索平臺負責人肖陽(yáng)所言:“身處搜索行業(yè)二十多年,百度親歷著(zhù)行業(yè)的高速發(fā)展和快速進(jìn)化,并通過(guò)技術(shù)和產(chǎn)品的升級,領(lǐng)跑行業(yè)賽道,不斷拓展新的發(fā)展空間?!?/p>
過(guò)去一年,百度搜索規模年同比增長(cháng)17%,領(lǐng)跑優(yōu)勢持續擴大。另有數據顯示,百度核心研發(fā)投入占比長(cháng)期保持在20%以上,人工智能專(zhuān)利申請量及授權量均多年保持國內首位。
而針對進(jìn)一步變化的行業(yè)環(huán)境和用戶(hù)需求,百度近日又一次搶占領(lǐng)先身位,發(fā)布搜索領(lǐng)域兩大核心技術(shù)——跨模態(tài)大模型“知一”,以及新一代索引技術(shù)“千流”。
由多項技術(shù)融合而來(lái)的跨模態(tài)大模型“知一”,具備跨模態(tài)、大規模、高效率三大特征。其可用統一的方式,從全網(wǎng)文本、圖片、視頻、結構化信息等形態(tài)各異的資源中持續學(xué)習海量知識,打破資源形態(tài)的界限,將最貼合用戶(hù)需求的結果呈現給用戶(hù);新一代索引技術(shù)“千流”則推動(dòng)了搜索效能的大幅飛躍,讓優(yōu)質(zhì)信息內容得到最有效的呈現與分發(fā),幫助每個(gè)用戶(hù)更好更快地解決問(wèn)題,提升搜索體驗。
在A(yíng)I技術(shù)加持之下,搜索領(lǐng)域的未來(lái)空間正持續拓寬。而作為搜索的引領(lǐng)者,百度正進(jìn)一步借力自身AI優(yōu)勢讓搜索技術(shù)持續升級,并帶動(dòng)行業(yè)頭部資源一同構建新型、復合型的人才培養生態(tài),共贏(yíng)搜索新未來(lái)。