數字化時(shí)代下,大數據平臺已成為組織重要的基礎設施,存儲著(zhù)眾多核心業(yè)務(wù)數據。為更好地保障大數據平臺海量數據安全,愛(ài)數于9月2日成功舉辦以“不止于快”為主題的大數據平臺保護方案神盾會(huì )(二),愛(ài)數方案專(zhuān)家、技術(shù)專(zhuān)家以及生態(tài)合作伙伴齊聚一堂,共同探討大數據平臺保護方案及技術(shù)實(shí)現手段,以助力各行業(yè)客戶(hù)實(shí)現大數據平臺高效、經(jīng)濟、安全、全面的數據保護。
數多無(wú)策:大數據平臺保護亟需新方案
大數據平臺逐漸成為組織中的核心業(yè)務(wù)系統,承載著(zhù)關(guān)鍵業(yè)務(wù)的運行,如金融行業(yè)的“千人千面”、醫療行業(yè)通過(guò)大數據分析實(shí)現疫情的精準防控等。一旦大數據平臺宕機,組織中諸多核心業(yè)務(wù)將無(wú)法開(kāi)展,造成的損失巨大。因此,大數據平臺保護將成為每個(gè)行業(yè)IT建設中的重中之重。
然而,作為現代化的工作負載,大數據平臺由于數據量多、節點(diǎn)多、組件多等特點(diǎn),導致其保護之路道阻且長(cháng):
PB 級數據,如何在有限的備份窗口內完成備份
海量大數據備份副本長(cháng)時(shí)間保留,如何降低成本?
如何確保備份數據的安全存儲與合規保留?
如何實(shí)現精準備份和異構版本兼容?
不止于快:AnyBackup大數據平臺保護方案
基于大數據平臺保護的各種挑戰,愛(ài)數AnyBackup推出了大數據平臺保護方案,憑借重復數據刪除、永久增量、多節點(diǎn)并發(fā)備份恢復、表粒度備份恢復、數據一致性保障等多種技術(shù)的加持,AnyBackup可為PB級、百節點(diǎn)集群規模的大數據平臺提供更高效、更經(jīng)濟、更安全、更全面的保護。
更高效:AnyBackup提供永久增量備份,相比于傳統方案,備份效率提升 96 倍以上;
更經(jīng)濟:結合重復數據刪除&永久增量備份,備份存儲資源可節約 90%;
更安全:憑借不可變存儲技術(shù),實(shí)現備份數據防篡改,加固了勒索病毒的最后一道防線(xiàn),在數據安全存儲的基礎上,AnyBackup還支持基于磁帶、云存儲等多種介質(zhì)的歸檔方式,符合合規性需求;
更全面: AnyBackup也充分考慮到大數據平臺生態(tài)的豐富性,能夠全面兼容主流大數據平臺及其組件,并支持異構版本之間的數據恢復。
技術(shù)解碼:AnyBackup大數據平臺保護方案實(shí)現原理
結合IDC發(fā)布的中國大數據平臺市場(chǎng)份額報告,以及Gartner 發(fā)布的Hadoop 發(fā)行版市場(chǎng)指南中的供應商介紹,可以發(fā)現,Hadoop 已經(jīng)成為當前國內使用最廣泛的大數據平臺。
Hadoop生態(tài)體系是以Hadoop作為平臺的應用框架,框架中各應用組件相互兼容,組成的一個(gè)獨立的應用體系。其中,HDFS 和 MapReduce是其基礎核心,而Hive和HBase則是最重要且使用最廣泛的應用組件。
基于此,AnyBackup大數據平臺保護方案中,最為核心的一個(gè)版塊便是面向 Hadoop的HDFS、Hive和HBase來(lái)提供數據保護。
AnyBackup HDFS數據保護方案
HDFS 作為分布式文件系統,承擔了存儲Hadoop 的海量數據的任務(wù)。由于節點(diǎn)多、數據量多、數據種類(lèi)多、價(jià)值密度低等特點(diǎn),HDFS保護往往存在備份時(shí)間長(cháng)、存儲成本高等難題。
AnyBackup提供的HDFS數據保護方案,可根據客戶(hù)需求將代理部署在HDFS集群中或集群外,從而實(shí)現性能保障或減少主機資源占用的目的。AnyBackup備份時(shí)可結合增量比對算法,實(shí)現數據的增量備份和永久增量備份。無(wú)論HDFS的副本數是多少,AnyBackup HDFS數據保護方案僅備份一個(gè)副本的數據,節約存儲資源占用。此外,AnyBackup HDFS數據保護方案支持文件目錄按需過(guò)濾,靈活縮減備份數據源,進(jìn)一步提升了備份效率并降低了存儲成本。
AnyBackup Hive數據保護方案
Hive作為構建在 Hadoop平臺之上的數據倉庫工具,是Hadoop平臺最大數據量的應用組件。然而,因自身架構需要,Hive的元數據和數據分離存儲,這給備份時(shí)如何保障數據一致性提出了新挑戰。同時(shí)由于Hive可兼容多種關(guān)系型數據庫作為其Metastore(元數據庫),數據保護方案如何適配不同關(guān)系型數據庫也十分重要。
AnyBackup Hive數據保護方案無(wú)需停機,在線(xiàn)即可實(shí)現Hive海量數據的備份,有效解決了備份數據一致性的問(wèn)題。同時(shí),AnyBackup提供的方案可忽略具體的Metastore關(guān)系型數據庫選型,從而實(shí)現所有的Hive Metastore的全面適配。
AnyBackup HBase數據保護方案
HBase作為分布式存儲系統,為Hadoop平臺提供了海量數據實(shí)時(shí)訪(fǎng)問(wèn)的能力。由于HBase 管理著(zhù)海量數據,且支持基于 RegionSever 的水平擴展和基于 HDFS 存儲擴展的特性,如何高效經(jīng)濟地實(shí)現對HBase數據的保護,也是需要解決的難題。
AnyBackup HBase數據保護方案,支持表粒度的備份恢復,能夠精準地備份恢復所需數據,在一定程度上提升了數據保護效率。值得指出的是,AnyBackup支持HBase備份副本間任意時(shí)間點(diǎn)的恢復,滿(mǎn)足更高的RPO要求。
強強聯(lián)合:愛(ài)數攜手星環(huán)科技,共筑大數據平臺安全壁壘
星環(huán)科技是全球領(lǐng)先的企業(yè)級大數據基礎軟件平臺廠(chǎng)商,圍繞數據全生命周期為企業(yè)提供基礎軟件及支持,也是經(jīng)過(guò)工信部信通院測試大數據產(chǎn)品線(xiàn)最豐富的供應商。星環(huán)科技產(chǎn)品已在政府、金融、電力、能源、制造、教育、醫療等20多個(gè)領(lǐng)域落地。
愛(ài)數與星環(huán)科技強強聯(lián)合,攜手打造AnyBackup TDH(Transwarp Data Hub)大數據平臺保護方案,以更好地服務(wù)于各行業(yè)客戶(hù)。AnyBackup TDH大數據平臺保護方案,可實(shí)現數據 高效、經(jīng)濟、安全的保護。不僅如此,愛(ài)數與星環(huán)科技已完成了兼容性測試,成功通過(guò)了雙方的產(chǎn)品認證,能很好地保障TDH大數據平臺數據安全。
AnyBackup TDH大數據平臺保護方案,是愛(ài)數與星環(huán)科技憑借雙方在各自?xún)?yōu)勢領(lǐng)域的技術(shù)積累,聯(lián)合打造的1+1>2的解決方案。未來(lái),雙方還將持續深入合作,以更優(yōu)質(zhì)的聯(lián)合解決方案,更好地服務(wù)于各行業(yè)客戶(hù)。
大數據與分析已成為數字化轉型戰略中的第一要務(wù),如何在享受大數據帶來(lái)益處的同時(shí),保障海量數據安全,也成為組織在數字化轉型過(guò)程中亟待解決的問(wèn)題。AnyBackup始終以保護數據安全為使命,護航廣大行業(yè)客戶(hù)的數字化轉型之旅。這也正是AnyBackup設計大數據平臺保護方案的初心。未來(lái),AnyBackup還將繼續努力,推出更多創(chuàng )新的技術(shù)和解決方案,加速數字化轉型之旅。