依照Gartner去年發表的儲存技術發展循環(Hype Cycle)報告,在當前的新興儲存技術中,複本資料管理(Copy Data Management,CDM)是個處於期望膨脹高峰(Peak of Inflated Expectations)的新技術領域,已經觸發了發展、對產品技術的期望逐漸上升膨脹,達到了高峰。而在成熟度方面,CDM則被Gartner列為是需要5~10年來進入市場主流,並具備高影響力的技術。
這意味著,CDM這項產品剛開始被企業用戶接受,對這項技術的期望正達到高峰,雖然成為主流應用還要一段相對較長的時間,但會對企業的業務流程,幫助提高收益或降低成本削減,帶來顯著的影響。
Gartner的報告,與我們對CDM領域的觀察一致,我們同樣認為這項產品仍處於早期推廣階段,但會對企業的資料保護與應用帶來重大的影響,一舉改變現有的備份、備援與開發測試應用架構,企業用戶已經可以開始評估導入這類型產品的可行性。
新創廠商為主的CDM供應商
由於CDM產品仍在早期推廣與發展階段,因此供應商自然是以新創廠商為主,但也有IBM與Veritas這樣的大廠投入,用戶的產品選擇已經相當豐富。
目前主要的CDM產品供應商,包括:Actifio、Catalogic、Cohesity、Delphix、Rubrik、IBM、Veritas,以及中國的Scutech(鼎甲科技)等,接下來我們便對其中主要的產品做一概覽。
Actifio
成立於2009年、2011年發表首版產品的Actifio,是CDM領域的先驅,旗下的Actifio Virtual Data Pipeline軟體平臺,也是CDM領域的標竿產品之一。產品採用VM型式的虛擬化應用伺服器來部署,特點是廣泛支援多種類型的作業環境與應用程式,從VMware vSphere與Hyper-V虛擬環境的VM,Windows、Linux與Unix等作業系統,以及Oracle、SQL、Exchange、Exange等應用程式,到AWS、Azure等雲端環境的VM等,Actifio都能透過API與代理程式,提供備份保護與資料複本應用服務,還能與NetApp與Dell EMC Isilon等NAS整合。
Catalogic與IBM
Catalogic成立於2013年,歷史還很短,不過旗下的ECX CDM平臺在CDM領域獨樹一格。
多數CDM產品都是走Out of Band架構,將來源端的快照複本,複製到獨立儲存裝置上儲存與管理;而Catalogic的ECX CDM則是走與儲存硬體整合的「在地管理(In-Place)」 路線,可與Dell EMC、NetApp與IBM的儲存設備整合,當來源端系統是使用這些廠商的儲存設備時,Catalogic ECX可在後臺與儲存設備的快照功能整合,直接管理與使用儲存設備的快照複本,將快照複本用於備援、開發測試,或轉存到雲端或其他裝置,免除了另外建置CDM儲存裝置的需求。
運作時,這種「在地管理」的CDM架構 也可省略將複本從來源端複製到CDM儲存裝置這個環節,需要的資源更少,架構也更簡單,但前提是用戶的儲存設備,必須是Catalogic支援的廠牌與型號。
除了Catalogic以外,IBM也OEM了ECX CDM這套產品,以IBM Spectum CDM的名稱銷售。
Cohesity
成立於2013年6月的Cohesity,主力產品是2015年底發表的DataPlatform儲存平臺與DataProtect軟體,其中DataPlatform是專門對應二線儲存用途的儲存平臺,提供了一個基於Scale-Out架構、擁有重複資料刪除功能的物件儲存環境;至於DataProtect,則是架構在DataPlatform平臺上的資料保護服務。
Cohesity DataPlatform有VM版、雲端版,還有預載於伺服器的超融合伺服器版等不同部署型式,並兼有資料保護、複本應用與NAS等二線儲存功能。
在備份歸檔方面,可透過DataProtect將VMware環境或實體主機的複本,傳送到DataPlatform儲存平臺作為備份保存,或轉存到其他裝置歸檔;在複本應用方面,則能透過DataPlatform內建的Clone功能快速產生可寫入的複本,支援快速開發測試應用,或是利用內含的資料索引引擎,追蹤與檢索儲存在DataPlatform平臺的資料,以支援資料分析應用;在NAS應用方面,DataPlatform能支援NFS與SMB協定,提供一般的NAS檔案存取。
Delphix
Delphix成立於2008年,其Dynamics Data Platform平臺是專門針對資料庫的複本應用管理產品,Delphix這套平臺可部署在本地端或AWS、Azure雲端環境,為前端系統的IBM DB2、Oralce、SQL與SAP等資料庫,提供複本管理服務,以支援開發測試與分析應用,並能支援本地端與雲端的混合架構。
Rubrik
成立於2014年、2015年發表首款產品的Rubrik,是非常年輕的CDM產品供應商,其專屬的Rubrik雲端資料管理平臺(Cloud Data Management)以儲存應用伺服器型式,透過API或代理程式,為虛擬環境、實體主機或資料庫應用程式等異質環境,提供備份、備援、歸檔、搜尋與分析等複本應用服務。
雖然許多CDM廠商也提供類似的儲存應用伺服器產品,但Rubrik的儲存應用伺服器有兩個與眾不同的特色:首先是提供SSD加速功能,其次是支援Scale-Out擴展架構,可因應大規模環境的使用需求。針對較小規模環境,Rubrik也有VM軟體版本可供選擇。
Veritas
自2016年從Symantec中分離後,身為老牌備份軟體大廠的Veritas也跨入了新的CDM領域,於2017年初正式推出CDM產品Velocity。這套產品有兩種型式:VM軟體版與儲存伺服器一體機(Velocity 7330),可以為前端的Oracle、SQL資料庫等應用程式或VMware vSphere、Hyper-V虛擬環境,提供資料保護、開發測試與分析等複本資料管理應用。特別的是。Velocity也能與NetBackup 8.0整合,讓NetBackup備份伺服器處理Velocity所保存的複本資料。
鼎甲科技(Scutech)
鼎甲科技成立於2009年,主要業務是資料保護與災難備援軟體,在2017年也投入CDM領域,推出InfoSemper CDM一體機產品。
InfoSemper運作方式與其他CDM產品相似,都是先透過API或其他方式,在來源端啟動快照取得資料複本,然後傳送到InfoSemper保存與管理,特點是InfoSemper能將複本以多種協定掛載給主機使用,包括FC、iSCSI與NFS。
前景可期的新興產品
CDM正處於快速上升階段,產品歷史不長,但成長非常迅速,其中Actifio、Cohesity與Rubrik是特別值得關注的3家供應商,除了驚人的業務成長外,也各自提供了獨特的產品視角。
Actifio算是CDM領域的「元老」,是將這個產品概念推廣開來的功臣,產品等同於是CDM的標準範本。Cohesity與Rubrik都是主推便利部署的CDM一體機產品,Rubrik還結合了類似超融合系統的Scale-Out擴展概念,Cohesity則進一步把產品應用範圍,從CDM擴展到包括NAS服務在內的整個二線儲存領域。
CDM產品的基本類型
目前已有的CDM產品,可以依照架構、產品形態分為幾種類型,各自具備不同的特性。
從產品型態來看,CDM產品有純軟體型式,以及預載於伺服器的一體機型式兩類,多數產品都提供VM形態的軟體版本,Cohesity、Rubrik與Veritas Velocity還提供了一體機型式的儲存伺服器產品,可適用較大規模的環境。
若依適用的環境,CDM產品則可分為通用型與特定環境應用型。多數CDM產品都是通用型,以涵蓋多種應用環境為訴求,可支援從虛擬環境VM到各式各樣的作業系統與資料庫應用程式;不過Delphix與眾不同的是以專門對應資料庫為訴求,屬於特定環境應用類型的CDM產品。
而從運作架構來看,CDM產品又能分為Out of Band(帶外管理)與In-Place(在地管理)兩種架構,區別在於前者會把來源端擷取的快照複本,複製傳輸到獨立儲存伺服器上保存,後者則直接管理與使用位於來源端主儲存設備上的快照複本。絕大多數CDM產品都採用Out of Band架構,只有Catalogic的ECX採用In-Place架構。
CDM的兩種運作架構
Out of Band是絕大多數CDM產品的標準架構,CDM在來源端系統之外,獨立保存與管理資料複本,仙透過API或代理程式在來源端系統啟動快照,然後將快照複本複製傳送到獨立儲存裝置上保存與管理。
這種架構的優點是複本獨立存放、可用性較高,但需要的硬體資源較多,儲存存取路徑也較複雜。
Catalogic ECX與眾不同地採用In-Place(在地管理)架構,直接與來源端系統的主儲存設備快照功能整合,使用與管理主儲存設備的快照複本,因而免除了額外設置獨立儲存設備的需求,可節省硬體建置成本。此外,在這種架構下,來源端與複本的存取路徑也相同,掛載與存取都較簡單,但限制是必須搭配特定廠牌、型號的儲存設備才能運作,而且由於複本仍依附在來源端的主儲存設備中,可用性也相對較低。(圖片來源/Catalogic)
複本資料管理(CDM)標竿產品
Rubrik Cloud Data Management
在複本資料管理(CDM)這個新興領域,Rubrik也算是後起的新廠商,雖然歷史很短,但發展相當迅速。
Rubrik的主力產品,是內含Rubrik Cloud Data Management軟體平臺,稱作「Brick」的儲存應用伺服器,目前有r300、r6000,以及內含更高階資安功能的r528等3個系列,全都是2U/4節點規格機箱,也有VM型式的軟體版本。
Rubrik可以支援主流的虛擬環境、作業系統,以及Oracle、SQL等應用程式,作業模式分為兩種,一是透過應用程式API(VMware VADP、VSS或Oracle RMAN等),提供無代理程式架構的服務啟動與還原作業;二是搭配專屬的代理程式來啟動服務,將能為資料庫提供更精細的還原點選擇,另外,實體主機也需要安裝代理程式,才能加入Rubrik的服務環境。
運作時,Rubrik先透過API或代理程式,在來源端系統擷取快照複本,然後傳送到Rubrik伺服器的儲存區,接下來便能視需要選擇不同還原模式來使用複本,例如:將複本倒回到原始位置還原、搜尋與瀏覽單一檔案,匯出掛載給原始或指定主機,或是轉存到雲端環境長期保存等。用戶還可在兩個站點之間,利用Rubrik伺服器的遠端複製功能建立異地備援。
與其他CDM產品相比,Rubrik的特色是SSD加速機制與Scale-Out擴展架構。Rubrik在伺服器硬體中整合了SSD,可藉此加速資料讀寫,並提高壓縮、重複資料刪除與資料搜尋作業的效能。另外,Rubrik也透過採用分散式NoSQL資料庫架構,提供了基於叢集的Scale-Out擴展架構,可藉由增加Rubrik伺服器節點,彈性擴展系統處理能力,是少數支援Scale-Out架構的CDM產品。
Rubrik的產品,是內含Rubrik Cloud Data Management軟體平臺,稱作「Brick」的2U規格伺服器,採用2U/4節點規格,可透過連結多臺Brick機箱的節點,以Scale-Out型式擴展系統規模。
【Rubrik 的網頁管理控制臺】管理者只需透過瀏覽器,就能登入Rubrik儲存伺服器的HTML控制臺,執行系統設定與管理工作。控制臺中提供了儀表板介面,便於管理者迅速掌握整體狀況。
【提供多種複本還原應用模式】以從來源端擷取而來的快照複本為基礎,Rubrik可透過多種還原模式來使用複本。以VM複本為例,便有下列模式可選,包括:搜尋、瀏覽還原單一檔案、將VM複本還原到原始位置、立即掛載VM複本、將複本傳送到雲端並啟動等。
Actifio Virtual Data Pipeline
身為複本資料管理(CDM)先驅的Actifio,產品核心是基於Actifio Virtual Data Pipeline軟體平臺的Sky應用伺服器。早先Actifio曾推出過硬體型式的Sky儲存伺服器產品,不過目前主要是提供VM型式的軟體版本Sky伺服器。
用戶只需將原廠提供的Sky伺服器VM檔案,匯入到Hypervisor平臺,然後設定網路與儲存環境參數,就能迅速完成系統部署,然後透過專屬的Actifio Desktop管理程式,登入Sky伺服器執行管理工作。
Actifio Sky可以支援VMware vSphere、微軟Hyper-V環境的VM,或是實體主機,提供基於快照的複本資料管理服務。有Standard與Advanced兩種版本可選,差別在於後者多了支援虛擬或雲端環境中的Linux VM、實體伺服器與NAS,以及無限制的複本虛擬Clone等功能。
Actifio的系統架構可說是CDM產品的標準範本,可以透過VMware VADP、VSS或Oracle RMAN等應用程式API,提供無代理程式的保護架構,不過若搭配專屬的Actifio Connector代理程式,能對實體或虛擬主機上的資料庫等應用程式,提供具有資料一致性、且還原粒度更精細的保護。
運作時,Actifio會依照預設排程,透過API或代理程式在前端系統啟動快照,然後將快照傳送到Actifio Sky伺服器管理的Snapshot Pool儲存區,產生Actifio的內部快照複本。
除了第一次擷取複本時,需獲取來源端全量資料外,後續的複本擷取作業都是增量模式,只需傳輸異動資料區塊即可,Actifio會將自動這些異動區塊合成不同時間點的完整複本,以減少傳輸頻寬與複本儲存空間需求。
另外Actifio Sky虛擬伺服器管理的儲存區之中,也提供了用於長期保存複本資料、含有重複資料刪除功能的Dedupe Pool,可幫助提高儲存空間的使用效率。
由於Actifio擷取的複本都是原始格式,能為前端系統立即存取使用,所以Actifio可將指定時間點的複本,透過虛擬化技術複製為多份虛擬複本,分別掛載給不同主機,用於資料還原、或開發測試等用途。
用戶也可在兩個站點的Actifio Sky虛擬伺服器之間,透過遠端複製建立備援架構,並可選用Dudep Async傳輸模式,除了第一次傳輸完整資料外,後續不僅只需傳輸異動資料區塊,而且資料傳輸之前,還可藉由重複資料刪除功能,縮減需要傳輸的資料量,進一步降低網路頻寬占用。
【Actifio的安裝部署】只要將Actifio Sky虛擬伺服器的OVF檔匯入到ESXi,然後登入Sky虛擬伺服器設定網路與儲存環境參數,就能完成Actifio的系統部署。
【Actifio管理控制臺】Actifio的系統管理,是透過獨立安裝的Actifio Desktop控制臺程式來進行,在Windows或Mac環境上安裝Actifio Desktop,便能登入Actifio Sky虛擬化伺服器,設定備份與還原作業。
【直接掛載複本提供多種應用】利用Actifio Desktop控制臺的Image選項,就能將Actifio Sky虛擬伺服器保存的複本資料,掛載給指定主機,用於還原、開發、分析等不同用途。
相關報導 新世代資料保護架構興起