近日EMC北亞與東南亞區資料備份解決方案總經理楊志偉來臺,分享EMC資料備份產品與關鍵技術,包括旗下主力產品Data Domain採用的資料無損架構DIA,能確保備份資料的正確性及可復原性,以及提高重複資料刪除效率的可變動長度技術。楊志偉同時揭露資料保護產品新布局,並透露可部署於VM的純軟體版Data Domain,預計在明年上半年,最快第一季就能發表。
對於Dell併購EMC的影響,楊志偉則表示,他們目前仍是兩家公司,60天內還不能討論產品線發展走向,各自的客戶與資料也尚未進行交流。他只表示,目前為止沒有任何改變,產品還是照先前設定方向走,對既有產品線的重疊情形則影響不大。
他也表示,EMC主要客戶多為大企業,Dell則專注中小型企業,即使是同類別產品,其客戶群的重複度低,他甚至推測,幾乎沒有產品會被淘汰掉。雖然楊志偉無法進一步說明,不過光看資料備份領域,Dell去年才與資褓儲存合作,宣布將Data Protection的4大主力產品推進臺灣市場,包括備份軟體NetVault、虛擬備份軟體vRanger、Windows平臺的連續資料保護軟體AppAssure,以及DR系列備份應用儲存伺服器。
Dell的Data Protection部門在軟體事業群下,負責管理資料備份應用軟體產品與技術,其中DR系列便是以Ocarina重複資料刪除技術為基礎,搭配Dell自家伺服器組合而成。而Data Protection之後將如何與EMC的主力資料備份產品線整併,值得觀察。
楊志偉表示,目前EMC的產品全球市占超過6成,亞太區亦是如此,而備份軟體全球市占第二,和領先的Veritas只差3∼4%左右,其主力產品包括Data Domain、Avamar及NetWorker。
Data Domain是以重複資料刪除功能為核心的資料備份設備,EMC在2009年買下Data Domain,當時EMC可說是費盡功夫,硬生生把要落入NetApp口中的這塊肥肉搶下。之後Data Domain成為EMC資料備份的主力產品,今年EMC再推出最新機型DD9500,以及Data Domain作業系統5.6版。
楊志偉表示,DD9500是目前業界性能最高的資料備份設備,每小時可處理將近60TB的資料,是其他競爭對手產品的1.5倍以上,也比前一代Data Domain產品快了1.6倍,可用容量高達1.7PB,是其他產品的4倍。楊志偉透露,導入Data Domain需求較大的包括金融、政府、製造及醫療等資料規模夠大的產業,目前,亞洲地區也已經有幾家企業採用最新機型,多為銀行、證券交易所。
他進一步解釋Data Domain的產品細節與關鍵技術,主要特色包括採用了能夠確保資料正確性及可復原性的資料無損架構DIA(Data Invulnerability Architecture),DIA涵蓋點對點驗證技術、避免故障發生技術、持續性故障監測與復原技術,以及檔案系統還原4種技術。當資料寫入時,Data Domain會重新讀一遍,確認寫進去的資料正確,並做兩步驟檢查與驗證,如果資料檢查結果不一樣,代表資料已經損毀,系統會自動將資料回復,重新計算數據,如果還是無法復原,會在下次做資料備份時會將缺少的資料補上,平均每周會做一次檢查。
相較於其他業者的作法,楊志偉表示,其他廠商都沒有做到像DIA架構這樣的高度資料復原保證,有些廠商沒有檢測資料正確性,或是只在寫入時測一次而已,因此EMC的做法最保險,他表示,Data Domain過去10多年來還沒遇到客戶資料要不回來的情形。
他也表示,很多廠商的資料儲存只支持某些備份軟體,但是Data Domain是一個開放的資料備份設備,除了與自家備份軟體整合之外,也和大部分的備份軟體深入整合。
同時,EMC也大幅降低企業將資料儲存作法從磁帶轉到無磁帶的風險,他解釋,以前用戶喜歡使用磁帶來儲存資料,不只便宜風險也低,壞了就換另一卷磁帶,但是如果企業將所有資料放在同一個重複資料刪除系統上,一旦損毀資料就全部都沒了。因此,Data Domain的系統設計目標是要成為企業資料的最終保存處,如果用戶要從Data Domain上找回資料時,EMC要確保這個資料一定能被找回來。
重複資料刪除以可變動長度拆解資料,儲存容量省一半
此外,EMC重複資料刪除技術使用可變動長度來拆解資料,與其他廠商使用的固定長度做法不同,可變動長度可將資料拆解得比較細,再依據改變的片段去重新複製,讓重複資料刪除技術更有效率,楊志偉表示,透過這些關鍵技術,EMC可幫企業省下一半的儲存容量。
除此之外,楊志偉表示,其他廠商提供的解決方案使用的都是舊的資料備份方式,從應用程式伺服器把資料送到備份伺服器上再送到儲存伺服器上,企業需要採用備份伺服器。但是EMC可以將資料從應用程式直接備份到Data Domain上。由於資料可以直接寫到Data Domain,企業不用再買備份伺服器,不只省錢、速度快,也可以避免中間的備份伺服器出現瓶頸。
這麼做也讓企業的基礎架構簡化許多,除了不需要備份伺服器,從應用程式到Data Domain之間的網路需求也不需要很快,即使在WAN網路環境也能做遠端備份。
EMC接下來要朝雲端和大資料應用發展,楊志偉表示,他們目前正在進行研究,要讓企業用戶可以在Data Domain系統上做Hadoop的資料分析處理。
此外,EMC也計畫推出可以部署在虛擬機器上的純軟體版Data Domain。楊志偉表示,Data Domain現在都以整套的實體Appliance銷售,不過他們發現,許多企業的辦公室規模不大,或是已經有VMWare或是OpenStack的虛擬環境,不想再買一臺實體的Data Domain。
因此,EMC在今年5月的EMC World大會上,首度揭露這項獵鷹計畫Project Falcon,要將Data Domain的軟體獨立出來銷售,不用非得綁定EMC的專屬設備不可,讓企業可以在既有的虛擬機器或環境中部署Data Domain,楊志偉表示,預計明年前半年,或是最快第一季就會推出Data Domain的純軟體版本。
Data Domain的資料也能直接上雲端,預計明年推出
另外在雲端布局,他們發現企業客戶越來越喜歡使用雲端服務,認為雲端環境比較敏捷,他以EMC的內部應用需求為例,EMC每季的最後五個禮拜最忙,自家的機器也負荷不了承載量,因此他們都把資料放上雲端,等尖峰期間過了,再把資料搬回來。
因此,他們也要協助企業容易地把資料、應用,從資料中心無縫搬移到公有雲,或是直接存到雲端環境,他說,EMC提供了多種方式,包括今年新推出的Cloudboost和Spanning解決方案,VMAX3也能透過CloudArray把資料從本地搬到雲端。未來Data Domain也將提供新服務,讓企業可以直接把資料從Data Domain搬上雲端,預計明年初就會發布這項服務。
不過把資料搬上雲端,很多廠商都做得到,楊志偉表示,不只要讓資料搬移過程很容易,還要確保資料安全性才行,EMC在資料安全性上有三個主要特點,第一是在資料傳上雲端之前就做重複資料刪除,節省企業客戶的雲端空間成本,第二是資料加密技術,每個物件都在加密後才被放上雲端,即使駭客入侵公有雲也無法看到資料。
第三是幫企業客戶快速找到資料,EMC在資料放上雲端之前先做索引(Index),企業要找資料時可以使用像google搜尋引擎的功能,透過關鍵字或其他方式來找資料,這個搜尋功能可以同時搜尋公司內部及公有雲上的資料。找到資料後,還可以做一鍵備份機制,讓資料在本地與雲端空間之間輕易地複製及轉移。
除了上述做法之外,當企業的資料量大到一定規模時,EMC也提出另一種全新備份方式,是儲存到儲存(Storage to Storage)的備份方式,EMC今年新發表的ProtectPoint可直接整合資料域與主儲存設備,讓資料從主儲存設備直接備份到Data Domain上,ProtectPoint目前已和Oracle、SAP和IBM的DB2整合,楊志偉表示,這種新備份方式比過去的作法快10∼20倍。