剛於10月10日滿7歲,公開上市才1年的美國儲存新創公司Pure Storage,產品問世才5年,就成了固態儲存陣列的領導廠商之一,更是近幾年來掀起全固態儲存陣列市場激戰的主要推手。
Pure Storage在2016年的年營收預估可達到1.8億美元(臺幣50億元),更被視為是繼NetApp之後,15年來最有機會挑戰10億美元獨角獸的儲存新創公司。Pure Storage創辦人兼首席架構師John Hayes正是打造出全快閃產品顛覆傳統儲存市場秩序的關鍵人物。
這位才三十多歲的型男技術首席,不同於專注產品研發的另一位創辦人兼技術長,John Hayes更關注於儲存技術架構的演進和IT基礎架構的變化。他目前關心的兩大儲存議題,一個是現有軟體如何因應快閃技術的成熟來調整架構,另一個則是新一代容器(Container)技術帶給儲存技術的衝擊。
John Hayes表示:「Docker容器架構最大儲存挑戰是,你根本不知道資料存在何處,」也因此,他認為,過去10年發展的儲存技術大多將不適用於容器。
自從7年前,英特爾在主機板上內建了多項原本需要專屬儲存硬體才會有的機制之後,顛覆了過去由專屬硬體主導的儲存市場,只需要一套通用型伺服器搭配儲存軟體,就可以打造出效能不輸老牌儲存公司推出的產品,也帶動了一波儲存新創公司的崛起,從快閃陣列產品切入了的Pure Storage就是其中一家。
John Hayes表示,儲存產品的競賽,研發效率是關鍵,採用標準伺服器來研發儲存產品的模式,正是Pure Storage能快速推出新款產品的原因,每6~18個月就能跟上最新一代的伺服器技術來翻新產品線。
PB級快閃儲存出現,可以成為企業儲存新主力
從Pure Storage產品的演進歷程,可以清楚地看到快閃儲存陣列快速發展的歷程。Pure Storage在2012年推出的快閃儲存陣列,得用到6個機櫃,才能提供到最大256GB的SSD容量,即使採用了通用型的伺服器整體成本仍舊昂貴,光是上百臺伺服器的成本就相當可觀,能提供的容量也遠不及硬碟,快閃儲存陣列仍舊無法成為企業儲存系統的主力,只能用於有高度存取需求的關鍵應用系統。
2014年,Pure Storage要提供512GB容量的快閃仍舊需要2個機櫃才能實現,但是到了2016年,單顆16 TB容量的SSD硬碟正式進入市場,Pure Storage產品只需要5U高度的伺服器,可以提供7.6TB容量的快閃模組,甚至Pure Storage剛於10月初發表了PB級的全快閃儲存,7U高度伺服器就可以提供多達1.5PB的容量,而且全都是超高存取效能的快閃儲存。
PB級快閃儲存的出現,讓快閃技術得以成為資料中心的儲存主力,Pure Storage戰略也開始進軍雲端IT、進軍整座機房規模的應用需求。
John Hayes表示,許多企業一開始是為了解決關鍵系統的效能問題,開始採用全快閃陣列,但是現在已經逐漸擴大到更多企業的應用,因為「快閃是更好的儲存系統。」尤其是過去許多IT問題受限於儲存效能而得採取複雜的解法。舉例來說,在虛擬化應用架構上,需要經常搬移大量資料,尤其是企業內部IT架構內的橫向資料流動,在儲存虛擬化技術出現之後資料流動需求更大,儲存資源更為集中化後,資料搬遷速度成了影響效能的關鍵之一。
「Flash有助於更容易移動資料。」對儲存虛擬化而言,「不只是帶來了速度,更重要的是可以帶來安全性。」John Hayes進一步解釋,當需要資料大量移動時,儲存系統需要更大的IOPS才能勝任,而可以讓延遲時間加快百倍的快閃儲存,能讓企業不再擔心傳輸距離的影響,不論放在何處,存取速度都能很快。
更進一步來看,John Hayes表示,Flash也有助於簡化應用程式的配置。過去受限硬碟效能,應用程式得依據效能需求,來隔離不同應用程式所能使用的儲存硬碟,避免有些存取量大的應用程式影響到其他系統的效能。
「光要撰寫這些應用系統的初始配置腳本程式,就得考慮得非常仔細才行。」John Hayes說,但若改用快閃陣列之後,開發人員就不用考慮太多硬體限制,更不用擔心一個地方塞車,就會導致整套系統當機。「好的儲存系統,甚至可以改變IT整體架構,快閃儲存就是這樣。」
不只帶來速度,快閃儲存還可能影響企業營運
不只IT架構,快閃帶來的加速度,甚至可以影響企業營運作業。
John Hayes舉例,全球最大骨科和醫療器材製造商Stryker先前一直苦於庫存管理不善的問題。因為Stryker每周盤點一次庫存,但是因為資料量太大,資料庫產出盤點用報表的時間得耗上一整天,甚至有5成機率,報表上的數據會發生錯誤。
後來Stryker改用快閃陣列,加快了資料庫存取速度之後,1個小時就可以產出報表,Stryker第一次能這麼快發現倉庫內不必要的囤貨,而能更快反映到進貨調度上,因而能減少庫存成本。
另一個快閃技術改變營運作業例子是尼爾森收視率調查公司,尼爾森資料庫彙整了來自美國各地抽象家庭的收視資料,原本過去執行一次收視率調查分析,需要4小時才能完成,因此得等到隔天,才釋出前一晚晚間節目的收視率報告,但快閃陣列讓這個分析時間,縮短到了半小時,當晚節目結束後,30分鐘後,尼爾森的顧客就可以得知該檔節目的收看情況。
「這等於創造了全新產品的可能性。」John Hayes表示。
不過,儘管全快閃儲存產品已經可以達到PB級容量,不輸硬碟陣列的容量,但是另一個有待改善的挑戰是,John Hayes表示,現有軟體應該要思考如何改變,才能因應新型態快閃儲存架構,尤其像是許多資料庫系統產品,仍舊是以硬碟技術考量來設計。
「現在已是需要思考下一代儲存技術的時候,快閃這類新型儲存平臺出現後,新一代資料庫的樣貌也應該要有所不同,要能更善用快閃來優化資料庫的效能。」他說。
John Hayes表示,分散式大數據技術也會面臨轉型,過去如Hadoop平臺也是考量硬碟限制來設計,但是新一代大數據平臺大多是串流平臺,反映出企業使用者不想再以批次處理方式來分析資料的傾向。Hadoop為了解決這類需求,只能靠大量記憶體解決,將硬碟上的資料一次讀進記憶體來加快處理速度。但是,串流即時分析需求大多是隨機無序的資料存取處理,而不像前面提到Hadoop資料一次讀進記憶體那樣的循序存取,「串流分析是全新的使用情境,需要大量IOPS,只有靠Flash才做得到。」他說。
新難題:儲存如何因應Container衝擊
推動現有軟體因Flash改變不是John Hayes手上最難的挑戰,更大的難題是儲存技術如何因應容器風潮帶來的衝擊。
儘管Container技術大多用於測試、開發階段,很少用於正式環境中,這意味著,John Hayes表示:「Container仍舊處於非常早期的發展階段,但這明顯是未來一定要走的方向。」但是,「Docker帶來的儲存挑戰是,你根本不知道你的資料儲存在基礎架構上的哪一個位置。」
他解釋,容器可以實現出一個能夠隨時隨地取用的基礎架構,因此,應用程式將會更劇烈的更新、改變,但是,反過來說,企業就得要打造出一個能應付這樣劇烈變動的基礎架構。
但是容器目前大多聚焦於Stateless(無態)的應用,如網頁應用,可是,「我們並非活在無態的世界中。」如何透過儲存來保存應用系統需要的資訊(Stateful應用),John Hayes表示,目前儲存技術還沒有整合到Container技術上,想要在容器架構上建置Stateful應用,還有不少挑戰。「整合儲存和容器技術,將是2017年儲存廠商的焦點之一。」
不過,想要整合兩者,第一個難題是「必須確保每次只有一個Container能存取儲存系統。」他解釋,過去應用系統和儲存系統的界接,大多由人來設定,但是Container是一個高度自動化的系統架構,到了容器世界,所以基礎架構設定都程式化了以後,「你只知道有一個容器正在存取儲存資料,但你不知道是哪一個容器,可是,為了讓下一個容器可以順利存取儲存機制,你得想辦法告訴那個不知名的容器,確保它停止與儲存系統的連線。」John Hayes表示:「這是一個很困難的挑戰。」
Container架構若要支援Stateful應用,還得確保Container能取得一致的資料就不容易,Container經常是快速產生,也會快速消滅,如何避免讓應用程式所在的容器,連線到不同的儲存機制而取得不一致的結果也是另一個課題。「測試開發階段,資料經常會砍掉重練影響不大,但是到了正式環境,你不會希望資料無法保存。」他說。
John Hayes認為,應該在現有Container技術上延伸,讓Container可以記住哪些狀態需要保留如此一來,就可以讓Container成為一個可靠的Container,不過,這並非是像Docker引擎可以做到的事,而是要可以從調度工具層(Orchestration Tool)如Swarm或Kubernetes等來處理。
不過,對儲存廠商而言,只是整合兩種技術還不難,John Hayes認為,如何找出一套對Stateful應用的共同描述,例如這類有態應用需要什麼樣的儲存、哪些常見配置規格等共同規範,這得由開發者端提出才能解決。
「容器世界需要一種新型態的儲存標準,才能解決Stateful的需求。」John Hayes建議。
除此之外,John Hayes認為,Container架構帶來最大考驗是在容器世界的資料生命周期管理,例如如何將資料複製、資料備份機制也整合到容器世界中,但是,「最難的問題是容器世界的升級問題。」
傳統常見作法是,軟體升級跟基礎架構的升級作業各自分開,避免相互影響。但是,John Hayes表示,容器將這兩者結合在一起,「升級基礎架構的同時,也是在升級應用程式的軟體。」
再加上Container崛起後帶來的微服務化更提高了IT基礎架構管理的複雜度,未來企業IT面臨的不是數千、數萬個微服務的管理,而是放在數以百萬計Container內的微服務的管理,得靠更強大的分析工具來簡化維度到人類可以處理的範疇才行。「這不只是調度工具廠商或平臺的責任,也是開發者的挑戰。」他說。
CTO小檔案
John Hayes
Pure Storage創辦人兼首席架構師
加拿大安大略貴湖大學電腦及系統工程學位。於2006年成為網路測驗平臺Bix創始團隊工程師之一,後隨Bix被雅虎併購後進入雅虎任職,專職研發高可用性網路架構。離開雅虎後,2009年時和John Colgrove共同創辦了Pure Storage。John Hayes也成為了Pure Storage首席架構師,負責Flash儲存產品架構設計。
公司檔案
Pure Storage
● 總部:美國加州
● 成立時間: 2009年10月10日
● 主要業務:快閃儲存陣列相關產品( FlashArray和FlashBlade)
● 網址: www.purestorage.com
● 創辦人:John Colgrove、John Hayes
● 執行長:Scott Dietzen
● 營收:2016年預估1.63億美元(約臺幣50億元)
● 員工數:1,600人
公司大事紀
● 2009年:兩位創辦人John Colgrove、John Hayes聯手創立了Pure Storage,後由John Colgrove擔任技術長,John Hayes則擔任首席架構師。
● 2012年:研發3年,終於推出第一款Pure Storage全快閃儲存產品,在6機櫃中可以提供到最大256GB的SSD容量。
● 2013年:4機櫃Pure Storage儲存產品可提供256GB的SSD容量
● 2014年:2機櫃Pure Storage儲存產品可提供512GB的SSD容量
● 2015年:28U高Pure Storage儲存產品可提供1TB快閃儲存。股票公開上市,上市市值約4億美元。
● 2016年:推出7U高容量可達1.5PB的全快閃儲存產品。