微軟繼今年四月在Build大會中,首度推出用來儲存大量非結構化資料的Azure Data Lake之後,近期釋出公開預覽版,改名為Azure Data Lake Store,包括發表新的查詢語言U-SQL、且整合第三方的Hortonworks、MapR與Cloudera等資料分析服務。
微軟雲端與企業部門執行副總裁Scott Guthrie表示,Azure Data Lake Store提供橫跨應用程式、資料、物聯網與雲端架構的資料儲存與分析服務,以協助企業隨時隨地都可以更快地在大量資料中,萃取、分析與運用大規模的資料。
微軟在Azure Data Lake Store中,以Apache YARN為基礎,增加新的動態擴充分析服務,這項新的分析服務包含查詢語言U-SQL,微軟資料平臺副總裁T. K. Ranga Rengarajan表示,程式碼為基礎的解決方案需要大量的資源投入,而已結構化查詢語言SQL來說,缺點在於難以擴充,為了解決這個問題而推出U-SQL,而U-SQL可以協助使用者同時橫跨Azure中的SQL Servers、Azure SQL資料庫與Azure SQL資料倉儲。
另外,微軟將先前用來儲存大量非結構化資料的Azure Data Lake更名為Azure Data Lake Store,強調可以在同一個的地方,用原本的資料格式來儲存各種容量與各種結構化、非結構化與半結構化的混合資料,而不需要利用應用程式來改變資料規模與結構。微軟表示,這項資料儲存技術也可以應用於物聯網中,如可提供線上購物網站進行資料分析,而不會因為資料大小而受到限制。
微軟表示,Azure Data Lake Store相容於HDFS的Hadoop檔案系統,現已整合第三方的Hortonworks、MapR與Cloudera等資料分析服務。而且Azure HDInsight也納入到Azure Data Lake Store中,可以利用各種開源分析引擎如Hive, Spark, HBase and Storm.,來管理Apache Hadoop。
不過,目前微軟尚未公布詳細的上市時間與價格。