三角洲湖是一個開源存儲層,旨在使可靠性數據湖泊。是基於Apache火花和提供的功能,如酸事務,模式執行,時間旅行。三角洲湖本質上是一個存儲格式,提供了一組功能用於管理數據在數據湖環境。
δ表,另一方麵,是使用三角洲湖創建的表存儲格式。湖三角洲表優化用於數據環境和提供ACID事務等特性,模式執行,時間旅行。δ表本質上是一種特定類型的表是建立在三角洲湖存儲格式。
總之,三角洲湖是一個存儲層,它提供了功能用於管理數據在數據湖環境,而三角洲表的表之上的三角洲湖為處理數據存儲格式,並提供優化的特性在數據湖環境。
湖和δ表在Apache三角洲湖項目相關的概念。延伸Apache火花與ACID(原子性、一致性、隔離、耐久性)湖泊功能數據。
三角洲湖提供了一個存儲層,使事務和可伸縮的數據處理上的雲存儲係統,如Hadoop分布式文件係統(HDFS) / Amazon S3 / ADLS。
參考:https://docs.delta.io/latest/delta-intro.html
δ表是一個數據收集表格的格式組織在三角洲湖。它代表一個表結構模式和相關數據存儲在一個三角洲湖格式。有兩種類型的三角洲表
更多信息請參考以下文檔托管和非托管三角洲表:
https://docs.m.eheci.com/lakehouse/data-objects.html管理的表
湖和δ表的關鍵特性是相同的,它們包括:
ACID事務
模式的實施和發展
時間旅行
數據的可靠性
元數據管理
總之,三角洲湖是底層存儲層,提供事務性和可靠性的特性,而三角洲表代表了三角洲湖內板狀結構,提供ACID屬性,模式執行,版本控製等三角洲湖功能。三角洲表處理結構化數據的主要手段是在三角洲湖。