三角洲湖是一個開源存儲層,數據可靠性湖泊。三角洲湖提供ACID事務,可擴展的元數據處理,結合流媒體和批量數據處理。湖三角洲湖上運行你的現有數據,與Apache火花api完全兼容。
具體來說,三角洲湖提供:
- ACID事務火花:可序列化的隔離級別確保讀者永遠見不一致的數據。
- 可擴展的元數據處理:利用火花的分布式處理能力來處理所有數十億的pb級別的元數據表文件自在。
- 流和批處理統一:一個表在三角洲湖是一批表以及流源和下沉。流媒體數據攝取、批曆史回填,隻是工作的交互式查詢。
- 執行模式:自動處理模式的變化,防止插入在攝入的不良記錄。
- 時間旅行:數據版本控製使回滾,全部曆史審計跟蹤,可再生的機器學習實驗。
在這個網絡研討會,您將有機會聽到直接從,和提問,邁克爾•Armbrust首席工程師負責三角洲湖。
演講者
|
|
邁克爾時常要 首席工程師,磚 |
|