前期,我想讓你知道,我不是一個資深數據騎師,所以我很抱歉如果這一主題已經覆蓋或僅僅是太簡單了還是狹窄的社區。說,我確實需要幫助的請隨時告訴我如果這是適當的在另一個方向。
為了實現數據科學的好處,數據分析,促進數據質量,我公司決定投資在建設數據湖。幾乎立刻我們的應用程序解決方案工程師發現可以/應該能夠獲得多域和/或掌握單一域數據通過數據API之上的,而不是依賴於多個應用程序API或消耗的API基於unmastered /認證的數據在源係統。假設數據湖的主要目標之一是提高數據質量,如何引入數據質量規則在規模沒有創建一個版本控製問題在您的API目錄中,你的應用程序所有者最終不能跟上,隻是變成了技術債務?湖的承諾不能僅僅是關於科學和分析,可以嗎?
@Marc巴內特,磚Lakehouse架構是理想的數據架構數據驅動的組織。最好結合了數據倉庫和數據質量湖泊為所有主要的數據提供一個單一的解決方案工作負載和支持用例從流媒體BI分析,數據科學和人工智能。理解什麼是Lakehouse架構從這開始//m.eheci.com/blog/2020/01/30/what-is-a-data-lakehouse.html?itm_data=lakehouse-link-lakehou..。
讓我知道如果你想了解一些具體的細節。我們來這裏是為了幫助!