取消
顯示的結果
而不是尋找
你的意思是:

是什麼功能的實際優勢商店相比,三角洲湖嗎?

Saeid_H
貢獻者

有人能解釋一下使用一個特性存儲的實際優勢與三角洲湖。顯然他們都以同樣的方式工作和特色商店不提供額外的價值。然而,基於文檔在磚頁麵,有些使用FS的好處,然後再次對我來說不是有形的。什麼才是真正重要的,是要知道什麼是巨大的技術優勢和賣點FS /δ表。

提前感謝!

7回複7

LandanG
尊敬的貢獻者
尊敬的貢獻者

嗨@Saeid Hedayati,

有一點要注意的是,磚三角洲特征存儲表的表,區別不同的UI和一些額外的功能。所以不一定FS和三角洲,FS使用三角洲。

的好處使用磚FS(而不是一個獨立的三角洲表)主要是由於多麼容易,並自動與其他磚MLflow等功能的集成,和它提供的功能像血統(即。模型和筆記本使用哪些特性),自動查找模型,以及UI(我可能忘記了)。

我不知道這是否回答了你的問題。如果需要我可以試著闡明更多

嗨@Landan喬治,

謝謝你及時響應和詳細的答案。

後一點,我不是,是關於與MLflow集成。你有一個具體的例子,在其中存儲用MLflow特性是更容易,比使用三角洲湖表。

一個點,我想,它可能是存儲特性的好處相比正常三角洲湖表,準備階段的轉換特性可以存儲(例如one-hot-encodig變換擬合函數和訓練期間min-max-scaler),所以,一旦我們在生產部署模型,得到一個新的批看不見的原始數據,我們將不需要加載醃擬合函數應用到新的數據,我的假設是錯誤的嗎?

謝謝!

LandanG
尊敬的貢獻者
尊敬的貢獻者

嗨@Saeid Hedayati,

我看一看這個示例的筆記本很容易看到MLflow集成了FS。關於你的第二個段落,這的確是使用一個特性存儲的好處之一。

嗨@Landan喬治,

謝謝你分享這個筆記本,也你的洞察力。抱歉不清楚上麵和我的語句。我的意思是,如果我有一個做一些變換預處理管道(如one-hot-encoding或縮放數值)在訓練數據,然後存儲安裝功能為預處理泡菜一旦一套新的原始推理數據分批到達,我們必須應用原始數據轉換函數,所以它被訓練數據的格式。但是我認為真正的FS保存映射transforamtion裏麵,一旦我們得到新的原始數據推斷我們不需要加載那些醃功能和應用它,我們可以直接使用FS變換它們的能力。但我假設這個功能還沒有特征存儲的一部分。對吧?

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map