嘿@Daniel薩哈
劃歸Bloomfilter索引是一個空間數據結構,使數據選擇列上跳過,特別是對於包含任意的文本字段
把這段代碼snipet創建布隆過濾器
(表)上創建BLOOMFILTER指數table_name(列({columnName1[選項]}[,……])][選項]選項選項({key1 [=] val1} [,……])
2-Z-ordering是一個技術把相關信息在同一組文件。這個三角洲湖co-locality自動使用磚data-skipping算法。這種行為大大減少了三角洲湖在磚的數據量需要閱讀。z值數據,在指定的列順序
ZORDER條款:
優化活動日期> = current_timestamp(),間隔1天ZORDER (eventType)
布隆過濾器就像一個幹草堆中尋找一根針(FPP),所以它是更有用的字符串。
z值最好的幾列用於過濾器/連接。
他們可以相互獨立地運行或一起工作。
看到的例子:
https://www.mssqltips.com/sqlservertip/6968/bloom-filter-indexes-using-databricks-delta/
在這個例子中,布隆過濾器也可以用於過濾器。
我們如何決定被索引的列和z命令嗎?基於數據類型字符串或Non-String嗎?
嘿@Daniel薩哈
劃歸Bloomfilter索引是一個空間數據結構,使數據選擇列上跳過,特別是對於包含任意的文本字段
把這段代碼snipet創建布隆過濾器
(表)上創建BLOOMFILTER指數table_name(列({columnName1[選項]}[,……])][選項]選項選項({key1 [=] val1} [,……])
2-Z-ordering是一個技術把相關信息在同一組文件。這個三角洲湖co-locality自動使用磚data-skipping算法。這種行為大大減少了三角洲湖在磚的數據量需要閱讀。z值數據,在指定的列順序
ZORDER條款:
優化活動日期> = current_timestamp(),間隔1天ZORDER (eventType)