布隆過濾器創建索引

適用於:檢查標記是的磚的SQL檢查標記是的磚運行時

創建一個新的布隆過濾器指數或重寫數據;它為現有數據創建布魯姆過濾器。命令失敗如果表名或一列不存在。如果啟用了布魯姆過濾列,現有的布隆過濾器選項替換為新選項。

語法

創建BLOOMFILTER指數(]table_name(({columnName1(選項]}(,])](選項]選項選項({key1(=]val1}(,])

參數

雖然是不可能建立一個布隆過濾器指數數據,已經寫好,優化命令更新布魯姆過濾器進行數據重組。因此,您可以回填布隆過濾器的運行優化表:

  • 如果你沒有以前優化表。

  • 用不同的文件大小,要求數據文件被重寫。

  • 與一個ZORDER(或一個不同的ZORDER,如果一個已經存在),要求數據文件被重寫。

您可以調整布魯姆過濾器通過定義選項列級別或在表級別:

  • fpp:假陽性的概率。每寫布隆過濾器所需的假陽性率。這影響所需的比特數把單個項目在布隆過濾器和布隆過濾器的大小的影響。該值必須大於0小於或等於1。默認值是0.1需要5位/項。

  • numItems:文件可以包含許多不同的項目。這個設置對過濾的質量很重要,因為它影響的比特總數中使用布隆過濾器(條目的數量——每項的比特數)。如果這個設置是不正確的,布隆過濾器是非常稀少,浪費磁盤空間和放緩的查詢必須下載這個文件,或者太完整和不準確(FPP)。該值必須大於0。缺省值是100萬件。

  • maxExpectedFpp:預計FPP閾值的布隆過濾器不寫入磁盤。的最大預期假陽性概率布隆過濾器。如果預期的FPP大於這個閾值,布隆過濾器的選擇性太低;所花費的時間和資源使用布隆過濾器超過它的實用性。必須在0和1之間的值。默認是1.0(禁用)。

這些選項隻有在寫作中發揮作用的數據。您可以配置這些屬性在不同層級:寫操作,表級別,列的水平。列級別優先於表和操作水平,和表級優先於操作水平。

看到布隆過濾器的索引