術語表

什麼是事務?在數據庫和數據存儲係統的環境中,事務的任何操作都被視為單個的工作單元,完成完全或不完全,和樹葉的存儲係統一致的狀態。典型的例子啊{…}
梯度下降法是最常用的優化方法部署在機器學習和深度學習算法。它是用來訓練機器學習模型。類型的梯度下降{…}
替代數據是什麼?替代數據收集的信息通過使用替代來源的數據其他人不使用;非傳統的信息來源。替代數據的分析可以提供見解之外,一個行業的常規數據來源{…}
異常檢測是識別罕見的事件或觀察的技術可以提高懷疑被統計不同於其他的觀察。這樣的“反常”行為通常轉化為某種信用卡欺詐等問題,失敗的機器,或cy{…}
Apache蜂巢是什麼?Apache蜂巢™是一個數據倉庫軟件,便於閱讀,寫作,和管理大型數據集居住在分布式存儲使用SQL在Apa之上{…}
Apache撚角羚是什麼?Apache撚角羚是一個自由和開放源碼Apache Hadoop柱狀存儲係統發達。這是一個引擎用於結構化數據支持低延遲的隨機訪問{…}
Apache麒麟是什麼?分布式開放源碼Apache麒麟是聯機分析處理(OLAP)引擎互動分析大數據。Apache麒麟被設計來提供SQL接口和多維分析(OLAP){…}
Apache火花是什麼?Apache火花是一個開源的分析引擎用於大數據的工作量。它可以處理兩個批次以及實時分析和數據處理工作負載。Apache火花的研究項目始於2009年,加州大學伯克利分校。{…}
Apache火花作為服務是什麼?Apache火花是一個開源集群計算快速實時大規模數據處理的框架。自2009年成立以來在加州大學伯克利分校的AMPLab,引發了主要的增長。目前被評為最大的開源communi{…}
人工神經網絡是什麼?一個人工神經元網絡(ANN)是一個計算係統的手術後的神經元在人類的大腦。人工神經網絡如何工作?人工神經網絡可以看作加權direc最好{…}
自動化的偏見是什麼?自動化的偏見是一種過度依賴自動化艾滋病和決策支持係統。自動化輔助決策係統的可用性日益增加等關鍵決策上下文重症監護病房,或飛機駕駛艙是構成{…}
貝葉斯神經網絡是什麼?貝葉斯神經網絡(bnn)指擴展後的標準網絡推理為了控製過度學習。從更廣泛的角度來看,貝葉斯方法使用統計方法,這樣一切都probab{…}
數據和大數據分析的區別在Hadoop的發明之前,現代存儲和計算技術支撐係統相對基礎,限製了伴隨矩陣{…}
生物信息學是一個研究領域,使用計算從海量生物數據中提取知識。{…}
火花SQL是催化劑優化器的核心,它利用高級編程語言特性(例如Scala的模式匹配和準引號)小說的方式來構建一個可擴展的查詢優化器。Scala中的催化劑是基於函數式編程構造和設計t{…}
複雜事件處理(CEP)是什麼?複雜事件處理(CEP)也稱為事件,流或事件流處理技術的使用存儲在數據庫或前查詢數據,在某些情況下,而不會被存儲。複雜事件處理我{…}
連續應用程序是一個端到端的應用程序,對數據進行實時的反應。特別是,開發人員想要使用一個編程接口來支持持續應用程序正在處理的方麵在單獨的係統中,如查詢服務或交互智慧{…}
在深度學習,卷積神經網絡(CNN或事先)是一種深層神經網絡,通常用於識別模式出現在圖像但他們也用於空間數據分析、計算機視覺、自然語言處理、信號處理和各種其他p{…}
數據分析平台是什麼?Beplay体育安卓版本數據分析平台是一個生態係統的服務和Beplay体育安卓版本技術,需要執行大量的分析,複雜和動態數據,允許您檢索,結合,相互作用,探索和可視化數據從各種來源的伴隨矩陣{…}
數據治理是什麼?數據治理是監督,以確保數據帶來價值和支持商業策略。數據治理不僅僅是一種工具或一個過程。它將數據相關需求在peo商業策略使用一個框架{…}
什麼是數據Lakehouse ?數據lakehouse是一個新的、開放數據管理體係結構,結合了靈活性,成本效益和規模數據與數據管理和湖泊wareho ACID事務數據{…}
數據共享是什麼?數據共享是能夠使相同的數據可用於一個或多個消費者。如今,不斷增長的數據量已成為一種戰略資產對任何公司。共享數據——組織內部或外部是一個使能技術fo{…}
什麼是數據倉庫?數據倉庫是一種數據管理係統,將來自多個源的當前和曆史數據存儲在一個商業友好的方式更容易的見解和報告。數據倉庫通常用於商業智能(BI),報告和d{…}
磚運行時上運行的軟件構件集的集群機器由磚。它包括火花,還添加了許多組件和更新,大大提高可用性、性能和安全的大數據分析。主分型{…}
什麼是DataFrame ?DataFrame是一種數據結構,將數據組織成一個二維表的行和列,就像一個電子表格。DataFrames最常見的一種數據結構應用於現代數據分析,因為它們是一個靈活的和直觀的方式{…}
數據集是類型安全的版本的火花的結構化的Java API和Scala。這個API是在Python和R,因為這些都是動態類型語言,但它是一個強大的工具用Scala編寫大型應用程序和Java。回想一下,DataFrames是分布式的{…}
深度學習是什麼?深度學習是機器學習的一個子集涉及大量數據和算法受到人類大腦的結構和功能,這就是為什麼深度學習通常被稱為深層神經網絡模型。我{…}
需求預測是什麼?需求預測是預測消費者需求的過程(相當於未來的收入)。具體地說,它預計的各式各樣的產品消費者會購買使用定量和定性數據。{…}
密度張量值存儲在一個連續的連續的內存塊,所有值表示。張量或多維數組中使用一組不同的多維數據分析應用程序。有很多張量計算,軟件產品能夠進行{…}
DNA序列是什麼?DNA序列的過程中確定的確切的核苷酸序列的DNA(脫氧核糖核酸)。測序DNA的順序四個化學積木——腺嘌呤、鳥嘌呤、胞嘧啶、胸腺嘧啶也稱為基地,在發生{…}
ElasticSearch是什麼?Elasticsearch NoSQL,分布式數據庫存儲,檢索和管理麵向文檔和半結構化數據。,此外,它是一個開源的Apache Lucene搜索引擎之上,根據公布的Apache L{…}
基因組學領域內遺傳學擔心一個有機體的基因組的測序和分析。它的主要任務是確定整個序列的DNA或原子的成分構成DNA和DNA原子之間的化學鍵。基因組學的領域感興趣{…}
Hadoop是什麼?Apache Hadoop是一個基於java的開放源碼的軟件平台管理大數據應用程序的數據處理和存儲。Beplay体育安卓版本Hadoop是通過分發大型數據集在集群中的節點計算和分析工作,將他們分解成較小的工作負載t{…}
什麼是Hadoop集群?Apache Hadoop是一個開源的、基於java、軟件框架和並行數據處理引擎。它使大數據分析處理任務被分解成更小的任務,可以perfor{…}
HDFS是什麼?HDFS代表Hadoop分布式文件係統。HDFS的功能是操作作為一個分布式文件係統設計的硬件上運行。HDFS是容錯,設計低成本的硬件上部署。HDFS提供高吞吐量的應用{…}
Hadoop生態係統是什麼?Apache Hadoop生態係統是指各種組件的Apache Hadoop軟件圖書館;它包括開源項目以及一個完整的範圍的補充工具。一些t{…}
在計算中,哈希表(散列映射)是一種數據結構,它提供了幾乎直接訪問對象基於關鍵(一個獨一無二的字符串或整數)。一個哈希表使用一個哈希函數計算成一個數組索引桶或槽,可以找到所需的值。這是{…}
一個蜂巢日期函數是什麼?蜂巢提供了許多內置函數來幫助我們在處理和查詢的數據。這些函數提供的一些功能包括字符串操作、操作日期,類型轉換、條件運算符、數學功能{…}
托管火花是什麼?Apache火花是一個快速和大數據集群計算係統建立在速度、易用性和先進的分析,最初建於2009年在加州大學伯克利分校。高層在Scala api,它提供了Java、Python、R和一個優化引擎{…}
什麼是Jupyter筆記本?Jupyter筆記本是一個開源的web應用程序,它允許數據科學家創建和共享文檔,包括代碼,equatio{…}
Keras模型是什麼?Keras深度學習是一個高級庫,Theano和Tensorflow之上。寫在Python和提供一個幹淨的和方便的方式來創建一個範圍的深度學習模型。�{…}
什麼是Lakehouse零售嗎?磚的第一特定於行業的Lakehouse Lakehouse零售。它可以幫助零售商通過解決方案加速器快速啟動和運行,數據共享能力,和合作夥伴生態係統。{…}
λ架構是什麼?λ架構是一種處理大量的數據(即“大數據”),為獲得批處理和流處理方法提供了一個混合的方法。λ架構用於計算arbitra解決問題{…}
Apache火花的機器學習庫(MLlib)被設計為簡單起見,可伸縮性,並且很容易與其他工具的集成。與可伸縮性、語言兼容性,和速度的火花,科學家可以專注於他們的數據和模型,而不是解決問題的複雜性包圍{…}
機器學習模型是什麼?機器學習模型是一個程序,可以找到從以前看不見的數據集模式或做決定。例如,在自然語言處理,機器學習模型可以正確解析和識別以前unhe背後的意圖{…}
管理的火花是什麼?火花管理服務允許您利用開源數據批處理工具,查詢、流媒體和機器學習。通過使用這種自動化您將能夠快速創建集群需求,輕鬆管理它們,把它們{…}
MapReduce是什麼?MapReduce是一個基於java的、分布式的執行框架Apache Hadoop生態係統內。它帶走了分布式編程的複雜性,讓兩個開發人員implem的處理步驟{…}
一個圖案架構是什麼?大獎章的體係結構是一種數據設計模式用於lakehouse邏輯上組織數據,與增量的目標,da的結構和質量逐步提高{…}
通常運行時機器學習算法,它包括一係列的任務,包括預處理、特征提取、模型擬合,驗證階段。例如,當分類文本文檔可能涉及文本分割和清潔,提取特征,和培訓類{…}
MLOps是什麼?MLOps代表機器學習操作。MLOps是機器學習的核心功能工程,集中在簡化過程中機器學習模型來生產,然後維護和監控。MLOps是協作功能,beplay娱乐ios經常com{…}
模型風險管理的監督是指潛在的不良後果的風險決策基於不正確或濫用模型。風險管理模型的目的是使用技術和實踐,將識別、測量和減少模型風險即模式的可能性{…}
神經網絡是什麼?神經網絡計算模型的分層結構類似於大腦中的神經元的網絡結構。它功能相互聯係的處理元素稱為神經元一起工作來產生一個輸出函數。神經網絡是由時間組成的{…}
編製是什麼?編排多個計算機係統的協調和管理,應用程序和/或服務任務串聯起來,以更大的工作流程或流程執行。這些過程可以包含多個任務自動化,我可以{…}
熊貓是一個開源,bsd許可下圖書館為Python編程語言編寫的,它提供了快速、適應性強的數據結構,以及數據分析工具。這個易於使用的數據操作工具最初是由韋斯·麥金尼寫的。它是建立在Numpy str包和關鍵數據{…}
拚花是什麼?Apache拚花是一個開源的,用於數據文件格式設計高效的數據存儲和檢索。它提供了高效的數據壓縮和編碼方案與處理大量複雜的數據增強性能。Apache拚花設計{…}
預測分析是什麼?預測分析是一種先進的分析,使用新的和曆史數據來確定模式和預測未來的結果和趨勢。預測分析是如何工作的呢?往下預測分析使用了很多技術{…}
PyCharm是一個集成開發環境(IDE)用於計算機編程、創建Python編程語言。當使用PyCharm磚,默認情況下PyCharm Python創建了一個虛擬環境,但你可以配置創建一個Conda環境或使用現有的一個。{…}
PySpark是什麼?Apache火花是用Scala編程語言寫的。PySpark已經發布為了支持Apache火花和Python的合作,它實際上是一個Python API的火花。此外,PySpark,幫助你的界麵彈性分布式數據集(R{…}
實時數據為零售是什麼?實時零售數據的實時訪問。從批量訪問、分析和計算將使數據是“永遠在運行”,從而獲得準確、及時的決策和商業智能。Real-tim{…}
抽樣是主要麵向用戶的API引發自成立以來。的核心,一個抽樣分布是一個不可變的{…}
如果你正在與火花,你將遇到三個api: DataFrames,數據集,和抽樣彈性分布式數據集是什麼?抽樣或彈性分布式數據集,是記錄的集合與分布式計算、容錯、在自然界不可變的{…}
火花的應用程序由一個驅動過程和一組執行程序的過程。司機流程運行main()函數,坐在集群中的一個節點,並負責三件事:維護信息引發程序;響應用戶的程序或{…}
許多數據科學家,分析師和一般商業智能用戶依賴於交互式探索數據的SQL查詢。火花SQL是一種火花為結構化數據處理模塊。它提供了一個編程抽象叫DataFrames als{…}
流火花是什麼?Apache火花流本身是一個可伸縮的流處理容錯係統,同時支持批處理和流媒體的工作負載。火花流是核心火花的擴展API,允許數據工程師和科學家過程實時性{…}
引發性能調優是什麼?火花性能調優的過程是指記錄內存調整設置,核心,和實例使用的係統。這個過程保證火花有完美的表現,同時也防止資源的瓶頸效應{…}
Sparklyr是什麼?Sparklyr之間提供了一個接口是一個開源包R和Apache火花。您現在可以利用R火花的能力在現代環境中,由於火花與分布式數據交互的能力幾乎沒有延遲。Sparklyr是一個有效{…}
SparkR火花的工具運行R。它遵循同樣的原則作為引發的所有其他語言綁定。使用SparkR,我們隻是將其導入我們的環境並運行我們的代碼。它非常類似於Python API除了它遵循R的語法,而不是Python。在大多數{…}
Python提供了一個內置庫稱為numpy操縱多維數組。這個庫是一個主要的組織和使用要求開發pytensor圖書館。{…}
流分析是如何工作的呢?流分析,也稱為事件流處理,是巨大的分析的當前和“運動”數據池通過使用連續查詢,稱為事件流。這些流是由一個特定的事件發生{…}
結構化流是一個高級API 2.2流處理,生產就緒的火花。結構化流允許您采取同樣的操作,執行批處理模式使用火花的結構化的api,並以流媒體的方式運行它們。這可以減少延遲和允許的{…}
2015年11月,Google發布了它為機器學習,並命名為TensorFlow開源框架。它支持深度學習、神經網絡和一般數值計算cpu、gpu,集群{…}
Tensorflow估計API是什麼?估計是一個完整的模型也看起來直觀足以減少用戶。估計量的API提供了一些方法來訓練模型,來判斷模型的準確性,並生成預測。{…}
轉換是什麼?在火花,核心數據結構創建不可變意味著他們無法改變一次。這可能似乎是一個奇怪的概念,如果你不能改變它,你應該如何使用它呢?為了“改變”DataFrame{…}
鎢項目是什麼?鎢的代號是傘項目修改Apache火花的執行引擎,關注大幅提高火花應用程序的內存和CPU的效率,推動性能接近現代的極限{…}
統一的人工智能或可用在F8今年宣布了Facebook。這彙集了2特定深度學習框架,Facebook創建和外包——PyTorch專注於研究假設進入大規模計算資源雖然咖啡關注模型部署o{…}
統一數據分析是一個新的類別統一數據處理與人工智能技術的解決方案,使得企業組織和AI更加可行的使它們加速AI倡議。統一數據分析使企業更容易構建數據管道開頭{…}
磚的統一數據分析平台幫助組織加快創新統一數據科學與工程和業務。Beplay体育安卓版本與磚作為統一的數據分析平台,您可以快速大規模數據準備和幹淨,沒有限製。Beplay体育安卓版本pl的{…}
一個統一的數據倉庫是什麼?一個統一的數據庫也被稱為一個企業數據倉庫持有所有組織的業務信息,使其可訪問整個公司。大多數公司今天,數據在孤立的筒倉管理不同{…}
Baidu
map