機器學習模型

機器學習模型是什麼?

機器學習模型是一個程序,可以找到從以前看不見的數據集模式或做決定。例如,在自然語言處理,機器學習模型可以正確解析和識別的意圖之前聞所未聞的句子或單詞的組合。在圖像識別中,機器學習模型可以學會識別對象,如汽車或狗。機器學習模型可以執行這樣的任務,它與一個大型數據集“訓練”。在培訓過程中,機器學習算法優化找到特定的模式或輸出的數據集,根據不同的任務。這個過程的輸出(通常是一個計算機程序與特定的規則和數據結構——被稱為機器學習模型。

機器學習算法是什麼?

機器學習算法是一種數學方法找到一組數據中的模式。機器學習算法往往來自統計、微積分和線性代數。一些流行的機器學習算法的例子包括線性回歸、決策樹,隨機森林,XGBoost。

機器學習模型訓練是什麼?

運行的過程中機器學習算法在數據集(稱為訓練數據)和優化算法來找出特定的模式或輸出稱為模型訓練。與規則生成的函數和數據結構稱為訓練機器學習模型。

不同類型的機器學習是什麼?

一般來說,大多數機器學習技術可以分為監督學習、無監督學習,和強化學習。

監督機器學習是什麼?

監督機器學習的算法提供了一個輸入數據集,並獎勵或優化來滿足一組特定的輸出。例如,監督機器學習被廣泛部署在圖像識別中,利用了一種叫做分類。監督機器學習還用於預測人口如人口增長或健康指標,利用了一種叫做回歸。

非監督機器學習是什麼?

非監督機器學習的算法提供了一個輸入數據集,而不是獎勵或優化特定的輸出,而不是訓練有素的組對象的共同特征。例如,在線商店的推薦引擎依賴於非監督機器學習,特別是技術稱為聚類。

強化學習是什麼?

在強化學習算法是使用許多試驗和錯誤實驗訓練本身。強化學習算法時發生與環境不斷地相互作用,而不是依靠訓練數據。最受歡迎的強化學習是自主駕駛的例子。

不同的機器學習模型是什麼?

有很多機器學習模型,幾乎都是基於特定的機器學習算法。受歡迎的分類和回歸算法屬於監督機器學習,和聚類算法通常部署在非監督機器學習的場景。

監督機器學習

邏輯回歸:邏輯回歸是用來確定一個輸入屬於某一團體或不是
支持向量機:支持向量機,或者支持向量機為每個對象創建坐標的n維空間和使用一個超平麵組對象的共同特征
樸素貝葉斯:樸素貝葉斯算法假定變量之間的獨立性,並使用概率基於特征對象進行分類
決策樹:決策樹分類器,是用來確定哪些類別由遍曆輸入落入葉和節點的樹
線性回歸:線性回歸是用來識別感興趣的變量和輸入之間的關係,並預測其價值觀基於輸入變量的值。
資訊:k最近的鄰居技術包括分組最接近的對象在一個數據集和找到最常見的或平均特征的對象之一。
隨機森林:隨機森林是許多隨機決策樹的集合的子集的數據,導致樹木的組合,可能比一個更準確的預測決策樹。
增強算法:增強算法,如梯度增加機器,XGBoost LightGBM,使用整體學習。他們從多個組合預測算法(如決策樹),同時考慮到從以前的算法誤差。

非監督機器學習

K - means: K - means算法發現對象之間的相似性和組成K不同集群。
層次聚類:分層聚類樹構建一個嵌套的集群,而無需指定數量的集群。

什麼是機器學習中決策樹(ML) ?

決策樹是一個預測方法在ML確定對象屬於哪個班。顧名思義,決策樹是一個樹狀流程圖,類對象的逐步使用某些已知條件決定。

決策樹在磚Lakehouse可視化。 來源://m.eheci.com/blog/2019/05/02/detecting-financial-fraud-at-scale-with-decision-trees-and-mlflow-on-databricks.html

什麼是機器學習中回歸?

數據科學和機器學習中的回歸分析是一種統計方法,使預測結果基於一組輸入變量。結果通常是一個變量,取決於輸入變量的組合。

線性回歸模型對磚Lakehouse執行。 來源://m.eheci.com/blog/2015/06/04/simplify-machine-learning-on-spark-with-databricks.html

機器學習中分類器是什麼?

分類器是一種機器學習算法,分配一個對象作為一個類別或團體的成員。例如,分類器是用來檢測如果電子郵件是垃圾郵件,或者如果事務是欺詐。

在機器學習有多少型號?

許多!機器學習是一個不斷發展的領域,總有更多的機器學習模型被開發。

最好的機器學習模型是什麼?

機器學習模型最適合具體情況取決於期望的結果。例如,預測車輛購買的數量在一個城市從曆史數據,監督學習技術,如線性回歸可能是最有用的。另一方麵,以確定如果一個潛在的客戶在這個城市購買一輛車,考慮到他們的收入和通勤的曆史,一個決策樹可能會更好。

什麼是模型部署在機器學習(ML) ?

模型部署的過程是一個機器學習模型對一個目標使用或生產環境測試。模型通常是與其他應用程序集成環境中通過api(如數據庫和用戶界麵)。部署階段之後,一個組織可以使沉重的投資回報率模型開發。

一個完整的機器學習模型在磚Lakehouse的生命周期。 來源://m.eheci.com/blog/2019/09/18/productionizing-machine-learning-from-deployment-to-drift-detection.html

深度學習模型是什麼?

深度學習模型是一類毫升的模型,模仿人類處理信息的方式。模型由幾層處理(因此“深”)一詞來提取數據提供的高級功能。每個處理層傳遞數據的一個更抽象的表示下一層,最後一層提供更接近人類的洞察力。與傳統ML模型需要標記數據,深度學習模型可以攝取大量的非結構化數據。他們是用於執行更人性化的麵部識別和自然語言處理等功能。

深度學習的簡化表示。 來源://m.eheci.com/discover/pages/the-democratization-of-artificial-intelligence-and-deep-learning

機器學習時間序列是什麼?

時序機器學習模型是一個獨立的變量是一個連續的時間分鍾,天,年等),有一個軸承在依賴或預測變量。時間序列的機器學習模型被用來預測有時限的事件,例如- - -未來一周的天氣,預計未來一個月的客戶數量,未來的收入預期,等等。beplay体育app下载地址

我在哪裏可以了解更多關於機器學習?

看看這個免費的電子書發現許多迷人的機器學習用例被企業在全球範圍內部署。
得到更深的理解的機器學習專家,檢查磚機器學習博客。

額外的資源

回到術語表