開源
einige der weltweit相信貝特斯坦開放源代碼datentechnologien wurdenursprünglichvon databricks-ingenieuren erfunden
Einem Treffen TeilnehmenUnsere相信btesten開源projekte
Apache Spark™
Apache Spark Ist Eine Vereinheitlichte Engine ZumAusführenvon數據工程 - 數據科學 - 科學 - 和ml-workloads。
三角洲湖
MIT Delta湖KönnenSie Eine Lakehouse-Architektur auf Speichersysteme wie aws S3,ADLS,GCS und HDFS Aufsetzen。
MLFLOW
MLFLOW VERWALTET DEN ML-LEBENSZYKLUS,EINSCHLIEßLICHPERAPERIMENTE,ROPODUZIERBARKEIT,emplionierung und einer zentralen modellregistrierung。
重新裝飾
MIT Redash Kann Wirklich Jeder Anwender SQL Nutzen,UM Daten AusGroßen和Kleinen datenquellen Zu Untersuchen,Abzufragen,Zu Visualisieren und Zu teilen。
三角洲 - 弗裏格貝
Delta共享Das Branchenweit Erste Offene offene protokollfürdie sichere datenfreigabe。MIT Delta共享Wird der Datenaustausch Mit Anderen Organisationen Zum Kinderspiel。
databricksunterstütztAußerdemdie folgenden clisebten開源技術
TensorFlow
databricksunterstützttensorflow,einebibliothekfür深度學習和allgemeine berechnungen auf clustern
Pytorch™
Pytorch-SchöpferFacebook和Databricks Entwickeln Gemeinsam Integrationen
keras™
在Python geschriebene深入學習中,auf tensorflow aufbaut。Databricks運行時Für機器學習中的Verfügbar。
rstudio
Eine Sammlung von開源工具Fürkollaborative數據科學麻省理工學院
Scikit-Learn
weit derbreitetes python-paketfürmaschinelles leernen,das auf numpy,scipy and matplotlib aufbaut
xgboost
eine脊椎梯度增強 - 促進二葉thibiothek mit bindungen in sprachen wie python,r und c ++
Möchtensie loslegen?