阿帕奇火花TM值とdatabricksのの
Apache Sparkは,高速性,使いやすさ,広範なユースケースにするするなどのを提供提供しします。
- データ結合とEtl
- 対話型分享
- 機械學習と高度な分享
- リアルタイムのデータデータ原理
databricksはspark上部にされており,次のような利。
- 信息性が高度,效率的なデータパイプライン
- 高效率,大規模なデータサイエンス
機械儀
databricksのランタイム |
複數のバージョンの火花を実行 | ||
クラウドクラウドストレージアクセスにに最適最適された組み込みファイル(AWS S3,Redshift,Azure Blob) | ||
SQLおよびPythonワークロードのリソースの自動設定を提供サーバーレスプール | ||
最適利用のための火花ネイティブのきめ細やかなのの | ||
計算リソースの障害のの分享 | ||
S3への高度な書架 | ||
結合およびフィルタリング中のののの最適化 | ||
短ののサイクル | ||
自動スケーリング計算 | ||
ローカルストレージの自動スケーリング | ||
クラスタークラスター高可用 | ||
有沒有 | ||
スポットインスタンスとオンデマンドオンデマンドスタンススタンス間の自動行行 | ||
第2レベルの請求 |
マネージド型delta湖 |
酸トランザクション | ||
スキーマ經理 | ||
バッチ/ストリームの読み取り/書籍のサポート | ||
データのバージョン製劑 | ||
パフォーマンスの最適化 |
綜合ワークワーク. |
複數言語(SQL,Python,R,Scala)に対応する対話型筆記本 | ||
リアルタイムでのコラボレーション | ||
ノートブックの改訂履歴とgithub統合 | ||
ワンクリックによる視覚化 | ||
対話対話型ダッシュボードボードとしてノートを公開 |
使用ジョブとワークフロー |
Sparkジョブジョブ監視 | ||
ワンクリックでノートブックから火花ジョブにデプロイ | ||
ノートノートブックでワークワークフローを構築するためAPI | ||
監視付きの運使用ストリーミング |
エンタープライズセキュリティ |
ノートノート,クラスター,ジョブ,構造化データに対する製禦 | ||
監查ログ | ||
Saml 2.0対応のsso | ||
データの編號化(流れているデータおよび保存されてデータ) | ||
コンプライアンス(HIPAA,SOC 2類型2) |
合並 |
認證されたodbc / jdbc(tableau,lookerなど)を介して他ののツールにする | ||
休息API. | ||
データソースコネクタ |
専門家によるサポート |
Sparkをを設計ししたによるヘルプと | ||
SQLサポート. |