Apache火花™
ビッグデタ分析に最適なオプンソスの分散処理システムであるApache火花はそのリリス以來,さまざまな業種の企業に採用され,急速な拡大を遂げています。Netflix、雅虎、eBayなどのインターネット大手も,火花を大規模にデプロイし,8000を超えるノードのクラスターで,複數のペタバイトデータをまとめて処理しています。Apache火花は現在250を超える組織から1000名以上が參加する,ビッグデータの最大のオープンソースコミュニティへと急速に成長しています。
Apache火花は100%オープンソースで,ベンダーに依存しないApache軟件基金會によってホストされています。數據庫では,このオ,プンな開発モデルを維持することに全力で取り組んでいます。磚は Spark コミュニティと協力し、開発とコミュニティの活動の両方を通じて Apache Spark プロジェクトに大きく貢獻しています。
ボトムアップでパフォーマンスを向上させるように設計された引發は,メモリコンピューティングやその他の最適化を活用することで,Hadoopの100倍の速度で大規模デタを処理できます。また,Sparkはデタがディスクに格納されている場合にも高速処理が可能です。現在,大規模なディスク上のソ。
Sparkは大規模なデタセットを操作するための使いやすいAPIを備えています.使用實例これには,データを変換するための100以上の演算子と,半構造化データを操作するための使い慣れたデータフレームAPIが含まれています。
火花は、SQLクエリ,ストリーミングデータ,機械學習,グラフ処理のサポートといった,高レベルのライブラリと一緒にパッケージ化されています。これらの標準ラ郵箱ブラリは開発者の生産性を向上させます。また,シムレスに組み合わせることで複雑なワクフロを作成することができます。
磚の統合分析プラットフォームは,分散処理システムの火花,対話型ノートブック,統合されたワークフロー,およびエンタープライズセキュリティについて,5倍のパフォーマンスを提供します。これらは全て,フルマネジド型のクラウドプラットフォムで実行されます。
Databricks無料トラアルオプンソスのApache Sparkプロジェクトはこらからダウンロド可能です。