磚是一個核心組成部分數據科學的工作區,使每個數據團隊之間的協作。協作筆記beplay娱乐ios本電腦所使用的環境是每個人的數據團隊:數據科學家,數據分析師、工程師等等。磚使用各種各樣的產業同樣廣闊的一組用例。這畫廊展示了一些可能性通過筆記本電腦可以很容易地導入到自己的磚或環境自由community edition (CE)。
三角洲湖
構建數據lakehouse ACID事務,時間旅行,限製和更多的開放文件格式
磚:7.6.x– not CE
深入探究三角洲湖
這是一個深入探討三角洲湖,這是一個開源存儲格式,使Apache ACID事務引發™。
磚:8.0.x
利用R的三角洲湖
這是一個快速101介紹使用三角洲湖,這是一個開源存儲格式,使用SparkR。
磚:7.6.x
教程:三角洲湖入門
三角洲湖:開源存儲格式為Apache火花和大數據帶來了ACID事務工作負載。
考拉
毫不費力地移動你的熊貓數據科學代碼從單節點分布式集群
磚:7.6.x
熊貓考拉在10分鍾
那些熟悉的溫柔介紹熊貓考拉對大規模問題的過渡。
機器學習
像TensorFlow支持流行的機器學習框架,引發MLlib Horovod
磚:7.6.xw/GPU – not CE
深度學習與PyTorch Horovod分布
學習如何執行分布式訓練模型使用Horovod PyTorch。
磚:8.1.x
構建應用程序流毫升與火花
建立一個監控的流ML應用程序使用火花信用卡欺詐。
磚:7.6.x
開始使用MLlib火花
介紹使用火花MLlib毫升應用程序庫。
磚:7.6.xw/GPU – not CE
從火花TensorFlow:簡化你的數據轉換
簡化數據的轉換與TensorFlow火花DataFrames使用。
磚:7.6.xw/GPU – not CE
分布式深度學習TensorFlow 2
學習如何執行分布式訓練TensorFlow 2。
MLflow
的端到端支持機器學習:從訓練你的模型將它們移動到生產
磚:7.6.x
開始使用日誌記錄與MLflow毫升項目
介紹MLflow毫升工作流管理日誌API。
磚:7.6.x
快速入門:如何使用MLflow流利的跟蹤api
學習如何使用高級MLflow流利的跟蹤api。
磚:7.6.x– not CE
表格數據的端到端機器學習的例子
這是一個筆記本展示一個例子,一個端到端的毫升表格數據的生命周期。
磚:8.0.x
MLflow快速啟動與R
學習如何使用MLflow ML R中的跟蹤。
Apache火花™
分布式計算引擎,列強lakehouse數據工程和數據科學數據
磚:8.1.x
為傳感器數據流的應用程序
學習如何使用結構化流火花的傳感器數據的應用程序。
磚:8.1.x
分析三藩市消防電話的火花
使用ETL火花來分析調用舊金山消防部門。
磚:8.1.x
與外部數據源交互的火花
簡要介紹了如何訪問和與外部數據源進行交互的火花。
磚:8.1.x
結構化流媒體實時應用程序
介紹的語義結構化流媒體實時數據的火花。
磚:8.0.x– not CE
使用用戶定義函數(udf)擴展SparkR
學習如何擴展的功能通過自定義函數使用udf SparkR R。
磚:8.1.x
自適應查詢執行
說明自適應查詢執行3.0 (AQE)的火花。
屬於接近d 'uso
磚廣泛應用在許多行業,包括金融、零售、科技、製造業等等
磚:7.6.x
對零售市場購物籃分析
這是一個筆記本展示如何執行為零售市場購物籃分析。
磚:7.6.x
擴展金融時間序列與火花
使用火花來分析金融時間序列數據,以確定市場操縱。