數據鏈接의핵심구성視頻鏈接소는데이터사이언스워크스페이스이며,데이터팀에있는모든사람이협업할수있도록지원합니다。협업형노트북환경은데이터사이언티스트,데이터애널리스트,데이터엔지니어등,데이터팀에있는모든사람이사용합니다。數據庫는다양한산업에서이와마찬가지로폭넓은사용사례에사용됩니다。이갤러리에서는자신의數據庫환경으로쉽게가져올수있는노트북이나무료커뮤니티에디션(ce)이제공하는몇가지대적예시를담았습니다。

三角洲湖

데이터레이크하우스를구축하고酸트랜잭션,시간이동,제약조건등을오픈파일형식으로가져오기

磚:7.6.x– 비 CE

三角洲湖자세히보기

酸트랜잭션을Apache火花™로가져오는오픈소스스토리지형식인三角洲湖에대한자세한설명입니다。

δ PySpark 데이터

磚:8.0.x

R에서三角洲湖사용하기

SparkR을사용하여오픈소스스토리지형식인三角洲湖를사용하기위한기본안내서입니다。

r δ 데이터

磚:7.6.x

튜토리얼:三角洲湖소개

三角洲湖:酸트랜잭션을Apache火花와빅데이터워크로드로가져오는오픈소스스토리지형식입니다。

δ PySpark 시간 이동 데이터

考拉

熊貓데이터사이언스코드를단일노드에서분산된클러스터로간편하게이동

磚:7.6.x

10분만에熊貓에서考拉로이동

熊貓를능숙하게사용하는분을대상으로대규모문제에대해熊貓를考拉로전환하는방법을친절하게설명해드립니다。

eda 熊貓 考拉 PySpark

머신 러닝

TensorFlow、火花MLlib Horovod등의인기머신러닝프레임워크지원

磚:7.6.xw/GPU – 비 CE

PyTorch및Horovod를사용한분산형딥러닝

PyTorch에서Horovod를사용하여분산된모델훈련을실행하는방법을알아보세요。

pytorch horovod 분산된훈련

磚:8.1.x

Spark로스트리밍ML애플리케이션구축

火花를사용하여신용카드사기를모니터링하는스트리밍毫升애플리케이션을구축합니다。

PySpark 사기 탐지 結構化流

磚:7.6.x

Spark MLlib로시작하기

ML애플리케이션에Spark MLlib라이브러리를사용하는방법을소개합니다。

MLlib PySpark 工程特性 하이퍼매개변수검색

磚:7.6.xw/GPU – 비 CE

Spark에서TensorFlow까지:데이터전환단순화

火花DataFrames의데이터를간단하게전환하여TensorFlow에서사용할수있습니다。

PySpark petastorm tensorflow 분산된훈련

磚:7.6.xw/GPU – 비 CE

TensorFlow 2를사용한분산형딥러닝

TensorFlow 2로분산된훈련을수행하는방법을알아보세。

tensorflow 딥러닝 분산된훈련

MLflow

머신러닝에대한종단간지원:모델훈련부터프로덕션배포까지

磚:7.6.x

MLflow를사용하여ML프로젝트에대한로깅시작하기

ML워크플로관리를위한MLflow로깅API를소개합니다。

MLFlow sckikit-learn 랜덤포레스트

磚:7.6.x

빠른시작:MLflow플루언트추적API를사용하는방법

MLflow에서고차원플루언트추적API를사용하는방법을알아보세。

MLFlow 流利的 sckikit-learn 랜덤포레스트

磚:7.6.x– 비 CE

데이터에대한종단간머신러닝의예시

` ` ` ` `데이터에대한종단간ml수명주기의예시를보여주는노트북입니다。

MLFlow sckikit-learn 랜덤포레스트 하이퍼매개변수검색

磚:8.0.x

R을사용한MLflow빠른시작

R에서ML추적을위한MLflow를사용하는방법을알아보세。

r MLFlow

Apache火花™

데이터레이크하우스에서데이터엔지니어링과데이터사이언스를지원하는분산형컴퓨팅엔진

磚:8.1.x

센서데이터를위한스트리밍애플리케이션

火花의구조적스트리밍을사용하여센서데이터애플리케이션을사용하는방법을알아보세요。

sql PySpark 結構化流

磚:8.1.x

Spark를사용한샌프란시스코화재신고분석

Spark ETL을사용하여샌프란시스코소방서화재신고를분석합니다。

etl eda PySpark

磚:8.1.x

Spark에서외부데이터소스와상호작용

Spark에서외부데이터소스에액세스하고이와상호작용하는방법을간단히소개합니다。

sql udf 火花 scala

磚:8.1.x

실시간애플리케이션을위한구조적스트리밍

실시간데이터를위한Spark구조적스트리밍의시맨틱을소개합니다。

sql PySpark 結構化流

磚:8.0.x– 비 CE

사용자정의함수(UDF)로SparkR확장

UDF R에서를사용하여맞춤함수를작성하고SparkR의기능을확장하는방법을알아보세요。

udf SparkR 분산형컴퓨팅

磚:8.1.x

적응적쿼리실행

Spark 3.0에서의적응적쿼리실행(AQE)에대해설명합니다。

sql PySpark 적응적쿼리실행(aqe)

사용 사례

數據庫는금융,리테일,기술,제조등의여러산업에서사용됩니다。

磚:7.6.x

리테일을위한시장바스켓분석

리테일을위한시장바스켓분석을실행하는방법을보여주는노트북입니다。

리테일 시장바스켓분석

磚:7.6.x

Spark를사용한금융시계열확장

Spark를사용하여금융시계열데이터를분석하고시장조작을찾아냅니다。

PySpark 시계열 사기 탐지

솔루션
액셀러레이터

5가지산업에서數據庫를사용하기위한완전한템플릿

솔루션둘러보기

Baidu
map