Notebook-scoped R庫

Notebook-scoped R庫允許您創建和修改自定義環境特定於一個筆記本。當你安裝一個R notebook-scoped圖書館,隻有當前筆記本和任何相關的工作筆記本獲得圖書館。其他筆記本連接到相同的集群不受影響。

Notebook-scoped庫不存在跨會話。你必須重新安裝notebook-scoped庫每個會話開始時,或當筆記本脫離一個集群。

可用工人自動Notebook-scoped庫庫SparkR udf

安裝庫為所有筆記本電腦連接到一個集群,使用工作空間cluster-installed庫。

notebook-scoped庫安裝在R

您可以使用任何熟悉的方法安裝包R,等install.packages (),Devtools api,或Bioconductor

從磚9.0運行時,R包訪問工人節點以及司機節點。

管理notebook-scoped圖書館R

安裝一個包

需要(devtools)install_version(=“凱撒”,回購=“http://cran.us.r-project.org”)

磚建議使用凹口快照作為存儲庫來保證可重複的結果

devtools::install_github(“klutometis / roxygen”)

把一個R包從一個筆記本的環境

從一個筆記本,刪除notebook-scoped庫使用remove.packages ()命令。

remove.packages(“凱撒”)

用火花udf Notebook-scoped R庫

Notebook-scoped R庫和SparkR

Notebook-scoped庫可用SparkR工人;隻導入一個庫來使用它。例如,您可以運行下麵的生成caesar-encrypted SparkR UDF消息:

需要(devtools)install_version(=“凱撒”,回購=“http://cran.us.r-project.org”)圖書館(SparkR)sparkR.session()你好< -函數(x){圖書館(凱撒)凱撒(“hello world”)}spark.lapply(c(1,2),你好)

Notebook-scoped R庫和sparklyr

默認情況下,在sparklyr: spark_apply (),參數設置為真正的。這個圖書館在當前副本libPaths工人,工人允許您導入和使用它們。例如,您可以運行下麵的生成caesar-encrypted消息sparklyr: spark_apply ():

需要(devtools)install_version(=“凱撒”,回購=“http://cran.us.r-project.org”)圖書館(sparklyr)sc< -spark_connect(方法=“磚”)apply_caes< -函數(x){圖書館(凱撒)凱撒(“hello world”)}sdf_len(sc,5)% > %spark_apply(apply_caes)

如果你不希望圖書館可以在工人,集

庫隔離和RStudio托管

RStudio為每個用戶創建一個單獨的庫路徑;因此用戶相互隔絕。然而,庫路徑不可用的工人。如果你想使用一個包裏麵SparkR RStudio工人的工作,您需要安裝使用集群庫。

另外,如果你使用sparklyr udf,包安裝在RStudio可供工人在使用spark_apply (…=真正的)

常見問題(FAQ)

我怎麼上安裝一個包所有R筆記本的驅動程序?

顯式地設置安裝目錄/磚/火花/ R / lib。例如,使用install.packages ()、運行install.packages (“pckg”,自由= " /磚/火花/ R / lib”)。包安裝在/磚/火花/ R / lib在集群上共享所有的筆記本電腦,但是他們不可以訪問SparkR工人。在筆記本和共享庫也工人,使用集群庫

notebook-scoped庫緩存嗎?

沒有緩存實現notebook-scoped圖書館集群上。如果你安裝一個包在一個筆記本,和另一個用戶安裝同一個包在另一個筆記本在同一集群中,包下載、編譯和安裝。