使用管變壓器變異注釋

重要的

這個文檔已經退休了,可能不會被更新。產品、服務或技術中提到的這些內容不再支持。

磚基因組學的運行時已被棄用。開源的等價物,看到回購genomics-pipelines發光。生物信息學庫是運行時的一部分被釋放集裝箱碼頭工人,可從ProjectGlow Dockerhub頁麵。

關於磚運行時棄用策略的更多信息和時間表,看看所有支持的磚運行時版本

使用任何注釋方法變異數據使用發光管的變壓器。

例如,VEP注釋是由下載(注釋數據源緩存)在一個集群中每個節點和調用VEP腳本命令行與管變壓器使用腳本類似於下麵的細胞。

進口發光進口jsoninput_vcf=“databricks-datasets /冰雹/ data-001/1kg_sample.vcf.bgz”input_df=火花格式(“已”)負載(input_vcf)cmd=json轉儲([“/ opt / vep / src / ensembl-vep / vep”,”——dir_cache”,“/ mnt / dbnucleus / dbgenomics / grch37_merged_vep_96”,”——fasta”,“/ mnt / dbnucleus / dbgenomics / grch37_merged_vep_96 /數據/ human_g1k_v37.fa”,”——大會”,“GRCh37”,”——格式”,“已”,”——output_file”,“標準輸出”,”——no_stats”,”——緩存”,”——離線”,”——vcf”,”——合並”])output_df=發光變換(“管道”,input_df,cmd=cmd,input_formatter=“已”,in_vcf_header=input_vcf,output_formatter=“已”)output_df格式(“δ”)保存(“dbfs: / mnt / vep-pipe”)