亞當

亞當是基因組數據處理庫在Apache火花。是用來實現管道操作基因如BAM讀取數據,薩姆和補習的文件。

用亞當在磚:

  1. 啟動一個磚與這些集群運行時火花配置:

    # Hadoop配置org.apache.spark.serializer.KryoSerializerspark.kryo.registrator org.bdgenomics.adam.serialization.ADAMKryoRegistratorspark.hadoop.hadoopbam.bam。enable-bai-splitter真實
  2. 安裝集群庫:

    • Maven:org.bdgenomics.adam: adam-apis-spark3_2.12: <版本>

    • PyPI:bdgenomics.adam