应用介绍
- DeepVariant是由Google研究团队开发的一种基因变异检测工具,主要用于检测基因组测序数据中的小变异。这种变异可能是单个碱基的替换(如A → T)、短片段的插入或删除,这些都可能影响蛋白质的结构或基因的表达。这些变异的准确识别在罕见疾病的诊断、癌症研究以及遗传病的研究中具有至关重要的作用。
- DeepVariant最初是通过深度学习模型来模仿人类专家对基因变异的分析过程,结合了机器学习与生物信息学的技术,旨在自动化基因组变异的检测并提高准确率。其训练数据来自于国家标准与技术研究院(NIST)的六个细胞系,这些细胞系经过多种测序技术和手动审查,因此基因变异的信息是相对可信的。DeepVariant通过将基因组测序数据作为输入,输出可能的变异标签,类似于计算机视觉模型对图像分类的过程。
更多信息请参考: https://github.com/google/deepvariant
使用指南
平台提供了DeepVariant 的多个CPU和GPU版本,应用镜像位于公共集群的如下目录:
镜像名称和路径 | 版本 |
/opt/app/sif/deepvariant_1.8.0.sif | 1.8.0 |
/opt/app/sif/deepvariant_gpu_1.8.0.sif | 1.8.0 |
/opt/app/sif/deepvariant_1.6.0.sif | 1.6.0 |
/opt/app/sif/deepvariant_gpu_1.6.0.sif | 1.6.0 |
用户如果没有平台作业提交的经验,可以先查看 帮助中心 - 作业系统部分,了解作业提交的基本概念和操作方法。
提交CPU版本作业
准备作业脚本run.sh
,内容如下:
#!/bin/bash
#SBATCH --job-name=deepvariant-demo
#SBATCH --nodes=1
#SBATCH --ntasks-per-node=2
#SBATCH --output=%j.out
#SBATCH --error=%j.err
/opt/app/singularity/bin/singularity run /opt/app/sif/deepvariant_1.8.0.sif /opt/deepvariant/bin/make_examples
- /opt/deepvariant/bin/make_examples 可以换成自己的命令
使用sbatch run.sh
命令提交作业。
提交GPU版作业
准备作业脚本run_gpu.sh
,内容如下:
#!/bin/bash
#SBATCH --job-name=deepvariant-demo
#SBATCH --nodes=1
#SBATCH --ntasks-per-node=2
#SBATCH --output=%j.out
#SBATCH --error=%j.err
#SBATCH --gres=gpu:1
export PATH=/usr/local/cuda/bin:/usr/local/nvidia/bin:$PATH
export CUDA_PATH=/usr/local/cuda
export NVIDIA_PATH=/usr/local/nvidia
export LD_LIBRARY_PATH=/usr/local/nvidia/lib:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
/opt/app/singularity/bin/singularity run --nv -B /usr/local/nvidia:/usr/local/nvidia /opt/app/sif/deepvariant_gpu_1.8.0.sif /opt/deepvariant/bin/make_examples
- /opt/deepvariant/bin/make_examples 可以换成自己的命令
使用sbatch run_gpu.sh
命令提交作业。