鲲鹏云服务器移植RNACocktail

举报
姮柏芃 发表于 2020/06/15 19:27:09 2020/06/15
【摘要】 RNACocktail-pipeline由用于RNA-Seq分析不同步骤的高精度工具组成。它可以对短读技术和长读技术进行广谱的RNA-Seq分析,以从转录组数据中获得有意义的解析。 ​

RNACocktail-pipeline由用于RNA-Seq分析不同步骤的高精度工具组成。它可以对短读技术和长读技术进行广谱的RNA-Seq分析,以从转录组数据中获得有意义的解析。

开发语言:python

一句话描述:准确高效的RNA-Seq分析的综合框架

开源协议:Apache 2.0

建议的版本

根据实际需要选择版本,本文档以“RNACocktail release 0.3.1”为例进行说明。

环境要求

云服务器要求

本文以云服务器KC1实例测试,云服务器配置如表 云服务器配置所示。

表1 云服务器配置

项目

说明

规格

kc1.large.2 | 2vCPUs | 4GB

磁盘

系统盘:高IO(40GB)


操作系统要求

操作系统要求如表 操作系统要求所示。

表1 操作系统要求

项目

说明

下载地址

CentOS

7.6

在公共镜像中已提供。

Kernel

4.14.0-115

在公共镜像中已提供。


配置编译环境

  1. 安装相关依赖。

    yum install python2 python2-devel BEDTools zlib-devel bzip2-devel xz-devel -y

  2. 安装samtools,参考https://www.huaweicloud.com/kunpeng/software/samtools.html

  3. 安装hisat2,参考https://support.huaweicloud.com/prtg-kunpenghpcs/kunpenghpcs_prtg_0014.html

  4. 安装stringtie,参考https://www.huaweicloud.com/kunpeng/software/stringtie.html

  5. 安装相关python包。

    pip install pybedtools

获取源码

获取“RNACocktail release 0.3.1”源码包。

cd /usr/local/src

wget https://github.com/bioinform/rnacocktail/archive/v0.3.1.tar.gz

编译和安装

  1. 解压并进入源码目录。

    tar -zxvf v0.3.1.tar.gz

    cd rnacocktail-0.3.1

  2. 执行编译脚本。

    python setup.py install

运行和验证

  1. 编辑测试脚本

    测试脚本中直接使用下载的x86版的stringtie、hisat2和smatools进行测试,在鲲鹏服务器上无法使用,因此需要把脚本中的相应软件替换成我们自己安装的版本。

    cd test

    vim test_run.sh

    修改前

    echo "Download HISAT2 binaries"

    wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.0.5-Linux_x86_64.zip


    echo "Unzip HISAT2 binaries"

    unzip hisat2-2.0.5-Linux_x86_64.zip


    echo "Index genome with HISAT2"

    ./hisat2-2.0.5/hisat2-build Homo_sapiens.GRCh37.75.dna.chromosome.21.fa Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2


    echo "Test alignment step using HISAT2"

    run_rnacocktail.py align --align_idx Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --1 ../A1_1.fq.gz  --2 ../A1_2.fq.gz --hisat2 hisat2-2.0.5/hisat2 --hisat2_sps hisat2-2.0.5/hisat2_extract_splice_sites.py  --samtools samtools --sample A


    echo "Download StringTie binaries"

    wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.3.Linux_x86_64.tar.gz


    echo "Untar StringTie binaries"

    tar -xzvf stringtie-1.3.3.Linux_x86_64.tar.gz


    echo "Test reconstruction step using StringTie"

    run_rnacocktail.py reconstruct --alignment_bam work/hisat2/A/alignments.sorted.bam --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --stringtie stringtie-1.3.3.Linux_x86_64/stringtie --sample A


    修改后(加粗部分需要修改,其他部分不变。加“#”为屏蔽掉stringtie和hisat2的下载和安装,因为我们自己已经安装过了。其他加粗部分分别为hisat2、samtools和stringtie的安装路径)

    #echo "Download HISAT2 binaries"

    #wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.0.5-Linux_x86_64.zip


    #echo "Unzip HISAT2 binaries"

    #unzip hisat2-2.0.5-Linux_x86_64.zip


    echo "Index genome with HISAT2"

    /opt/hisat2-2.0.5/hisat2-build Homo_sapiens.GRCh37.75.dna.chromosome.21.fa Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2


    echo "Test alignment step using HISAT2"

    run_rnacocktail.py align --align_idx Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --1 ../A1_1.fq.gz  --2 ../A1_2.fq.gz --hisat2 /opt/hisat2-2.0.5/hisat2 --hisat2_sps /opt/hisat2-2.0.5/hisat2_extract_splice_sites.py  --samtools /usr/bin/samtools --sample A


    #echo "Download StringTie binaries"

    #wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.3.Linux_x86_64.tar.gz


    #echo "Untar StringTie binaries"

    #tar -xzvf stringtie-1.3.3.Linux_x86_64.tar.gz


    echo "Test reconstruction step using StringTie"

    run_rnacocktail.py reconstruct --alignment_bam /opt/hisat2-2.0.5/A/alignments.sorted.bam --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --stringtie /opt/stringtie/stringtie --sample A


  2. 执行测试脚本

    ./test_run.sh

    执行完毕后再最后一行会出现“All Done!”的回显信息,


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。