鲲鹏云服务器移植RNACocktail
RNACocktail-pipeline由用于RNA-Seq分析不同步骤的高精度工具组成。它可以对短读技术和长读技术进行广谱的RNA-Seq分析,以从转录组数据中获得有意义的解析。
开发语言:python
一句话描述:准确高效的RNA-Seq分析的综合框架
开源协议:Apache 2.0
建议的版本
根据实际需要选择版本,本文档以“RNACocktail release 0.3.1”为例进行说明。
环境要求
云服务器要求
本文以云服务器KC1实例测试,云服务器配置如表 云服务器配置所示。
| 项目 | 说明 | 
| 规格 | kc1.large.2 | 2vCPUs | 4GB | 
| 磁盘 | 系统盘:高IO(40GB) | 
操作系统要求
操作系统要求如表 操作系统要求所示。
| 项目 | 说明 | 下载地址 | 
| CentOS | 7.6 | 在公共镜像中已提供。 | 
| Kernel | 4.14.0-115 | 在公共镜像中已提供。 | 
配置编译环境
- 安装相关依赖。 - yum install python2 python2-devel BEDTools zlib-devel bzip2-devel xz-devel -y 
- 安装samtools,参考https://www.huaweicloud.com/kunpeng/software/samtools.html 
- 安装hisat2,参考https://support.huaweicloud.com/prtg-kunpenghpcs/kunpenghpcs_prtg_0014.html 
- 安装stringtie,参考https://www.huaweicloud.com/kunpeng/software/stringtie.html 
- 安装相关python包。 - pip install pybedtools 
获取源码
获取“RNACocktail release 0.3.1”源码包。
cd /usr/local/src
wget https://github.com/bioinform/rnacocktail/archive/v0.3.1.tar.gz
编译和安装
- 解压并进入源码目录。 - tar -zxvf v0.3.1.tar.gz - cd rnacocktail-0.3.1 
- 执行编译脚本。 - python setup.py install 
运行和验证
- 编辑测试脚本 - 测试脚本中直接使用下载的x86版的stringtie、hisat2和smatools进行测试,在鲲鹏服务器上无法使用,因此需要把脚本中的相应软件替换成我们自己安装的版本。 - cd test - vim test_run.sh - 修改前 - echo "Download HISAT2 binaries" - wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.0.5-Linux_x86_64.zip - echo "Unzip HISAT2 binaries" - unzip hisat2-2.0.5-Linux_x86_64.zip - echo "Index genome with HISAT2" - ./hisat2-2.0.5/hisat2-build Homo_sapiens.GRCh37.75.dna.chromosome.21.fa Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 - echo "Test alignment step using HISAT2" - run_rnacocktail.py align --align_idx Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --1 ../A1_1.fq.gz --2 ../A1_2.fq.gz --hisat2 hisat2-2.0.5/hisat2 --hisat2_sps hisat2-2.0.5/hisat2_extract_splice_sites.py --samtools samtools --sample A - echo "Download StringTie binaries" - wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.3.Linux_x86_64.tar.gz - echo "Untar StringTie binaries" - tar -xzvf stringtie-1.3.3.Linux_x86_64.tar.gz - echo "Test reconstruction step using StringTie" - run_rnacocktail.py reconstruct --alignment_bam work/hisat2/A/alignments.sorted.bam --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --stringtie stringtie-1.3.3.Linux_x86_64/stringtie --sample A - 修改后(加粗部分需要修改,其他部分不变。加“#”为屏蔽掉stringtie和hisat2的下载和安装,因为我们自己已经安装过了。其他加粗部分分别为hisat2、samtools和stringtie的安装路径) - #echo "Download HISAT2 binaries" - #wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.0.5-Linux_x86_64.zip - #echo "Unzip HISAT2 binaries" - #unzip hisat2-2.0.5-Linux_x86_64.zip - echo "Index genome with HISAT2" - /opt/hisat2-2.0.5/hisat2-build Homo_sapiens.GRCh37.75.dna.chromosome.21.fa Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 - echo "Test alignment step using HISAT2" - run_rnacocktail.py align --align_idx Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --1 ../A1_1.fq.gz --2 ../A1_2.fq.gz --hisat2 /opt/hisat2-2.0.5/hisat2 --hisat2_sps /opt/hisat2-2.0.5/hisat2_extract_splice_sites.py --samtools /usr/bin/samtools --sample A - #echo "Download StringTie binaries" - #wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.3.Linux_x86_64.tar.gz - #echo "Untar StringTie binaries" - #tar -xzvf stringtie-1.3.3.Linux_x86_64.tar.gz - echo "Test reconstruction step using StringTie" - run_rnacocktail.py reconstruct --alignment_bam /opt/hisat2-2.0.5/A/alignments.sorted.bam --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --stringtie /opt/stringtie/stringtie --sample A 
- 执行测试脚本 - ./test_run.sh - 执行完毕后再最后一行会出现“All Done!”的回显信息, 
- 点赞
- 收藏
- 关注作者
 
             
           
评论(0)