鲲鹏云服务器移植RNACocktail
【摘要】 RNACocktail-pipeline由用于RNA-Seq分析不同步骤的高精度工具组成。它可以对短读技术和长读技术进行广谱的RNA-Seq分析,以从转录组数据中获得有意义的解析。
RNACocktail-pipeline由用于RNA-Seq分析不同步骤的高精度工具组成。它可以对短读技术和长读技术进行广谱的RNA-Seq分析,以从转录组数据中获得有意义的解析。
开发语言:python
一句话描述:准确高效的RNA-Seq分析的综合框架
开源协议:Apache 2.0
建议的版本
根据实际需要选择版本,本文档以“RNACocktail release 0.3.1”为例进行说明。
环境要求
云服务器要求
本文以云服务器KC1实例测试,云服务器配置如表 云服务器配置所示。
项目 |
说明 |
规格 |
kc1.large.2 | 2vCPUs | 4GB |
磁盘 |
系统盘:高IO(40GB) |
操作系统要求
操作系统要求如表 操作系统要求所示。
项目 |
说明 |
下载地址 |
CentOS |
7.6 |
在公共镜像中已提供。 |
Kernel |
4.14.0-115 |
在公共镜像中已提供。 |
配置编译环境
安装相关依赖。
yum install python2 python2-devel BEDTools zlib-devel bzip2-devel xz-devel -y
安装samtools,参考https://www.huaweicloud.com/kunpeng/software/samtools.html
安装hisat2,参考https://support.huaweicloud.com/prtg-kunpenghpcs/kunpenghpcs_prtg_0014.html
安装stringtie,参考https://www.huaweicloud.com/kunpeng/software/stringtie.html
安装相关python包。
pip install pybedtools
获取源码
获取“RNACocktail release 0.3.1”源码包。
cd /usr/local/src
wget https://github.com/bioinform/rnacocktail/archive/v0.3.1.tar.gz
编译和安装
解压并进入源码目录。
tar -zxvf v0.3.1.tar.gz
cd rnacocktail-0.3.1
执行编译脚本。
python setup.py install
运行和验证
编辑测试脚本
测试脚本中直接使用下载的x86版的stringtie、hisat2和smatools进行测试,在鲲鹏服务器上无法使用,因此需要把脚本中的相应软件替换成我们自己安装的版本。
cd test
vim test_run.sh
修改前
echo "Download HISAT2 binaries"wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.0.5-Linux_x86_64.zip echo "Unzip HISAT2 binaries"unzip hisat2-2.0.5-Linux_x86_64.zip echo "Index genome with HISAT2"./hisat2-2.0.5/hisat2-build Homo_sapiens.GRCh37.75.dna.chromosome.21.fa Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 echo "Test alignment step using HISAT2"run_rnacocktail.py align --align_idx Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --1 ../A1_1.fq.gz --2 ../A1_2.fq.gz --hisat2 hisat2-2.0.5/hisat2 --hisat2_sps hisat2-2.0.5/hisat2_extract_splice_sites.py --samtools samtools --sample A echo "Download StringTie binaries"wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.3.Linux_x86_64.tar.gz echo "Untar StringTie binaries"tar -xzvf stringtie-1.3.3.Linux_x86_64.tar.gz echo "Test reconstruction step using StringTie"run_rnacocktail.py reconstruct --alignment_bam work/hisat2/A/alignments.sorted.bam --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --stringtie stringtie-1.3.3.Linux_x86_64/stringtie --sample A
修改后(加粗部分需要修改,其他部分不变。加“#”为屏蔽掉stringtie和hisat2的下载和安装,因为我们自己已经安装过了。其他加粗部分分别为hisat2、samtools和stringtie的安装路径)
#echo "Download HISAT2 binaries"#wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.0.5-Linux_x86_64.zip #echo "Unzip HISAT2 binaries"#unzip hisat2-2.0.5-Linux_x86_64.zip echo "Index genome with HISAT2"/opt/hisat2-2.0.5/hisat2-build Homo_sapiens.GRCh37.75.dna.chromosome.21.fa Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 echo "Test alignment step using HISAT2"run_rnacocktail.py align --align_idx Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --1 ../A1_1.fq.gz --2 ../A1_2.fq.gz --hisat2 /opt/hisat2-2.0.5/hisat2 --hisat2_sps /opt/hisat2-2.0.5/hisat2_extract_splice_sites.py --samtools /usr/bin/samtools --sample A #echo "Download StringTie binaries"#wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.3.Linux_x86_64.tar.gz #echo "Untar StringTie binaries"#tar -xzvf stringtie-1.3.3.Linux_x86_64.tar.gz echo "Test reconstruction step using StringTie"run_rnacocktail.py reconstruct --alignment_bam /opt/hisat2-2.0.5/A/alignments.sorted.bam --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --stringtie /opt/stringtie/stringtie --sample A
执行测试脚本
./test_run.sh
执行完毕后再最后一行会出现“All Done!”的回显信息,
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)