作者小头像 Lv.3
更多个人资料
210 成长值
0 关注
5 粉丝
+ 关注 私信

个人介绍

主要参与和创建基于Next-generation-sequencing 测序数据的生物学和基因组学数据分析和数据库的构建方法

感兴趣或擅长的领域

编程语言、自动化运维、数据库、大数据
个人勋章
TA还没获得勋章~
成长雷达
190
0
0
0
20

个人资料

个人介绍

主要参与和创建基于Next-generation-sequencing 测序数据的生物学和基因组学数据分析和数据库的构建方法

感兴趣或擅长的领域

编程语言、自动化运维、数据库、大数据

达成规则

以上满足项可达成此勋章

  • 博客
  • 关注
  • 粉丝
  • 论坛
全部时间
全部时间
最近三天
最近一周
最近一月
  • 全部
  • 暂无专栏分类
扩增子分析工具Qiime2安装与使用
Qiime2 的作者是Rob Knight和Greg Caporaso, 主要用于微生物16S rRNA的基因的扩增子分析,用于物种的分类和群落结构分析。以下主要介绍Qiime2 的安装以及分析过程安装1.sh Miniconda3-latest-Linux-x86_64.sh2.编辑 .bashrc, 查看其中是否有以下内容# added by Miniconda3 installere...
基因测序
作者小头像 benymorre 2019-09-30 16:13:53
13279
0
0
2019-09-30 16:13:53
999+
0
0
python的PyVCF模块过滤突变,并计算杂合度
VCF的全称是Variant Call Format, 一般是指用变异检测工具分析得到的突变的结果格式python中有一个模块可以过滤VCF - pyvcf。安装方法:pip install PyVCF==0.6.8VCF文件内容的一个示例如下:##fileformat=VCFv4.1##samtoolsVersion=0.1.19-44428cd##reference=file:///da...
应用与数据集成平台 ROMA Connect 机器学习 Python
作者小头像 benymorre 2019-08-21 20:03:31
15972
0
1
2019-08-21 20:03:31
999+
0
1
GO富集分析示例
GO是Gene Ontology的简称,是基因功能国际标准分类体系。它旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准。GO分为分子功能(Molecular Function)、生物过程(Biological Process)、和细胞组成(Cellular Component)三个部分。富集分析主要用于差异基因在GO term的富集程...
作者小头像 benymorre 2019-07-01 19:15:37
13746
1
1
2019-07-01 19:15:37
999+
1
1
golang 解析fastq格式
FASTQ格式是NGS测序的主流格式,有时候也有压缩后的fastq.gz格式之前的一篇博客讲到了如何安装GO和biogo这个包,主要用于处理SAM/BAM格式的数据,这一篇讲一下如何处理fastq。Fastq的每一条测序reads主要由四行构成,第一行是这条reads的ID,每一个reads都有一个唯一的ID,第二行是测序的碱基序列,第三行一般无意义,主要起到占位的作用,第四行是测序的每个碱...
医联体
作者小头像 benymorre 2019-06-08 19:31:09
11680
0
0
2019-06-08 19:31:09
999+
0
0
golang解析XML文件
在用golang解析xml文件的时候,发现有两点需要注意,一个是xml内容的总标题需要在定义struct的时候指定,另外每个标签的名字的首字母必须要大写。如下(第一个例子):package mainimport ( "encoding/xml" "fmt" "log")type Result struct { XMLName xml.Name ...
XML 解析
作者小头像 benymorre 2019-06-08 13:22:53
11063
0
0
2019-06-08 13:22:53
999+
0
0
NextFlow学习记录--序列比对和评估
在分析NGS数据(fastq格式)之前,需要有参考基因组,bed文件,输入数据这里构建一个流程,分为两步:将fastq比对为sam,并转成bam(需安装bwa或bowtie,还需安装samtools)对bam的某些区域进行测序深度评估,并绘图(需安装gnuplot)首先用人类hg19的 Exons的bed文件,随机选取某些基因的Exons,作为测试bed。如果用整个bed,运算时间较长。其次...
pipeline
作者小头像 benymorre 2019-06-05 20:09:38
13490
0
0
2019-06-05 20:09:38
999+
0
0
TCGA<三>--采用GDC API进行数据查询和获取
TCGA的数据可以通过API访问, 每个数据都有对应的多个属性,比如文件id(file_id), 病人编号(case_id以及barcode),case_id 和file_id 都是采用的UUID进行标记, barcode即submitter_id.在GDC的首页选中一些DNA甲基化数据,如下:可以看到数据包含了一个Cases, 两个Files,这里面选择的项目是TCGA-COAD,这是来自...
API
作者小头像 benymorre 2019-06-02 13:33:52
13664
0
1
2019-06-02 13:33:52
999+
0
1
TCGA肿瘤基因数据的访问<二>
TCGA(The Cancer Genome Atlas)项目完成后,最终和其它的一些肿瘤医学项目一起归档在 GDC Portal网站,方便人们访问。网址是 https://portal.gdc.cancer.gov其中除了TCGA的数据还有其它一些医学项目产生的基因测序数据,以及临床信息数据。网站首页如下:左侧可以点击Projects 根据项目类型,实验类型,基因突变类型搜索样本或数据信...
pipeline
作者小头像 benymorre 2019-06-01 15:39:46
6470
0
0
2019-06-01 15:39:46
999+
0
0
CNV简介和分析工具
CNV的全称是Copy number variation ,是指在不同的人的基因组上出现的大片段的拷贝数增加或缺失,一般是5kb 以上的片段。在人类的染色体上,各个基因是线性的形式排列在染色体上, 比如说正常的一个染色体包含了A-B-C-D-E-F 这几个基因,如果D基因发生了拷贝数增加。那么该染色体的形式就是A-B-C-D-D-E-F了,这种情况在肿瘤病人的基因组中比较常见。因为肿瘤细胞的...
应用与数据集成平台 ROMA Connect
作者小头像 benymorre 2019-05-27 18:59:59
18521
0
1
2019-05-27 18:59:59
999+
0
1
TCGA肿瘤样本基因信息库<一>
最近开始分析TCGA这个数据库中的一些SNV信息(single nucleotide variation).先整理出第一篇知识列表,如下:TCGA的全称和目的TCGA中的样本来源和编号TCGA中各样本的突变类型肿瘤的突变频率举例1. TCGA的全称和目的全称- The Cancer Genome Atlas, 译作癌症基因组图谱,是美国国立癌症研究所(NCI,National Cancer ...
应用与数据集成平台 ROMA Connect
作者小头像 benymorre 2019-05-23 18:25:48
11235
0
0
2019-05-23 18:25:48
999+
0
0
总条数:19
10
10
20
50
100
  • 1
  • 2

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
作者小头像
作者小头像
快速交付
+ 关注