GenomeScope——jellyfish k

阅读: 评论:0

GenomeScope——jellyfish k

GenomeScope——jellyfish k

GenomeScope 2.0是一个可对多倍体基因组数据进行概括性分析的有效工具,其可以将jellyfish或KMC等k-mer分析软件的结果作为输入,并拟合混合模型,对基因组数据进行更深入的挖掘。

一、安装

GenomeScope 2.0的工作依赖于R,且需要安装其依赖包argparseminpack.lm。可以使用conda工具进行安装:

#安装依赖包
conda install -c conda-forge r-base r-minpack.lm r-argparse

安装完依赖包后需要将Github的相关文件克隆到工作目录下:
(有些时候会因为链接时间太久,导致克隆失败,可以尝试直接下载源代码)

#克隆工作环境
git clone .0.git

现在,便可以进入genomescope2.0目录,使用R脚本install.R安装GenomeScope 2.0了。

#进入工作目录
cd genomescope2.0
#运行R脚本安装GenomeScope2.0
Rscript install.R

二、使用

在使用之前需要认识以下几个重要的参数:

参数功能
-i输入文件名
-o输出目录名
-kk-mers的k值
-p基因组的倍性,默认为2

现在,便可以使用其主要脚本文件genomescope.R.histo进行进一步分析了:

#进一步分析S_oblata_WGS_single.histo
genomescope2.0/genomescope.R -i S_oblata_WGS_single.histo -o GS_WGS -k 25

当出现:

GenomeScope analyzing S_oblata_WGS_single.histo p=2 k=25 outdir=GS_WGS
aa:92.7% ab:7.34%
Model converged het:0.0734 kcov:31.8 err:0.0632 model fit:1.94 len:537907208

即说明分析已经完成,其结果保存在GS_WGS目录下。
但是,由于文章中并没有提供具体的步骤,所以我得到的结果具有较高的错误率,可能是未进行数据过滤导致的。

Ending!!!

相关文章:

Ranallo-Benavidez, T.R., Jaron, K.S. & Schatz, M.C. GenomeScope 2.0 and Smudgeplot for reference-free profiling of polyploid genomes. Nature Communications 11, 1432 (2020). .1038/s41467-020-14998-3
Ma, B., Wu, J., Shi, TL. et al. Lilac (Syringa oblata) genome provides insights into its evolution and molecular mechanism of petal color change. Commun Biol 5, 686 (2022). .1038/s42003-022-03646-9

本文发布于:2024-01-28 23:46:09,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170645677411169.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:GenomeScope   jellyfish
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23