tar -zxvf
示例数据文件的物种是 Oryza sativa(水稻),基因分型时可以在工具包中选择与水稻相关的数据集,例如 GSTP007 ~ GSTP009。
LinSNPGT 依赖环境&软件
配置&安装
git clone .gitcd LinSNPGT
chmod +x ./install.sh && ./install.sh# install java8
./install.Java8.sh# install bowtie2
sudo apt install bowtie2# install samtools
sudo apt install samtools# install seqtk if you want to use **SNPGT-build**
sudo apt-get install seqtk
LinSNPGT安装后有3个子文件夹和3个文件
SNPGT-build.py
SNPGT.py
要通过SNPGT.py
运行 LinSNPGT,用户需要填写
Software Path:该内容一般不需要更改。
Project_Name:输入您的项目名称,该名称将作为输出文件前缀。
RefDataSetFile:输入与要拟合的模型相对应的数据集。
Thread_Count:输入可用于运行程序的线程数
Samples_list:填写您的原始测序数据及其对应的样本名称。
| SAMPLE NAME | RAW READS NAME | RAW READS NAME|
< (示例)
#=================== Software Path =======================#
Java_Path=./jdk/bin/java
Bowtie2_Path=bowtie2
Samtools_Path=samtools#=================== LinSNPGT Config =======================#
* [Project]
Project_Name=Rice* [Species and Dataset]
RefDataSet_File=Rice_705_Inbred* [Running LinSNPGT Thread]
Thread_Count=10* [Samples_list]
> ===========================================
> |sample | Read1 | Read2 |
> -------------------------------------------| Line1 | test1_ | test1_ || Line2 | test2_ | test2_ |
(*.)
并将其移动到路径:./01.Reference_Genome/(*.)
或(*.fastq)
到路径:./02.Input_Fastqpython SNPGT.py
程序完成后会在Result/目录中输出结果文件
CHROM | POS | Line 1 | line 2 | … | line N |
---|---|---|---|---|---|
Chr1 | 128960 | A | . | … | C |
Chr1 | 133137 | C | C | … | T |
… | … | … | … | … | … |
Chr12 | 321216 | A | A | … | A |
Chr12 | 364257 | A | C | … | C |
Chr12 | 364755 | . | . | … | . |
… | … | … | … | … | … |
上传 *. 至 CropGS-Hub 以完成后续分析。
如果用户有我们提供的14个作物的数据集之外的基因分型需求,可以尝试使用 SNPGT-build
脚本制作自己的RefDataSetFile,然后使用SNPGT完成基因分型。
python SNPGT-build.py -h
usage: SNPGT-build.py [-h] [-F FASTA] [-B BIM] [-S SPECIES] [-N STRAIN] [-L BINLEN] [--JavaPath JAVAPATH] [--SamtoolsPath SAMTOOLSPATH] [--SeqtkPath SEQTKPATH][--Bowtie2Path BOWTIE2PATH]SNPGT-build (Tools for make RefGenome)optional arguments:-h, --help show this help message and exit-F FASTA, --fasta FASTAWhole genome reference sequence-B BIM, --bim BIM SNP site information(bim file)-S SPECIES, --species SPECIESSpecify species name; eg. Rice-N STRAIN, --strain STRAINSpecify strain name; eg. 378_Inbred-L BINLEN, --binlen BINLENThe simplified of the genome retains base length on both sides of the SNP. The default value is 400--JavaPath JAVAPATH Path to java8. The default is ./jdk/bin/java--SamtoolsPath SAMTOOLSPATHPath to samtools.--SeqtkPath SEQTKPATHPath to Seqtk.--Bowtie2Path BOWTIE2PATHPath to bowtie2-build.
运行示例
python SNPGT-build.py -F path_to/Rice.fa -B path_to/Rice_378_Inbred.bim -S Rice -N 378_Inbre`
- 邱杰 Jie Qiu (qiujie@shnu.edu)
- 朱旻 Min Zhu (zer0min@outlook)
- 陈嘉欣 Jiaxin Chen (jxchen1217@gmail)
本文发布于:2024-01-31 10:57:00,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170666982228009.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |