先说说在做这个之前基本踩完了坑beagle5.1版本所有的坑。。。。。。
大写的难受啊,接下来说正事。
所需材料:就是两对plink的ped、map文件。一个需要imputation一个需要phasing
plink --file big --exclude removw --recode tab --out small
plink --bfile CL4 --recode vcf-iid --out CL4 --sheep
要--sheep是因为默认为人,至于羊要么加--sheep
如果涉及线粒体染色体以及xy基因则要 --chr-set 29
小菜鸡是不会知道绵羊26对体染色体的
这里用了linux软件bgzip
-f:表示压缩
-d:表示解压缩
bgzip -f vi.vcf
bgzip -d
#第二种方法
gunzip
这部分借鉴了大佬的文章
/2020/06/15/%E5%85%A8%E5%9F%BA%E5%9B%A0%E7%BB%84%E5%88%86%E6%9E%90_%E5%9F%BA%E5%9B%A0%E5%9E%8B%E5%AE%9A%E7%9B%B8%E5%92%8C%E5%A1%AB%E5%85%85(Phasing%20and%20Imputation)/#%E5%9F%BA%E7%A1%80%E6%A6%82%E5%BF%B5
强烈建议拜读。因为大佬讲的特别透彻。我只是用于学习做个小笔记,大佬不一样。大佬是真的码字在讲原理啊!!!
### 下载beagle5.1
wget .18May20.d20.jar
wget .18May20.d20.jar### 利用两个测试数据第一个cl为gt第二个为qb188.### 运行beagle软件进行imputation
java -Xmx14256m -jar beagle.18May20.d20.jar gt= out### 提供phasing数据集ref panels
java -jar beagle.18May20.d20.jar ref= gt= outf### 对参考数据集ref构建bref3
java -jar bref3.18May20.d20.jar > QB188.bref3
java -jar beagle.18May20.d20.jar ref=QB188.bref3 gt= out=QB188+CL4.bref3S
####一定要注意java版本### 参考其它文章命令行
nohup java -Xss5m -Xmn25G -Xms100G -Xmx100G -jar soft/beagle/beagle.12Jul19.0df.jar nthreads=2 gtde.vcf out=172sample_out ne=172
#可能会遇到内存溢出的报错,较花时间。
本文发布于:2024-01-30 21:28:22,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170662130322965.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |