前面的swarm聚类文章中讲到过,“ seed ” 是 de novo 思想的算法在聚类时,选择的第一个作为质心或起点的高丰度扩增子,它通常作为 cluster 的代表序列参与物种注释等其它分析。
从计算机角度来看:算法的开始,创建一个初始为空的数据库,并在处理输入序列扩展数据库。对于每一个 cluster , 数据库只精确地包含一个代表性序列。
在UCLUST中,“ seed 序列 ” 这个术语不再使用,为了避免与 BLAST 和 UBLAST 等算法中的对齐种子(即:查询序列与参考序列比对上的匹配词)混淆。作为替代,称质心为“ 代表序列 ”。
在这里用UBLAST举例来说:
UBLAST是 Edgar 开发的 USEARCH 包中的一个工具。
UBLAST最常用于蛋白质或翻译搜索,低相似度的序列比对就可以提供信息。UBLAST也支持核苷酸搜索,但USEARCH通常更合适,因为核苷酸同源性只有在序列之间具有高相似度时才能检测到。
本文发布于:2024-01-30 17:31:39,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170660710121674.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |