组装的准确度对于新物种基因组组装是至关重要的,一般有下面几种方法来检验组装的准确度:
(1) 构建 BAC 或 Fosmid 文库,并用 Sanger 法测序得到序列,将 BAC 序列与所拼接出来的 contigs 做比对来查看基因组组装的准确率。如,熊猫基因组拼接后,构建了 9 条 BACs,每条 BAC 都 map 到***的一条 scafflold 上,而 98%的 BAC 都和拼接好的 contigs 很好的比对上。
(2) 将已知的基因序列与拼接出来的 scaffolds 做比对,如果两者序列结果相吻合的话,说明基因组组装较好。而且已知的基因序列越多,评价结果越可靠。
(3) 估计组装后基因组的单碱基准确度,利用新一代测序技术,如果 95%以上的基因组单碱基覆盖度超过 20X,则认为该基因组的单碱基准确度较高。