未知序列是指非测序物种的序列,还是指除此之外,做Blast也没有结果呢?不知道能不能告知是什么物种呢?出现非预期的序列,污染的可能很大,污染包括样本污染和测序过程污染。建议你这边核查一下取样和送样过程中有没有污染,如果确认没有,问题可能是在公司那边,问一下是不是建库有问题(放心,没有确实的证据,公司那边肯定不会承认的)。也可能是测序过程有污染,二代测序仪都是好多个文库混在一起测,数据出来之后按adapter序列拆,如果这时有个人的序列和你是相同的adapter序列,那他的数据就是你的了......给楼主几个处理方案吧1.向公司问清楚有没有上述情况发生,如果有,谁出的问题谁解决,如果没有,下一步。2.1 穷方法:把数据map到参考基因组,再把map到的reads转成fastq文件。这种方法是逼到绝境的时候再用,因为可能有少量其它物种的reads也能map到,更致命的是,有部分序列是没有map到但确实是你需要的reads,这些reads有时是关键信息。2.2 有钱法:重新取样,小心送样,跟公司说你再给我测一次。如果你确认样品没有问题而且出现的相同的结果,那么按照这个数据分析吧,你可能发现了新大陆!如果结果明显和第一次测序结果不同,那么准备好撕逼吧。3. 麻烦告诉一下公司名字,我要记在小本本上。ps:拿未知的序列去做blast可能会对提供污染的证据有所帮助。修正一下,上面的内容感觉有一些偏激,具体怎么做得根据实验背景决定。