通过一个博客然后点点点,发现好多有用的东西,简直就好像发现新大陆,才知道大家原来都是这样分析、做研究的。虽然对我的工作没特别大的帮助,也不算不务正业吧。多看看,多学学总是没错的。
有一个湖泊宏基因组项目耽搁了两个月,这周又重新开始处理了。我再一次重新去看拼接结果时,有个样品的contigs全长总和只有4M(个人感觉是不太好的结果)。又重新结合其他文献和教程对这个样品数据进行处理一下,但是结果还是不是特别好。在这个过程中,我思考了许多问题,罗列如下:
昨天检索资料从推特上看别人分享的教程,看了看还挺全面的,跟我平时所使用的软件工具有些不同,准备认真学习一下。
第一次使用conada是九月份,那是看了一个公众号的推荐帖子,那时我尝试安装了miniconda,使用和安装软件都非常简单,那会安装的使miniconda,里面的软件相对少些,试用的时候觉得下载速度不行,就没一直用了。今天在学习的过程中用anaconda安装了几个软件,感觉还可以。
对于生物专业的人来说,学习生物信息,第一个门槛应该就是Linux,而Linux中最容易出错的就是软件安装了。尤其是不能联网、没有root权限的苦逼状态下。conda像windows下的软件管家、Mac下的APP Store一样,一键安装生信软件。
对微生物宏基因组做物种分类或者基因功能注释中会采用基于比对的方法,将未知的序列比对到已知的参考库(nt/nr库)中。为什么想要从nt/nr库中分离细菌和古细菌呢,因为解压缩后的nt/nr库实在是太大了,里面包含了所有生物的已知基因。如果研究的对象仅仅使细菌或者使古细菌,那么将这些未知物种的基因组拿到庞大的参考库中比对,是非常耗费时间的。(NCBI上有病毒单独的参考基因库,师兄说以前细菌也是单独有的。)
好吧,其实我的endnote里收集了将近500篇的文献,我还没看呢,今天又收集了一大堆,准备下个月慢慢看。看文献就像吃饭一样,只能靠自己,别人帮不了的~~我的文献关键词大概是:环境生态、宏基因组、海洋微生物、病毒…..