感谢李琪师兄在Perl语言上带我入门,感谢Jimmy师兄让我参与17年上半年生信编程实战课程视频的录制,让我的Perl语言编程技术更上一层楼。现在也慢慢开始学习一点Python语言,但是还是习惯用Perl单行命令处理文本数据。
本归档暂时还没有想好怎么分门别类,看看我学得有多杂了吧。不过看起来感情很丰富,写了好多心情日记。
我要写个生信软件!自救!毕业~
注意:这篇教程是作者写于两年前的,但这个领域已经发生了许多变化。如果你是做16s分析的,你可以考虑使用QIIME2 来替代QIIME1的教程了,并且使用exact sequence variants 来替代OTUs(哇,ISEM上面的文章哎,有空看看,继续)。我也强烈不建议使用Greengene数据库来做环境微生物的项目:因为这个数据库的核心结构从2013年就没有更新了,这些年许多新细菌门类被发现并且有一千多的细菌基因组被更新。相比起来,SILVA数据库就是一个更好的选择啦,但是它还是缺少大量在生态环境里的丰度还挺高的新细菌基因组(举个例子,土壤里的Rokubacteria,土壤和人类肠道里的Melainabacteria 都是极其丰富的,但SILVA数据库里却木有呢)目前,很难解释清楚为什么16S数据集并不能精准地反映我们样品的微生物丰度。
从大学毕业进入研究所学习,这是第三个年头了。突然想写点什么,前几天被延期半年的师姐在开会的时候哭鼻子,实验结果不理想发不了文章,拿不到学位证书,现在博士六年级了还在做实验。(哎,是不是听起来挺惨的T_T)放在以前我肯定会想我会不会也这么惨,现在呢,我的心态是极好的,不荒废时间,不辜负自己,技术学好管好自己以后有饭吃,不求人。下面写了点读博的琐碎:
宏基因组的基因定量问题已经困扰我很久啦,今天稍稍梳理了一下,但是还是不大懂,后续分析到底怎么整,什么情况下做基因定量进行差异分析有必要。如果是基因已知数据库的方法,就像MEGAN软件那样,用基因reads count的相对丰度进行物种、功能分析。用自己数据拼接构建的参考基因集,原理还是一样的,但是啊但是参考基因集的物种和功能注释率低。