昨天晚上师兄发给我这么一篇文章《Shiny和Plotly实现可交互DNA甲基化分析包ChAMP》,让看着学习如何用Shiny和Plotly开发一个R包。看完以后我觉得这个作者写得实在太好了,就好像是Jimmy师兄写得一样。我就去翻该作者后面的博文,发现有个R极简教程写得也是非常好,不知不觉就看到了凌晨一点钟。今天接着学,并且做了点笔记。
第一次写教案,第一次正儿八经备课,虽然没有真正上台去讲。但备课的两三个星期以及在两天培训时间里,我收获很多。特别是吃了两天华农的饭,又便宜又好吃。
今天我又学习了一天的KEGG,几乎把KEGG的网页的每个链接点了一遍,还有几个功能没有点呢。各位小伙伴,学习数据库呢还是要耐下心来把上面的功能都试一遍,多熟悉熟悉就知道怎么用了。今天主要分享我觉得比较有点技术含量的知识点,虽然我还不知道KEGG数据下来怎么用,基因批量注释到代谢通路并获得彩色的通路图有啥用~原帖比较坑,竟然代码有错误,还好我会改~
KEGG 数据库于 1995 年由 Kanehisa Laboratories 推出 0.1 版,目前发展为一个综合性数据库,其中最核心的为 KEGG PATHWAY 和 KEGG ORTHOLOGY 数据库。在 KEGG ORTHOLOGY 数据库中,将行使相同功能的基因聚在一起,称为 Ortholog Groups (KO entries),每个 KO 包含多个基因信息,并在一至多个 pathway 中发挥作用。而在 KEGG PATHWAY 数据库中,将生物代谢通路划分为 6 类,分别为:细胞过程(Cellular Processes)、环境信息处理(Environmental Information Processing)、遗传信息处理(Genetic Information Processing)、人类疾病(Human Diseases)、新陈代谢(Metabolism)、生物体系统(Organismal Systems),其中每类又被系统分类为二、三、四层。第二层目前包括有 43 种子 pathway;第三层即为其代谢通路图;第四层为每个代谢通路图的具体注释信息。
有一种错觉感觉学习生信就是在不断地安装、调试参数,每次碰到一个新软件,多么希望安装顺利些。CheckM 可以用来单菌基因组组装或者Metagenome Binning(重构)的基因组的完整度、杂合度质量评估信息等,以及根据Marker基因鉴定基因组的系统分类。CheckM已被用于meta_seq数据分析流程,用于评估重构的完整度检测。 更多详细的功能描述见:Github Wiki页面。
《Assembling the microbial dark matter》是比勒费尔德大学一位博士的毕业论文,该博士论文主要利用单细胞测序技术、宏基因组和宏转录组学技术来研究biogas反应器中的微生物群体,结合多种组学技术来对不能培养的微生物进行基因组拼接及代谢通路分析。