紧接着上个星期学习初步认识了宏基因组学的基本概念、了解的宏基因组数据分析方面的软件。我继续深入学习,这里是学习TGAC宏基因组教程的学习笔记。TGAC Metagenomics 2015教程
内容
组学项目研究成本
随着测序技术的发展,测序成本会逐渐下降,在未来下游的生物信息数据分析将成为整个组学实验项目中的最高成本因素,也是最为重要的一个因素。
宏基因组研究基本流程
Morgan XC, Huttenhower C (2012) PLoS Comput Biol 8(12): e1002808.
宏基因组数据处理典型流程
三个基本数据处理问题
- 有什么?
- 干什么?
- 有啥不一样?
MEGAN-MEtaGenome ANalyzer
MEGAN不仅可以处理宏基因组数据还可以处理宏转录组、宏蛋白质组以及扩增子测序产生的数据。序列比较是整个一个计算瓶颈。
比较宏基因组学
- 1 想要了解微生物群体结构随着时间和地理环境的变化,以及通过比较不同个体、不同时间点、不同药物作用时微生物的变化与疾病的相关性,因此比较基因组学是一个很好的研究工具。
- 2 宏基因组并不是呈现树状进化的。
- 3 相关性分析
比对到NCBI-NR蛋白参考库,更快更好的软件
已经有的工具:BLASTX、RAPSearch2,2015年nature methods上发布了一款新的比对软件DIAMOND,据说更快更灵敏。一般宏基因组拼接完后进行blast,造成数据减少;现在可以通过DIAMOND比对后再进行拼接。并且还可以进行核心基因的拼接:将每个基因拼接到一起,然后使用DIAMOND比对到蛋白序列,最后将比对到的基因拼接到一起。
写在最后
生物信息的学习重在实战,我在专业领域基础知识的同时也开始了数据模仿处理的项目实战(奶酪宏基因组),并且已经拼接完成。在此感谢提供学习资料的生信菜鸟团群主健明师兄以及李琪师兄和杨耀华师兄的指点。