【QIIME2】细菌16s数据库_Greengenes

embedded/2024/11/14 2:06:57/

文章目录

  • 下载Greengenes数据库
  • 在QIIME2中使用
    • 导入QIIME2中
    • 提取引用读取
    • 训练分类器
    • 测试分类器
    • 导出结果
    • 生成可视化文件

由于Bugbase功能注释时,输入的OTU表需经Greengenes注释(且由于时间原因须是第一版),故尝试使用Greengenes对16S进行注释

下载Greengenes数据库

下载地址:
https://ftp.microbio.me/greengenes_release/gg_13_8_otus/taxonomy/

在QIIME2中使用

导入QIIME2中

time qiime tools import \--type 'FeatureData[Sequence]' \--input-path 99_otus.fasta \--output-path 99_otus.qzatime qiime tools import \--type 'FeatureData[Taxonomy]' \--input-format HeaderlessTSVTaxonomyFormat \--input-path 99_otu_taxonomy.txt \--output-path ref-taxonomy.qza

共耗时3min

提取引用读取

研究表明,当朴素贝叶斯分类器仅在测序的目标序列区域进行训练时,16S rRNA基因序列的分类学分类准确性会提高
以779F/1193R为例

time qiime feature-classifier extract-reads \--i-sequences 99_otus.qza \--p-f-primer AACMGGATTAGATACCCKG \--p-r-primer ACGTCATCCCCACCTTCC \--p-trunc-len 350 \--o-reads ref-seqs.qza

共耗时4min

训练分类器

现在,我们可以使用刚刚创建的参考读取和分类法,按如下方式训练朴素贝叶斯分类器

time qiime feature-classifier fit-classifier-naive-bayes \--i-reference-reads ref-seqs.qza \--i-reference-taxonomy ref-taxonomy.qza \--o-classifier classifier.qza

共耗时4min

测试分类器

最后,我们通过对代表性序列进行分类并可视化生成的分类分配来验证分类器是否正常工作。

time qiime feature-classifier classify-sklearn \--i-classifier classifier.qza \--i-reads rep-seqs.qza \--o-classification taxonomy.qza
## 耗时30min
time qiime metadata tabulate \--m-input-file taxonomy.qza \--o-visualization taxonomy.qzv
## 耗时1min

在这里插入图片描述

导出结果

taxaonomy里的taxnomy.tsv是输入文件之一,为后续分析做准备

qiime tools export --input-path taxonomy.qza --output-path taxonomy

生成可视化文件

物种注释的结果

time qiime metadata tabulate \--m-input-file taxonomy.qza \--o-visualization taxonomy.qzv

柱状累积图

time qiime taxa barplot \--i-table table.qza \--i-taxonomy taxonomy.qza \--m-metadata-file sample.tsv \--o-visualization taxa-bar-plots.qzv

导出结果

qiime tools export --input-path  taxa-bar-plots.qzv --output-path  taxa-bar-plots

参考:
[1]官方文档:使用 q2-feature-classifier 训练特征分类器


http://www.ppmy.cn/embedded/88362.html

相关文章

C++自定义接口类设计器之函数解析二

关键代码 // 解析为函数 bool FunctionCreator::parse(const QString& lineFunc) {auto trimFunc lineFunc.trimmed();auto list trimFunc.split(" ");bool bHasReturn false;// 返回值和函数名解析for (const auto& key : list) {auto trimKey key.trim…

模型优化—动量梯度下降

一、mini-batch 梯度下降(gradient descent): SGD(stochastic GD)随机梯度下降:对一个样本做梯度下降 batch梯度下降:使用所有样本做梯度下降(做一次又叫epoch) mini…

谷粒商城实战笔记-75-商品服务-API-品牌管理-品牌分类关联与级联更新

文章目录 一,引入Mybatis Plus分页插件二,品牌列表的模糊查询三,增加品牌测试数据四,开发后台品牌关联分类接口1,接口product/categorybrandrelation/catelog/list2,接口product/categorybrandrelation/sav…

javascript(三)

五、事件 发生在 HTML 元素上的事情,当在 HTML 页面中使用 JavaScript 时, JavaScript 可以触发这些事件 1.常用事件 事件 描述 onchange HTML元素改变 onclick 点击 onmouseover 鼠标移入 onmouseout 鼠标移出 onkeydown 按下键盘 onload…

旗晟机器人环境检测AI智慧算法

在当今迅猛发展的工业4.0时代,智能制造和自动化运维已然成为工业发展至关重要的核心驱动力。工业场景上不仅要对人员行为、仪器仪表识别。环境监测也是不可缺少的一个环节。那么我们说说旗晟环境监测AI智慧算法吧 旗晟仪环境监测AI智慧算法是通过各类采集设备与AI服…

SpringBoot整合Flink CDC实时同步postgresql变更数据,基于WAL日志

SpringBoot整合Flink CDC实时同步postgresql变更数据,基于WAL日志 一、前言二、技术介绍(Flink CDC)1、Flink CDC2、Postgres CDC 三、准备工作四、代码示例五、总结 一、前言 在工作中经常会遇到要实时获取数据库(postgresql、m…

SaaS 服务:满足个性化需求

软件即服务(SaaS)模式在当今企业IT架构中扮演着越来越重要的角色。它不仅为企业提供了一种灵活、成本效益高的软件使用方式,还通过持续的服务更新和优化,帮助企业保持技术前沿。观测云,作为中国首款 SaaS 可观测服务平…

Mac电脑数据恢复软件 Disk Drill 企业版安装

Mac分享吧 文章目录 效果一、下载软件二、开始安装1、双击运行软件,将拖入文件夹中,等待安装完毕2、应用程序显示软件图标,运行软件,点击安装,软件页面打开表示安装成功 三、运行测试1、打开软件,恢复一个…