Soil_Zoology_2021

Материалы мастер класса по анализу данных метабаркодинга (VII полевая школа по почвенной зоологии и экологии)

This project is maintained by vmikk

Анализ данных с использованием DADA2 и dadaist2

DADA2 (Callahan et al., 2016) - программа для извлечения точных вариантов последовательностей ампликонов (ASVs, Amplicon Sequence Variants). ASV представляют собой аналоги OTU, но имеют более высое разрешение (разрешающая способность может составлять даже до 1-2 нуклеотидов). Также к достоинствам ASV можно отнести их сопоставимость между разными исследованиями без необходимости повторной обработки объединенных данных.

Программа dadaist2 (Ansorge et al., 2021) представляет из себя оболочку для DADA2 и позволяет легко автоматизировать весь анализ (от обработки прочтений до статистического анализа и построения графиков).

Для начала необходимо сформировать таблицу с соответствием образцов файлам с парно-концевыми прочтениями:

cd ~
dadaist2-metadata -i data/ > metadata.tsv
cat metadata.tsv

Далее команда dadaist2 запускает пайплан DADA2, в который входит:

dadaist2 \
  -i data/ \
  -m metadata.tsv \
  -d db/COIv4_DB.fa.gz \
  --primers "GGWACWGGWTGAACWGTWTAYCCYCC":"TANACYTCNGGRTGNCCRAARAAYCA" \
  -t 4 \
  -l DADA2_results/DADA2_log.txt \
  -o DADA2_results

Основные результаты:

MultiQC-отчёт

В интерактивном виде также можно посмотреть отчёт о количестве ридов после фильтрации, обесшумливания, сборки парно-концевых ридов и удаления химер, а также о соотношении обилий доминирующих последовательностей с учётом их таксономического положения.

## Подготовка данных для отчёта
dadaist2-mqc-report \
  -i DADA2_results/ \
  -t 10 \
  -o DADA2_results/mqc

## Формирование MultiQC-отчёта
multiqc -c DADA2_results/mqc/config.yaml DADA2_results/qc/

## Открываем отчет в браузере (например, в Firefox)
firefox multiqc_report.html 

Rhea

В подпапке Rhea находятся результаты

MicrobiomeAnalyst

MicrobiomeAnalyst (Chong et al., 2020) - веб-сервер, на котором представлен модуль для анализа данных метабаркодинга (MDP, Marker Data Profiling). Его возможности простираются от нормализации данных до статистического сравнения и классификации групп образцов.

Программа dadaist2 уже заботливо помогла сформировать данные в удобном для MicrobiomeAnalyst формате и нам остаётся только загрузить их по этой ссылке:
https://www.microbiomeanalyst.ca/MicrobiomeAnalyst/upload/OtuUploadView.xhtml

В поле OTU/ASV table необходимо загрузить файл table.csv.
В поле Metadata file - файл metadata.csv.
В поле Taxonomy table - файл taxonomy.csv.
В поле Phylogenetic tree - файлrep-seqs.tree.
В графе Taxonomy labels выбрать “QIIME”.

Результаты

Результаты пайплайна доступны здесь

Ссылки


Примеры анализа данных с использованием: