Pre-filtering sur base de données - dada2
Avec certaines expériences (biopsie), le nombre de cellules hôtes présentes dans l'échantillon est important et la contamination en ADN hôte peut représenter une proportion non négligeable des séquences totales. Deblur implémente par défaut un filtre positif sur la base de données greengenes à 88% pour exclure ces séquences. Ce n'est pas le cas avec dada2. Bien que nous puissions filtrer ces ASV a posteriori suite à l'assignation taxonomique, il serait plus approprié de filtrer a priori les fichiers de séquence pour ne pas perturber la phase de denoising.
sortmerrna est un outil qui semble fournir ce service.