La métabolomique par spectrométrie de masse (MS) est une approche majeure pour la découverte de biomarqueurs. En particulier, l'acquisition de spectres de fragmentation (MS2) permet de caractériser la structure des métabolites. Les approches récentes d'acquisition indépendante des données (DIA) de type SWATH (Sequential Window Acquisition of all THeoretical fragment ions) offrent la possibilité de fragmenter tous les ions détectés. Toutefois, les spectres SWATH DIA obtenus sont des mélanges de tous les fragments provenant des composés co-isolés. Pour traiter les données SWATH DIA de manière rigoureuse et efficace, nous avons développé une nouvelle approche reposant sur la factorisation matricielle non négative (NMF) parcimonieuse, baptisée DIANMF. Il s'agit de la première méthode de séparation de sources en aveugle qui traite simultanément les données MS1 et MS2 dans un cadre unifié, sans s'appuyer sur des modèles de pics prédéfinis ou des bibliothèques spectrales. Nous avons implémenté un algorithme NMF dérivé de l'analyse morphologique généralisée non négative avec seuillage doux (nGMCAˢ), qui exploite la non-négativité et la parcimonie (dans un domaine de transformation connu prédéfini) ainsi que la diversité morphologique pour améliorer la séparation dans les données linéaires fortement mélangées. Nous avons montré par simulation qu'un rang élevé peut être choisi a priori de manière à pouvoir extraire simultanément les spectres de tous les composés présents dans la fenêtre temporelle à chaque itération, et nous avons développé des critères pour sélectionner uniquement les composantes correspondant à du signal et d'attribuer chacune aux ions précurseurs d'une même molécule. L'ensemble de la méthodologie est implémentée sous la forme de la librairie logicielle publiquement disponible DIANMF (https://github.com/odisce/DIANMF). L'application du logiciel à plusieurs jeux de données réels représentatifs des principaux instruments de détection a montré que DIANMF obtient de meilleures performances que les outils existants en termes de taux d'identification des composés et de qualité spectrale, notamment pour les métabolites à faible abondance et co-élués. En particulier, notre approche permet pour la première fois de regrouper toutes les espèces ioniques associées à un même composé (adduits, isotopes et pertes neutres) dans un spectre chimiquement cohérent. L'ensemble de ces résultats montrent l'intérêt de DIANMF pour le traitement des données SWATH DIA et l'identification des composés en métabolomique.
Diana Karaki (Thu,) studied this question.