What question did this study set out to answer?

L'objectif est d'identifier et de catégoriser les biais de données dans les ensembles de données génomiques et leurs effets sur l'apprentissage automatique.

April 10, 2026Open Access

Biais de données en génomique

Key Points

L'objectif est d'identifier et de catégoriser les biais de données dans les ensembles de données génomiques et leurs effets sur l'apprentissage automatique.
A passé en revue différentes catégories de biais de données en génomique
A examiné l'impact des biais sur la performance des modèles
A fourni des exemples de bases de données comme NCBI ClinVar et gnomAD
A identifié plusieurs types de biais de données présents dans les bases de données génomiques
A montré que les données défectueuses peuvent mener à une diminution de la précision des modèles
A démontré que les biais peuvent déformer la représentation dans les études génomiques

Abstract

L'apprentissage automatique (AA) devient une partie intégrante de la recherche génomique en raison des quantités de données génomiques en constante augmentation. Cependant, les algorithmes basés sur les données dépendent fortement de données de bonne qualité et représentatives, ce qui peut poser problème en génomique pour diverses raisons. L'une de ces raisons est les biais de données : des données défectueuses ou incomplètes contenant souvent des erreurs systématiques qui compromettent leur représentativité. Dans cette revue, nous examinons différentes catégories de biais de données en génomique et les traduisons dans le cadre de l'AA général. Nous donnons des exemples de différents types de biais présents dans des bases de données largement utilisées comme NCBI ClinVar et gnomAD et illustrons comment les biais de données peuvent influencer la performance des modèles dans diverses études.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Lusiné Nazaretyan

Martin Kircher

Journals

Trends in Genetics

Actions

Institutions

Charité - Universitätsmedizin Berlin

University of Lübeck

Berlin Institute of Health at Charité - Universitätsmedizin Berlin

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Biais de données en génomique

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study