L'apprentissage automatique (AA) devient une partie intégrante de la recherche génomique en raison des quantités de données génomiques en constante augmentation. Cependant, les algorithmes basés sur les données dépendent fortement de données de bonne qualité et représentatives, ce qui peut poser problème en génomique pour diverses raisons. L'une de ces raisons est les biais de données : des données défectueuses ou incomplètes contenant souvent des erreurs systématiques qui compromettent leur représentativité. Dans cette revue, nous examinons différentes catégories de biais de données en génomique et les traduisons dans le cadre de l'AA général. Nous donnons des exemples de différents types de biais présents dans des bases de données largement utilisées comme NCBI ClinVar et gnomAD et illustrons comment les biais de données peuvent influencer la performance des modèles dans diverses études.
Building similarity graph...
Analyzing shared references across papers
Loading...
Lusiné Nazaretyan
Martin Kircher
Trends in Genetics
Charité - Universitätsmedizin Berlin
University of Lübeck
Berlin Institute of Health at Charité - Universitätsmedizin Berlin
Building similarity graph...
Analyzing shared references across papers
Loading...
Nazaretyan et al. (Mer,) ont étudié cette question.
www.synapsesocial.com/papers/69d892d16c1944d70ce04136 — DOI: https://doi.org/10.1016/j.tig.2026.02.007