Key points are not available for this paper at this time.
Nous passons en revue les méthodes d'estimation de la précision et comparons les deux méthodes les plus courantes : la validation croisée et le bootstrap. Des résultats expérimentaux récents sur des données artificielles et des résultats théoriques dans des contextes restreints ont montré que, pour sélectionner un bon classifieur parmi un ensemble de classifieurs (sélection de modèle), la validation croisée à dix plis peut être meilleure que la validation croisée leave-one-out, plus coûteuse. Nous rapportons une expérience à grande échelle — plus d'un demi-million d'exécutions de C4.5 et d'un algorithme Naive-Bayes — pour estimer les effets de différents paramètres sur ces algorithmes sur des ensembles de données réels. Pour la validation croisée, nous faisons varier le nombre de plis et si les plis sont stratifiés ou non ; pour le bootstrap, nous faisons varier le nombre d'échantillons bootstrap. Nos résultats indiquent que pour des ensembles de données réels similaires aux nôtres, la meilleure méthode à utiliser pour la sélection de modèle est la validation croisée stratifiée à dix plis, même si la puissance de calcul permet d'utiliser plus de plis.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ron Kohavi
Stanford University
Building similarity graph...
Analyzing shared references across papers
Loading...
Ron Kohavi (Sun,) a étudié cette question.
www.synapsesocial.com/papers/6a085b77280cd4e998e8b87a — DOI: https://doi.org/10.5281/zenodo.19712698
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: