Key points are not available for this paper at this time.
Este artigo propõe uma nova quantidade para avaliar o número de grupos ou agrupamentos em um conjunto de dados. A ideia-chave é ver o agrupamento como um problema de classificação supervisionada, em que também devemos estimar os rótulos de classe "verdadeiros". A medida resultante de "força de predição" avalia quantos grupos podem ser previstos a partir dos dados e quão bem. No processo, desenvolvemos noções inovadoras de viés e variância para dados não rotulados. A força de predição se sai bem em estudos de simulação, e a aplicamos a agrupamentos de amostras de câncer de mama de um estudo de microarranjo de DNA. Finalmente, algumas propriedades de consistência do método são estabelecidas.
Tibshirani et al. (Quarta-feira,) estudaram esta questão.