Estudos de pesquisa clínica aplicam rotineiramente critérios de exclusão e etapas de pré-processamento de dados que podem alterar substancialmente a composição do conjunto de dados, potencialmente introduzindo vieses ocultos que afetam a validade e a generalizabilidade. Isso é particularmente importante em estudos de inteligência artificial/aprendizado de máquina (IA/ML) onde os modelos aprendem padrões diretamente dos dados de treinamento. Desenvolvemos o Equiflow, um pacote Python de código aberto que automatiza a criação de diagramas de fluxo de participantes aprimorados, rastreando tanto o tamanho da amostra quanto as mudanças na composição ao longo dos estudos. O Equiflow quantifica deslocamentos de distribuição em cada etapa de exclusão e gera visualizações mostrando como variáveis clínicas e demográficas chave evoluem durante a seleção de participantes. Em um estudo de caso com pacientes com sepse da base de dados eICU, as exclusões sequenciais reduziram a amostra de 126.750 para 1.094 pacientes. Exigir medições de troponina não faltantes na etapa final de processamento de dados causou mudanças demográficas substanciais que normalmente permaneceriam invisíveis em relatórios tradicionais. Ao tornar os vieses composicionais visíveis durante a construção da coorte antes que a modelagem comece, o Equiflow permite que os pesquisadores tomem decisões informadas sobre análises e reconheçam limitações na generalizabilidade para seus leitores. Essa abordagem padronizada e de código aberto promove transparência na pesquisa clínica e apoia o desenvolvimento de sistemas de IA clínica mais equitativos, abordando uma necessidade crítica à medida que os cuidados de saúde dependem cada vez mais da tomada de decisões orientadas por dados.
Ellen et al. (Quarta-feira,) estudaram essa questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: