What question did this study set out to answer?

O objetivo é desenvolver uma ferramenta que revele vieses ocultos na composição da coorte durante a pesquisa clínica.

April 10, 2026Open Access

Equiflow: Um pacote de software de código aberto para avaliação de mudanças na composição da coorte

Key Points

O objetivo é desenvolver uma ferramenta que revele vieses ocultos na composição da coorte durante a pesquisa clínica.
Criado um pacote Python de código aberto chamado Equiflow.
Visualização automatizada das mudanças no tamanho da amostra e nas variáveis demográficas.
Realizado um estudo de caso usando pacientes com sepse da base de dados eICU.
Exclusões sequenciais reduziram o tamanho da amostra de 126.750 para 1.094 pacientes.
A etapa final de processamento de dados mostrou mudanças demográficas significativas.
O Equiflow destaca vieses que podem ser negligenciados em relatórios tradicionais.

Abstract

Estudos de pesquisa clínica aplicam rotineiramente critérios de exclusão e etapas de pré-processamento de dados que podem alterar substancialmente a composição do conjunto de dados, potencialmente introduzindo vieses ocultos que afetam a validade e a generalizabilidade. Isso é particularmente importante em estudos de inteligência artificial/aprendizado de máquina (IA/ML) onde os modelos aprendem padrões diretamente dos dados de treinamento. Desenvolvemos o Equiflow, um pacote Python de código aberto que automatiza a criação de diagramas de fluxo de participantes aprimorados, rastreando tanto o tamanho da amostra quanto as mudanças na composição ao longo dos estudos. O Equiflow quantifica deslocamentos de distribuição em cada etapa de exclusão e gera visualizações mostrando como variáveis clínicas e demográficas chave evoluem durante a seleção de participantes. Em um estudo de caso com pacientes com sepse da base de dados eICU, as exclusões sequenciais reduziram a amostra de 126.750 para 1.094 pacientes. Exigir medições de troponina não faltantes na etapa final de processamento de dados causou mudanças demográficas substanciais que normalmente permaneceriam invisíveis em relatórios tradicionais. Ao tornar os vieses composicionais visíveis durante a construção da coorte antes que a modelagem comece, o Equiflow permite que os pesquisadores tomem decisões informadas sobre análises e reconheçam limitações na generalizabilidade para seus leitores. Essa abordagem padronizada e de código aberto promove transparência na pesquisa clínica e apoia o desenvolvimento de sistemas de IA clínica mais equitativos, abordando uma necessidade crítica à medida que os cuidados de saúde dependem cada vez mais da tomada de decisões orientadas por dados.

Equiflow: Um pacote de software de código aberto para avaliação de mudanças na composição da coorte

Key Points

Abstract

Cite This Study

Also Consider

Also Consider