What type of study is this?

This is a Quantitative Study study.

October 12, 2025Open Access

Do Diálogo à Triagem: Pluralismo é Necessário mas Não Suficiente para o Alinhamento de IA

Key Points

O alinhamento de IA deve se adaptar a valores humanos específicos e contextos, aprimorando a tomada de decisões éticas em diversas aplicações.
Enfatizar a alinhabilidade dinâmica e específica ao contexto pode melhorar a confiança do usuário e a interação com sistemas de IA.
Avaliar a IA envolve examinar tanto seus valores quanto suas ações para garantir alinhamento com padrões morais humanos.
A estrutura proposta sugere caminhos para as implicações éticas e sociais das estratégias de alinhamento de IA.

Abstract

À medida que os sistemas de IA se tornam mais poderosos e prevalentes, garantir que suas ações estejam alinhadas com os valores humanos é fundamental. O desafio do alinhamento de IA é, portanto, interdisciplinar, envolvendo não apenas um desafio técnico para a ciência da computação, mas também importantes conexões com a psicologia dos valores morais, tomada de decisão e confiança. Trabalhos iniciais identificaram um conjunto estático de valores universais, sem considerar questões-chave sobre para quem e quais valores a IA deve estar alinhada. Este artigo de perspectiva desafia a noção de alinhamento universal e, em vez disso, defende a alinhabilidade dinâmica e específica ao contexto, abrangendo diferentes domínios, tarefas e usuários. Especificamente, enfatizamos a necessidade de ir além do pluralismo tradicional e repensar como o alinhamento de IA pode ser alcançado através de um processo de pesquisa qualitativa e quantitativa que envolve identificar valores específicos do contexto, desenvolver algoritmos de IA alinháveis usando feedback humano limitado e avaliar o alinhamento por meio da análise tanto dos valores quanto das ações da IA, considerando como os humanos confiam e delegam à IA. Discutimos vários caminhos futuros para nossa estrutura proposta, incluindo as potenciais implicações éticas e sociais da alinhabilidade específica ao contexto, utilizando exemplos que vão desde chatbots até a tomada de decisão alinhada a valores na área de triagem médica.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Brian Hu

Jennifer McVay

Alice Leung

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Do Diálogo à Triagem: Pluralismo é Necessário mas Não Suficiente para o Alinhamento de IA

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider