À medida que os sistemas de IA se tornam mais poderosos e prevalentes, garantir que suas ações estejam alinhadas com os valores humanos é fundamental. O desafio do alinhamento de IA é, portanto, interdisciplinar, envolvendo não apenas um desafio técnico para a ciência da computação, mas também importantes conexões com a psicologia dos valores morais, tomada de decisão e confiança. Trabalhos iniciais identificaram um conjunto estático de valores universais, sem considerar questões-chave sobre para quem e quais valores a IA deve estar alinhada. Este artigo de perspectiva desafia a noção de alinhamento universal e, em vez disso, defende a alinhabilidade dinâmica e específica ao contexto, abrangendo diferentes domínios, tarefas e usuários. Especificamente, enfatizamos a necessidade de ir além do pluralismo tradicional e repensar como o alinhamento de IA pode ser alcançado através de um processo de pesquisa qualitativa e quantitativa que envolve identificar valores específicos do contexto, desenvolver algoritmos de IA alinháveis usando feedback humano limitado e avaliar o alinhamento por meio da análise tanto dos valores quanto das ações da IA, considerando como os humanos confiam e delegam à IA. Discutimos vários caminhos futuros para nossa estrutura proposta, incluindo as potenciais implicações éticas e sociais da alinhabilidade específica ao contexto, utilizando exemplos que vão desde chatbots até a tomada de decisão alinhada a valores na área de triagem médica.
Building similarity graph...
Analyzing shared references across papers
Loading...
Brian Hu
Jennifer McVay
Alice Leung
Building similarity graph...
Analyzing shared references across papers
Loading...
Hu et al. (Fri,) studied this question.
www.synapsesocial.com/papers/68ebe3d6becc64ad52fdae10 — DOI: https://doi.org/10.31234/osf.io/hdu92_v1
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: