Grandes modelos de linguagem construídos com base na arquitetura Transformer caíram agora em um impasse onde os retornos marginais do escalonamento de parâmetros continuam a diminuir. Além do GPT-8, as limitações físicas da Lei de Escalonamento estão se aproximando do seu limite, enquanto os requisitos de confiabilidade para implantação de IA em domínios verticais de alto risco — saúde, judiciário, finanças e políticas públicas — estão crescendo exponencialmente. Até o momento, a humanidade ainda não decifrou o mecanismo fundamental da inteligência geral a partir dos primeiros princípios; confiar cegamente no surgimento espontâneo da inteligência para impulsionar a iteração industrial carece tanto de rigor de engenharia quanto de controlabilidade prática. Este artigo propõe uma solução sistemática que não depende de avanços desconhecidos na inteligência e pode ser implementada inteiramente com tecnologias maduras de engenharia existentes: uma arquitetura desacoplada de duas camadas composta por um "modelo fundamental de senso comum de mundo da camada inferior" e um "módulo da camada superior de geração e expressão de linguagem." Usando uma base de conhecimento estruturada em três níveis — compreendendo uma Camada de Verdade Absoluta, uma Camada de Verificação por Especialistas e uma Camada de Senso Comum Público — o quadro estabelece um mecanismo de verificação colaborativa totalmente em circuito fechado de "geração de candidato de IA → detecção quantitativa de desvio de conteúdo → verificação leve em massa → adjudicação final de especialistas em discordâncias." Isso possibilita restrições de senso comum e fidelidade factual durante todo o processo para as saídas do modelo. O esquema separa completamente o conhecimento objetivo do mundo da geração de linguagem, adota enciclopédias autorizadas publicamente disponíveis e descobertas acadêmicas revisadas por pares como base da verdade absoluta da camada inferior, e distribui o custo massivo da verificação de fatos por meio da colaboração pública em toda a sociedade. Em comparação com o escalonamento contínuo dos parâmetros do modelo, esse caminho apresenta um custo marginal decrescente de longo prazo, com cada geração entregando métricas quantificáveis e rastreáveis de supressão de alucinações, delineando claramente a evolução geracional dos grandes modelos na era Pós-Lei de Escalonamento. Ao mesmo tempo, uma base de conhecimento público mundial padronizada e estruturada estabelecerá uma infraestrutura pública universal para a próxima mudança de paradigma em inteligência artificial. O artigo adere a uma filosofia central de engenharia: antes que o mecanismo científico subjacente da inteligência seja esclarecido, a prioridade principal da indústria de IA é alcançar a confiabilidade máxima na automação da informação em todos os cenários.
Building similarity graph...
Analyzing shared references across papers
Loading...
Shuangning Zhang
Building similarity graph...
Analyzing shared references across papers
Loading...
Shuangning Zhang (Tue,) studied this question.
www.synapsesocial.com/papers/69fbe325164b5133a91a271e — DOI: https://doi.org/10.5281/zenodo.20040477
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: