April 6, 2024

Explorando as Dimensões Teóricas e os Comportamentos Complexos de Grandes Modelos de Linguagem e seus Homólogos Multimodais

Key Points

Key points are not available for this paper at this time.

Abstract

Nos últimos anos, houve uma explosão de desenvolvimento e mudanças no campo dos grandes modelos de linguagem e seus equivalentes multimodais. O processamento de linguagem natural, a síntese e a fusão de dados multimodais foram significativamente auxiliados por esses modelos, que são baseados em arquiteturas de aprendizado profundo. Neste estudo, propomos investigar as profundezas teóricas e os comportamentos complexos desses grandes modelos de linguagem para compreender melhor seu potencial e limitações. Começamos investigando os fundamentos teóricos da construção e operação dos modelos. Exploramos sua capacidade de compreender contexto e criar linguagem coerente, e desvendamos as complexidades do seu design, desde Transformers até os mecanismos de atenção. Discutimos o crescimento dinâmico desses modelos, que superaram barreiras linguísticas para acomodar entradas multimodais, além do uso de embeddings pré-treinados e aprendizado por transferência. Também examinamos o desempenho desses modelos em uma ampla variedade de contextos, desde PLN até visão computacional e além. Abordamos as dificuldades relativas a vieses e justiça na interpretação e aplicação desses modelos. Obtemos compreensão sobre como eles podem ser aprimorados em termos de desempenho, robustez e escalabilidade. No cerne desta investigação está uma estratégia proposta para otimizar o uso de grandes modelos de linguagem e seus parentes multimodais. Para revelar o potencial inexplorado e os vieses subjacentes desses modelos, esse método único combina Análise de Peso de Camadas, Análise do Mecanismo de Atenção e Detecção Ética de Vieses. Nossos resultados mostram a impressionante eficácia desses modelos ao enfrentar desafios reais complexos, mas também destacam a necessidade crítica de abordar questões de interpretabilidade e justiça.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Karishma Desai

Surjeet Yadav

R Murugan

Actions

Institutions

Jain University

Vivekananda Global University

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Explorando as Dimensões Teóricas e os Comportamentos Complexos de Grandes Modelos de Linguagem e seus Homólogos Multimodais

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider