Key points are not available for this paper at this time.
Nos últimos anos, houve uma explosão de desenvolvimento e mudanças no campo dos grandes modelos de linguagem e seus equivalentes multimodais. O processamento de linguagem natural, a síntese e a fusão de dados multimodais foram significativamente auxiliados por esses modelos, que são baseados em arquiteturas de aprendizado profundo. Neste estudo, propomos investigar as profundezas teóricas e os comportamentos complexos desses grandes modelos de linguagem para compreender melhor seu potencial e limitações. Começamos investigando os fundamentos teóricos da construção e operação dos modelos. Exploramos sua capacidade de compreender contexto e criar linguagem coerente, e desvendamos as complexidades do seu design, desde Transformers até os mecanismos de atenção. Discutimos o crescimento dinâmico desses modelos, que superaram barreiras linguísticas para acomodar entradas multimodais, além do uso de embeddings pré-treinados e aprendizado por transferência. Também examinamos o desempenho desses modelos em uma ampla variedade de contextos, desde PLN até visão computacional e além. Abordamos as dificuldades relativas a vieses e justiça na interpretação e aplicação desses modelos. Obtemos compreensão sobre como eles podem ser aprimorados em termos de desempenho, robustez e escalabilidade. No cerne desta investigação está uma estratégia proposta para otimizar o uso de grandes modelos de linguagem e seus parentes multimodais. Para revelar o potencial inexplorado e os vieses subjacentes desses modelos, esse método único combina Análise de Peso de Camadas, Análise do Mecanismo de Atenção e Detecção Ética de Vieses. Nossos resultados mostram a impressionante eficácia desses modelos ao enfrentar desafios reais complexos, mas também destacam a necessidade crítica de abordar questões de interpretabilidade e justiça.
Building similarity graph...
Analyzing shared references across papers
Loading...
Karishma Desai
Surjeet Yadav
R Murugan
Jain University
Vivekananda Global University
Building similarity graph...
Analyzing shared references across papers
Loading...
Desai et al. (Sat,) estudaram esta questão.
www.synapsesocial.com/papers/68e70322b6db64358767d038 — DOI: https://doi.org/10.1109/csnt60213.2024.10545720
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: