What type of study is this?

This is a Experimental Study study.

October 20, 2025Open Access

Pesquisa sobre Geração Aumentada por Recuperação de Grafos Baseada em Grafos de Conhecimento de Textos Históricos

Key Points

O modelo específico de domínio alcança uma pontuação F1 de 0,68 na extração de relações, indicando melhorias efetivas de desempenho.
A integração do modelo DeepSeek com GraphRAG conduz a um aumento de 11% na pontuação F1 no conjunto de dados C-CLUE, mostrando capacidades aprimoradas de extração.
A estrutura proposta minimiza a anotação manual para criação de conjuntos de dados, oferecendo uma solução que reduz o trabalho na análise de textos históricos.
A colaboração entre grafos de conhecimento e geração aumentada por recuperação melhora significativamente o alinhamento dos modelos com o conhecimento histórico.

Abstract

Este artigo aborda lacunas de conhecimento de domínio em grandes modelos de linguagem gerais para análise de textos históricos no contexto das humanidades computacionais e tecnologia AIGC. Propomos a estrutura Graph RAG, combinando prompting em cadeia de pensamento, geração de auto-instrução e supervisão de processo para criar um conjunto de dados de relacionamentos de personagens das Quatro Primeiras Histórias com anotação manual mínima. Este conjunto de dados apoia a extração automatizada de conhecimento histórico, reduzindo custos de trabalho. Na fase de geração augmentada por grafo, introduzimos um mecanismo colaborativo entre grafos de conhecimento e geração aumentada por recuperação, melhorando o alinhamento de modelos gerais com conhecimento histórico. Experimentos mostram que o modelo específico de domínio Xunzi-Qwen1.5-14B, com entrada em chinês simplificado e prompting em cadeia de pensamento, alcança desempenho ótimo na extração de relações (F1 = 0,68). O modelo DeepSeek integrado com GraphRAG melhora o F1 em 11% (0,08-0,19) no conjunto de dados de extração de relações de domínio aberto C-CLUE, superando o valor F1 do Xunzi-Qwen1.5-14B (0,12), aliviando efetivamente o fenômeno de alucinações e melhorando a interpretabilidade. Esta estrutura oferece uma solução de baixo recurso para extração de conhecimento de textos clássicos, avançando os serviços de conhecimento histórico e a pesquisa em humanidades.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Cite this study

Yang et al. (Qua,) estudaram esta questão.

www.synapsesocial.com/papers/68f6379bb481a140a36cf6fa — DOI: https://doi.org/10.48550/arxiv.2506.15241

Also consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

Authors

Fan Yang

Qi Zhang

Xing Wenqian

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Pesquisa sobre Geração Aumentada por Recuperação de Grafos Baseada em Grafos de Conhecimento de Textos Históricos

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion