Este artigo aborda lacunas de conhecimento de domínio em grandes modelos de linguagem gerais para análise de textos históricos no contexto das humanidades computacionais e tecnologia AIGC. Propomos a estrutura Graph RAG, combinando prompting em cadeia de pensamento, geração de auto-instrução e supervisão de processo para criar um conjunto de dados de relacionamentos de personagens das Quatro Primeiras Histórias com anotação manual mínima. Este conjunto de dados apoia a extração automatizada de conhecimento histórico, reduzindo custos de trabalho. Na fase de geração augmentada por grafo, introduzimos um mecanismo colaborativo entre grafos de conhecimento e geração aumentada por recuperação, melhorando o alinhamento de modelos gerais com conhecimento histórico. Experimentos mostram que o modelo específico de domínio Xunzi-Qwen1.5-14B, com entrada em chinês simplificado e prompting em cadeia de pensamento, alcança desempenho ótimo na extração de relações (F1 = 0,68). O modelo DeepSeek integrado com GraphRAG melhora o F1 em 11% (0,08-0,19) no conjunto de dados de extração de relações de domínio aberto C-CLUE, superando o valor F1 do Xunzi-Qwen1.5-14B (0,12), aliviando efetivamente o fenômeno de alucinações e melhorando a interpretabilidade. Esta estrutura oferece uma solução de baixo recurso para extração de conhecimento de textos clássicos, avançando os serviços de conhecimento histórico e a pesquisa em humanidades.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yang et al. (Qua,) estudaram esta questão.
www.synapsesocial.com/papers/68f6379bb481a140a36cf6fa — DOI: https://doi.org/10.48550/arxiv.2506.15241
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:
Fan Yang
Qi Zhang
Xing Wenqian
Building similarity graph...
Analyzing shared references across papers
Loading...