Con la transformación digital y la modernización inteligente de los recursos bibliotecarios, los métodos tradicionales de clasificación e indexación de literatura ya no pueden satisfacer las necesidades de organización de información eficiente y precisa. En este sentido, este estudio propone un nuevo método de clasificación e indexación automática de literatura que integra la tecnología NLP (Procesamiento de Lenguaje Natural). La investigación tiene como objetivo mejorar la eficiencia en el procesamiento de información y la calidad del servicio de la biblioteca. En términos de realización técnica, este trabajo diseña de manera innovadora un algoritmo de clasificación automática de literatura basado en el modelo Bert (Representaciones de Codificadores Bidireccionales de Transformadores) y un algoritmo de indexación automática de literatura basado en la extracción de palabras clave. Al preentrenar y ajustar finamente el modelo BERT, se logra una comprensión profunda y clasificación precisa del contenido de la literatura. Al analizar la frecuencia léxica, la parte del habla y la información de ubicación en la literatura, se extraen con éxito las palabras clave que representan el tema de la literatura, y se realiza la indexación automática de la literatura. Los datos experimentales muestran que la precisión del modelo de clasificación ha alcanzado un alto estándar, y puede distinguir efectivamente literaturas en diferentes disciplinas. El modelo de indexación también funciona bien, y las palabras clave extraídas son altamente consistentes con los resultados de la indexación manual. Esta tecnología es útil para mejorar la eficiencia y precisión en el procesamiento de literatura y proporcionar a los usuarios servicios de información más personalizados y precisos.
Ma et al. (Sun,) estudiaron esta cuestión.