Etiquetado asistido de documentos de investigación mediante procesamiento de lenguaje natural y tecnologías de la web semántica
DOI:
https://doi.org/10.22517/23447214.17721Palabras clave:
Metadato, Recuperación de información, Procesamiento natural del lenguaje, Web semánticaResumen
El presente artículo se basa en la implementación del procesamiento de lenguaje natural (PLN) y las tecnologías de la web semántica, con la intención de facilitar la extracción de palabras claves en documentos de investigación de forma más eficiente y eficaz. Para tal fin, por medio de una matriz de comparación se seleccionó un algoritmo para realizar el proceso de extracción. Se eligió el algoritmo Keyword Extraction Based On Entropy Difference (C#) realizado por Zhen YANG, Jianjun LEI, Kefeng FAN y Yingxu LAI. Este algoritmo fue desarrollado para procesarlos documentos en idioma chino, por lo que fue requerida una adaptación al idioma inglés y español anexando los vocabularios de correspondientes a estos idiomas configurando el código fuente del algoritmo. Adicionalmente se adaptó el algoritmo para que usase una ontología con la terminología propia del dominio de conocimiento de ingenierías. El algoritmo fue evaluado por medio de ejemplos de artículos científicos, obteniendo métricas de recuperación de la información, como son la precisión, exhaustividad y el valor F. Se obtuvo como resultado un valor F promedio 0.63 para una muestra de 13 artículos científicos, lo que valida el algoritmo como óptimo para la tarea propuesta.Descargas
Descargas
-
Vistas(Views): 966
- PDF Descargas(Downloads): 625
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2019 Scientia et technica
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Derechos de autor y licencias
La revista es de acceso abierto gratuito y sus artículos se publican bajo la licencia Creative Commons Atribución/Reconocimiento-No Comercial-Compartir bajo los mismos términos 4.0 Internacional — CC BY-NC-SA 4.0.
Los autores de un artículo aceptado para publicación cederán la totalidad de los derechos patrimoniales a la Universidad Tecnológica de Pereira de manera gratuita, teniendo en cuenta lo siguiente: En caso de que el trabajo presentado sea aprobado para su publicación, los autores deben autorizar de manera ilimitada en el tiempo, a la revista para que pueda reproducirlo, editarlo, distribuirlo, exhibirlo y comunicarlo en cualquier lugar, ya sea por medios impresos, electrónicos, bases de datos, repositorios, discos ópticos, Internet o cualquier otro medio requerido.
Los cedentes mediante contrato CESIÓN DE DERECHOS PATRIMONIALES declaran que todo el material que forma parte del artículo está totalmente libre de derechos de autor de terceros y, por lo tanto, se hacen responsables de cualquier litigio o reclamación relacionada o reclamación relacionada con derechos de propiedad intelectual, exonerando de toda responsabilidad a la Universidad Tecnológica de Pereira (entidad editora) y a su revista Scientia et Technica. De igual forma, los autores aceptan que el trabajo que se presenta sea distribuido en acceso abierto gratuito, resguardando los derechos de autor bajo la licencia Creative Commons Atribución/Reconocimiento-No Comercial- Compartir bajo los mismos términos 4.0 Internacional — CC BY-NC-SA 4.0.
https://creativecommons.org/licenses/by-nc-sa/4.0/
A los autores, la revista Scientia et Technica tiene la obligación de respetarle los derechos morales (artículo 30 de la Ley 23 de 1982 del Gobierno Colombiano) que se les debe reconocen a estos la paternidad de la obra, el derecho a la integridad y el derecho de divulgación. Estos no se pueden ceder ni renunciar.