Etiquetado asistido de documentos de investigación mediante procesamiento de lenguaje natural y tecnologías de la web semántica


Authors

  • Pedro Harvey Alvarez Sanchez Corporación universitaria
  • Gustavo Andres Uribe Gomez Corporación universitaria comfacauca, UNICOMFACAUCA http://orcid.org/0000-0001-5852-7487
  • Alfonso Edil Tintinago P. Corporación universitaria
  • Yordan Muñoz Corporación universitaria

DOI:

https://doi.org/10.22517/23447214.17721

Keywords:

Metadato, Recuperación de información, Procesamiento natural del lenguaje, Web semántica

Abstract

El presente artículo se basa en la implementación del procesamiento de lenguaje natural (PLN) y las tecnologías de la web semántica, con la intención de facilitar la extracción de palabras claves en documentos de investigación de forma más eficiente y eficaz. Para tal fin, por medio de una matriz de comparación se seleccionó un algoritmo para realizar el proceso de extracción. Se eligió el algoritmo Keyword Extraction Based On Entropy Difference (C#) realizado por Zhen YANG, Jianjun LEI, Kefeng FAN y Yingxu LAI. Este algoritmo fue desarrollado para procesarlos documentos en idioma chino, por lo que fue requerida una adaptación al idioma inglés y español anexando los vocabularios de correspondientes a estos idiomas configurando el código fuente del algoritmo. Adicionalmente se adaptó el algoritmo para que usase una ontología con la terminología propia del dominio de conocimiento de ingenierías. El algoritmo fue evaluado por medio de ejemplos de artículos científicos, obteniendo métricas de recuperación de la información, como son la precisión, exhaustividad y el valor F. Se obtuvo como resultado un valor F promedio 0.63 para una muestra de 13 artículos científicos, lo que valida el algoritmo como óptimo para la tarea propuesta.

Downloads

Download data is not yet available.

Author Biographies

Pedro Harvey Alvarez Sanchez, Corporación universitaria

COORDINADOR DE INVESTIGACION

Gustavo Andres Uribe Gomez, Corporación universitaria comfacauca, UNICOMFACAUCA

Lider Grupo Tic Unicomfacauca Docente Investigador

Alfonso Edil Tintinago P., Corporación universitaria

Ingeniero de Sistemas

Yordan Muñoz, Corporación universitaria

Ingeniero de Sistemas

Downloads

Published

2018-12-30

How to Cite

Alvarez Sanchez, P. H., Uribe Gomez, G. A., Tintinago P., A. E., & Muñoz, Y. (2018). Etiquetado asistido de documentos de investigación mediante procesamiento de lenguaje natural y tecnologías de la web semántica. Scientia Et Technica, 23(4), 528–537. https://doi.org/10.22517/23447214.17721

Issue

Section

Sistemas y Computación