Título: | PlaM-DeP: una plataforma modular para el desarrollo y evaluación de algoritmos de detección de plagio académico |
Autores: | Fajardo Heras, Hernán ; Barrera Maura, Manuel ; Robles Bykbaev, Vladimir ; Timbi Sisalima, Cristian ; Calle Ortiz, Eduardo |
Tipo de documento: | texto impreso |
Fecha de publicación: | 2015-04-13T20:31:34Z |
Dimensiones: | application/pdf |
Nota general: | openAccess |
Idiomas: | |
Palabras clave: | Revista Ingenius , Revistas Académicas , Publicaciones UPS , Volumen No. 11 |
Resumen: |
En este trabajo se presenta un modelo de plataforma de software para desarrollar y evaluar los algoritmos de detección de plagio. La plataforma se basa en un diseño modular escalable, que implementa un conjunto de servicios que posibilitan realizar automáticamente tareas como: análisis sintáctico y semántico a través de WordNet y FreeLing, extracción automática de texto de múltiples formatos de archivos (PDF, Word y texto), extracción de contenido de páginas web (empleando algunos motores de búsqueda como Google, Yandex, Yahoo, Bing), el almacenamiento, la carga y el uso de algoritmos de detección de plagio. Estos servicios permiten a un programador desarrollar el código centrando el esfuerzo en el diseño del algoritmo y la base matemática/estadística. Actualmente, la plataforma se probó usando varias consultas de texto (n-gramas), y los resultados de rendimiento son prometedores. In this paper we present a software platform model to develop and evaluate plagiarism detection algorithms. The platform is based in a scalable modular design, and implements several services to perform automatically the following tasks: syntactic and semantic analysis through WordNet and FreeLing, automatic text extraction of multiple file formats (PDF, Word and text), web page content extraction (using some search engines like Google, Yandex, Yahoo, Bing), and storage, load and use of plagiarism detection algorithms. These services allow a programmer to develop a code focusing the effort on the design of the algorithm and the mathematical/statistical basis. The platform was tested using several text queries (n-grams), and currently the performance results are promising. |
En línea: | http://dspace.ups.edu.ec/handle/123456789/8477 |
Ejemplares
Estado |
---|
ningún ejemplar |