Summary: | La historia nos revela la existencia de una multitud de eventos que se desarrollan en el
mundo día a día, dejando una huella en el tiempo. Antiguamente, la transmisión de ese
conocimiento se realizaba de manera oral y se mantenía vivo a través de generaciones.
No obstante, el avance de la tecnología ha revolucionado la forma en que accedemos a la
información y nos ha permitido explorar registros históricos en una escala sin precedentes.
En este contexto, surge un desafío, gran parte de esa información yace dormida en periódicos antiguos, los cuales se encuentran en un estado de deterioro y son difíciles de tratar.
Estos periódicos contienen relatos de eventos de la historia del Ecuador en los siglos XIX y
XX, pero acceder a esa información de manera rápida y eficiente es un desafío.
Para abordar este problema, en este trabajo de titulación, se propone una solución basada
en la digitalización de texto, el procesamiento texto y las tecnologías de la web semántica. El
objetivo principal es extraer la información de los periódicos antiguos, organizarla de manera
estructurada y generar un grafo de conocimiento que represente los eventos ocurridos en
Ecuador durante ese período histórico.
La solución propuesta implica la automatización de cada uno de los pasos del proceso. Para
lograrlo, se han construido varios widgets en Orange, que permite realizar tareas específicas
en cada etapa del proceso. Estos widgets trabajan en conjunto para extraer la información,
identificar entidades y relaciones, obtener Word Embendings y generar un grafo de conocimiento.
|