Descripción de fuentes de datos heterogéneas utilizando tecnologías semánticas
La Web Semántica, plantea potenciales oportunidades para dotar de significado a los contenidos web. Las ontologías constituyen una de las principales herramientas para especificar explícitamente los conceptos de un dominio concreto, sus propiedades y sus relaciones; de manera que la información se p...
Main Authors: | , |
---|---|
Other Authors: | |
Format: | bachelorThesis |
Language: | spa |
Published: |
2018
|
Subjects: | |
Online Access: | http://dspace.ucuenca.edu.ec/handle/123456789/30352 |
_version_ | 1785802331203305472 |
---|---|
author | Angüisaca Landivar, Adrián Francisco Japa Loja, Juan Pablo |
author2 | Tello Guerrero, Marco Andrés |
author_facet | Tello Guerrero, Marco Andrés Angüisaca Landivar, Adrián Francisco Japa Loja, Juan Pablo |
author_sort | Angüisaca Landivar, Adrián Francisco |
collection | DSpace |
description | La Web Semántica, plantea potenciales oportunidades para dotar de significado a los contenidos web. Las ontologías constituyen una de las principales herramientas para especificar explícitamente los conceptos de un dominio concreto, sus propiedades y sus relaciones; de manera que la información se publique en formatos que sean entendibles por agentes máquinas que pueden localizar y gestionar de forma precisa la información.
En esta tesis se presenta una aplicación para la generación un modelo ontológico común, el cual describe diferentes fuentes de datos mediante sus metadatos, específicamente se trabajó con fuentes de tipo Base de datos, CSV, XML y EXCEL. Para ello, se analizó diferentes ontologías de descripción de metadatos, entre las cuales se tienen DCAT, PHDD y DISCO. Estas tres fuentes se unieron en un solo modelo, sobre el cual se realizaron algunas modificaciones, siendo la más importante la incorporación de una estructura, la cual me permita describir los diferentes tipo de datos que tienen los atributos de las fuentes. Después se procedió a la creación de un modelo relacional común, donde se almacena temporalmente los metadatos extraídos, para su posterior mapeo con el modelo ontológico común. Finalmente se procedió a generar un archivo RDF sobre el modelo ontológico común y publicar el mismo para su explotación.
Para validar experimentalmente el modelo creado, se planteó un escenario de integración de varias fuentes de datos, donde se realizó una comparación haciendo consultas al modelo ontológico común y haciendo una inspección de forma manual a los metadatos y datos de dichas fuentes, esto con la finalidad de obtener la utilidad del modelo ontológico común. Concluyendo que mediante el modelo ontológico común el usuario encargado de la integración puede extraer las posibles asignaciones semánticas en términos de integración de datos, de forma fácil y a un menor costo, ya que lo realiza sobre un solo repositorio común. |
format | bachelorThesis |
id | oai:dspace.ucuenca.edu.ec:123456789-30352 |
institution | Universidad de Cuenca |
language | spa |
publishDate | 2018 |
record_format | dspace |
spelling | oai:dspace.ucuenca.edu.ec:123456789-303522018-06-07T14:01:31Z Descripción de fuentes de datos heterogéneas utilizando tecnologías semánticas Angüisaca Landivar, Adrián Francisco Japa Loja, Juan Pablo Tello Guerrero, Marco Andrés Saquicela Galarza, Víctor Hugo Programacion Web Semantica Software Integracion Anotacion Semantica La Web Semántica, plantea potenciales oportunidades para dotar de significado a los contenidos web. Las ontologías constituyen una de las principales herramientas para especificar explícitamente los conceptos de un dominio concreto, sus propiedades y sus relaciones; de manera que la información se publique en formatos que sean entendibles por agentes máquinas que pueden localizar y gestionar de forma precisa la información. En esta tesis se presenta una aplicación para la generación un modelo ontológico común, el cual describe diferentes fuentes de datos mediante sus metadatos, específicamente se trabajó con fuentes de tipo Base de datos, CSV, XML y EXCEL. Para ello, se analizó diferentes ontologías de descripción de metadatos, entre las cuales se tienen DCAT, PHDD y DISCO. Estas tres fuentes se unieron en un solo modelo, sobre el cual se realizaron algunas modificaciones, siendo la más importante la incorporación de una estructura, la cual me permita describir los diferentes tipo de datos que tienen los atributos de las fuentes. Después se procedió a la creación de un modelo relacional común, donde se almacena temporalmente los metadatos extraídos, para su posterior mapeo con el modelo ontológico común. Finalmente se procedió a generar un archivo RDF sobre el modelo ontológico común y publicar el mismo para su explotación. Para validar experimentalmente el modelo creado, se planteó un escenario de integración de varias fuentes de datos, donde se realizó una comparación haciendo consultas al modelo ontológico común y haciendo una inspección de forma manual a los metadatos y datos de dichas fuentes, esto con la finalidad de obtener la utilidad del modelo ontológico común. Concluyendo que mediante el modelo ontológico común el usuario encargado de la integración puede extraer las posibles asignaciones semánticas en términos de integración de datos, de forma fácil y a un menor costo, ya que lo realiza sobre un solo repositorio común. The Semantic Web, propound potential opportunities to give meaning to web content. Ontologies are one of the main tools to explicitly specify the concepts of a particular domain, its properties and its relationships; so that the information is published in formats that are understandable by machine agents that can locate and manage the information accurately. This thesis presents an application for the generation of a common ontological model, which describes different data sources through its metadata, specifically worked with sources such as Database, CSV, XML and EXCEL. For this, different ontologies of metadata description were analyzed, among which DCAT, PHDD and DISCO are available. These three sources were united in a single model, on which some modifications were made, the most important being the incorporation of a structure, which allows me to describe the different types of data that have the attributes of the sources. Afterwards, a common relational model was created, where the extracted metadata is temporarily stored, for its subsequent mapping with the common ontological model. Finally, we proceeded to generate an RDF file on the common ontological model and publish the same for its exploitation. In order to experimentally validate the created model, an integration scenario was set up for several data sources, where a comparison was made by consulting the common ontological model and manually inspecting the metadata and data of said sources, this with the purpose to obtain the utility of the common ontological model. Concluding that through the common ontological model, the user in charge of integration can extract the possible semantic assignments in terms of data integration, easily and at a lower cost, since it is done on a single common repository. Ingeniero de Sistemas Cuenca 2018-05-10T12:32:33Z 2018-05-10T12:32:33Z 2018 bachelorThesis http://dspace.ucuenca.edu.ec/handle/123456789/30352 spa TS;255 application/pdf application/pdf |
spellingShingle | Programacion Web Semantica Software Integracion Anotacion Semantica Angüisaca Landivar, Adrián Francisco Japa Loja, Juan Pablo Descripción de fuentes de datos heterogéneas utilizando tecnologías semánticas |
title | Descripción de fuentes de datos heterogéneas utilizando tecnologías semánticas |
title_full | Descripción de fuentes de datos heterogéneas utilizando tecnologías semánticas |
title_fullStr | Descripción de fuentes de datos heterogéneas utilizando tecnologías semánticas |
title_full_unstemmed | Descripción de fuentes de datos heterogéneas utilizando tecnologías semánticas |
title_short | Descripción de fuentes de datos heterogéneas utilizando tecnologías semánticas |
title_sort | descripción de fuentes de datos heterogéneas utilizando tecnologías semánticas |
topic | Programacion Web Semantica Software Integracion Anotacion Semantica |
url | http://dspace.ucuenca.edu.ec/handle/123456789/30352 |
work_keys_str_mv | AT anguisacalandivaradrianfrancisco descripciondefuentesdedatosheterogeneasutilizandotecnologiassemanticas AT japalojajuanpablo descripciondefuentesdedatosheterogeneasutilizandotecnologiassemanticas |