En su tesis de Maestría (CIC-IPN, Junio 2012), Gabriela López Yebra nos dice cómo hacer ontologías (estructuras semánticas) a partir de documentos en español que describen cosas concretas. Pulse aquí para descargar un artículo sobre este trabajo.
Resumen:
Se presenta un método
basado en búsqueda de patrones en textos y un sistema de reglas para encontrar
relaciones ontológicas en documentos descriptivos de objetos concretos del
mundo real escritos en lenguaje natural.
Se desarrolla una
adaptación del método de búsqueda de patrones para agregarle un sistema de
reglas que permite que las relaciones encontradas se extiendan a relaciones
específicas buscadas dentro de un documento.
Se utilizan técnicas de
análisis de lenguaje natural para procesar el texto, posteriormente se
encuentran las relaciones buscadas en base a un archivo de reglas y se genera
una salida en lenguaje OM.
Las pruebas se realizan en el idioma español, sin embargo es posible
extender el método a cualquier idioma.
Abstract:
The
document presents a method based on finding patterns in text and a set of rules
to find ontological relations in descriptive documents for specific real-world
objects, such documents are written in natural language.
It develops
an adaptation of the pattern search method to add a rule system that allows the
method to find extra relationships.
The use of
natural language processing tools enables the system to find relationships
based on a defined rules file, the relations found are then represented in OM language for ontologies.
The tests are performed in Spanish, but it is possible
to extend the method to any language.
No hay comentarios:
Publicar un comentario