En esta tesis, Oscar Alberto Rocha Arcos analiza y clasifica 690 de las cerca de 900 tesis que ha producido el CIC, a través de sus egresados, en sus 26 años de existencia. La tesis completa puede consultarse aquí.
RESUMEN
Actualmente se generan elevados volúmenes de información derivados de la actividad científica. Aunado a esto, la evolución del conocimiento científico en todas sus áreas de investigación y específicamente en las áreas de la computación y afines, está en constante transformación. Partiendo de esto, se tiene la necesidad de analizar y esquematizar esta información generadas, para obtener conclusiones sobre su avance, evolución y generación.
El presente documento realiza un análisis y evalación, de las temáticas dominantes en las publicaciones del CIC-IPN que se han desarrollado hasta el 2020. Las 690 tesis feron obtenidas de los repositorios digitales del IPN. Para la evaluación del sistema, 100 tesis se clasificaron de manera manual previamente con base a la ontología multijerárquica que sugiere ACM (Association for Computing Machinery, por sus siglas en inglés) para el campo de la computación, sirviendo como Golden Standard. La clasificación de la tesis es utilizando el sistema desarrollado CLASSONTO, que permite clasificar basándose en un árbol de conocimiento. El sistema ocupa una votación y propagación del voto, para la identificación de temáticas, además de un procesamiento de textos. El árbol de conocimiento en el que se basa es enriquecido, por lo que lo convierte en un sistema de mejora continua.
Los resultados obtenidos muestran las clasificaciones de cada tesis, permitiendo inferir qué temas trata cada una. De igual manera se hace un análisis y evaluación de los resultados con respecto al tiempo, visualizando el desarrollo de temáticas a través del tiempo.
Esta investigación es de particular interés, pues servirá como una referencia para evaluar la producción científica del CIC, fomentando su estudio y catalogación.
Palabras clave: clasificación jerárquica, ontologías, modelado de temas.
Clasificación ACM: 8.5.5.8 Clustering and classification; 11.3.1 Natural Language Processing; 12.8.2 Publishing; 11.4.1.2.4 Topic modeling; 8.5.1.6 Ontologies.
No hay comentarios:
Publicar un comentario