Computer Science - from Adolfo Guzmán --Trabajos en Computación: julio 2017

My articles and publications --(full text, click here. You may be asked to sign up --it is free) --Mis publicaciones (texto completo: http://ipn.academia.edu/AdolfoGuzman Quizá le pida suscribirse --es gratis) Mi página Web -- (click here) -- My Web page (http://alum.mit.edu/www/aguzman). ALGUNOS VIDEOS SOBRE LO QUE HAGO. Conferencia 'Ciudad inteligente, con conectividad y tecnología' (oct. 2010), parte 1 (15min), parte 2 (8min), parte 3 (9min), parte 4 (2min). Entrevista por redCudiMéxico, 2012: aquí (11 min). Avances en Inteligencia Artificial, entrevista en la Univ. IBERO, Puebla, 2013. Pulse aquí (53min). Video in the series "Personalities in the history of ESIME" (for the 100 years anniversary of ESIME-IPN, in Spanish) about Adolfo Guzman": 2014, click here. (1h)

Entrevista "La visión de los egresados del IPN, a 80 años de la creación del IPN y 100 años de la creación de la ESIME, 2014: ver en youtube (1h). Seminario sobre "Big Data" (la Ciencia de Datos). 2014. Pulse aquí (56min). Seminar on "Big Data", in English, 2014. Click here (56min). Algunos trabajos sobre Minería de Datos y sus Aplicaciones (CIC-IPN, 2016): pulse aquí (5min). El auge y el ocaso de las máquinas de Lisp (Plática en la Reunión Anual 2016 de la Academia Mexicana de Computación): pulse aquí (56min). Entrevista sobre la funcionalidad y competitividad de Hotware 10: 2016, aquí (6 min). Adolfo Guzmán Arenas, Ingeniero Electrónico e investigador del Centro de Investigación en Computación del IPN, conversó sobre su trayectoria y la importancia de las ciencias aplicadas para el desarrollo del país. 2017, Canal 11, Noticias TV (30min). Cómo se construyó la primera computadora en el mundo de procesamiento paralelo con Lisp. Marzo 2018. https://www.youtube.com/watch?v=dzyZGDhxwrU (12 min). Charla "Historias de éxito en la computación mexicana", ciclo Códice IA. Entrevista a A. Guzmán, "Entre la vida y la academia": https://bit.ly/3sIOQBc (45 min). El CIC cumple 25 años. Pulse aquí (51min. Habla Adolfo: "Pasado y futuro del CIC": minutos 13.57 a 22.70 ).

Perfil en ResearchGate --

My URL in Google Scholar: http://scholar.google.com/citations?user=Nw5lSdEAAAAJ My ORCID number 0000-0002-8236-0469. Scopus Author ID 6602302516.

Follow me on Academia.edu

Compendium of touristic indicators of priority tourist destinations and magic towns (book)

Adriana Jiménez Contreras and Adolfo Guzmán Arenas examine priority touristic destinations and 'magic towns,' and observe the degree of tourism development, competitiveness and sustainability of the place. The book can be dowloaded from here.

FOREWORD. In this book, the analysis of indicators in eight touristic components is presented and an environment resulting from the investigation derived from Project 242853 is shown. This research studies the Priority Tourist Destinations (PTD) and Magic Towns (MT). It assists the DGGD in the Secretariat of Tourism (Sectur), allowing it to observe the degree of tourism development, sustainability and competitiveness of the destination, through these indicators. Throughout this compendium, the analysis is carried in three stages; it is derived in a matrix classification, which can be represented as a hierarchical tree, too. The results obtained from the investigation of the large compendium of information (where the indicators, its extraction, cleaning, selection and classification are shown), allows analyzing all the facets of a tourist destination. In Mexico there are attractive tourist destinations, for national and international tourists. Among the types of destinations are Sun and Beach, Ecotourism and Adventure and Nature. There are localities throughout Mexico that have competitive and sustainable characteristics; that is, they are productive, they generate jobs, attend the needs of tourists and the local inhabitants, and at the same time preserve their traditions, natural and cultural resources , and other important social and historical assets.

Cómo influyen las condiciones del entorno escolar, familiar, y personal, en el desempeño en exámenes de Matemáticas (prueba EXCALE)

El Ing. Arturo Heredia Márquez obtuvo su grado de Maestro en Ciencias, en el Centro de Investigación en Computación del IPN, defendiendo exitosamente su tesis "Técnicas de visualización para asociar condiciones de estudio con los resultados en matemáticas de la prueba EXCALE". Su tesis puede descargarse aquí.
Arturo Heredia presented his thesis "Visualization techniques to associate study conditions with results in the EXCALE test for Mathematics", and obtained his M. Sc. degree at CIC-IPN. His thesis may be dowloaded from here.

RESUMEN. En la actualidad los fenómenos de interés a analizar generan continuamente grandes volúmenes de datos. Por lo general, también contienen un alto número de variables o dimensiones, por lo cual su análisis se vuelve un problema complejo, debido al incremento en las combinaciones entre las dimensiones a relacionar con las variables de interés, y a la complejidad de la fase de preparación para las técnicas que se desean utilizar en su análisis.

Para analizar los datos con las características anteriores, se usa primordialmente la Minería de Datos y la Visualización. Un caso con un alto número de dimensiones es el Examen de Calidad y Logro Educativo (EXCALE) en 3° de Secundaria en Matemáticas que realizaba el Instituto Nacional para la Evaluación de la Educación (INEE). Lo acompaña un cuestionario de contexto que mide las condiciones de los estudiantes en tres entornos: Entorno Personal; Entorno Familiar; Entorno Escolar. En algunos casos son más de 100 variables entre evaluación y contexto.

Para reducir la complejidad en el análisis de las dimensiones, se valoraron y utilizaron algoritmos para reducir su número. Finalmente, se usó un método que permite hallar los atributos relevantes de un conjunto de datos, aquellos correlacionados con la variable de interés (desempeño académico en Matemáticas). En la reducción de dimensiones, se cuida la pérdida de información usando la Minería de Datos, como si se tratara de un problema de clasificación a través del algoritmo C4.5 y Naive Bayes por cada evaluación.

Debido a que las dimensiones que se miden, no siempre se repiten en la evaluación de un año con la evaluación de otro año, no se puede tratar como un problema de clasificación o predicción directamente. Con las técnicas de visualización se busca facilitar la comprensión entre las dimensiones relevantes en los diferentes años de aplicación.

Se observaron patrones y tendencias en variables de interés como la modalidad, sus aspiraciones académicas e historial académico (Promedio General, Promedio anterior en Matemáticas), la atención y frecuencia con la que los estudiantes entienden al profesor y que encuentran correlación con el desempeño académico de los estudiantes. Con la reducción de dimensiones se logró aumentar las clasificaciones correctas de los algoritmos utilizados, se disminuyeron los tiempos de generación de los modelos de clasificación y del tamaño del árbol, así como del espacio de análisis.

Por último, se desarrolló el sistema informático ANCONE que utiliza diversas técnicas de visualización como visualización espacial a través de mapas geográficos, diagrama Sankey y gráficas de dispersión de puntos para auxiliar al analista en la búsqueda de información interesante.

Palabras clave: Minería de Datos, Visualización de la Información, Bases de Datos, Educación, Reducción de Dimensiones, EXCALE, INEE.

Arturo Heredia (quinto de izq. a der.) con su jurado de Maestría, después de haber defendido exitosamente su tesis. 3/VII/2017.

ABSTRACT. Currently, a phenomena of interest wich we wish to analyze, continually generates large volumes of data. In general, the data often contain a high number of variables or dimensions, so their analysis becomes a complex problem. This is due to the increase in the combinations between the dimensions to be related to the variables of interest, and to the complexity of the preparation phase for the techniques that you want to use in your analysis.

In order to analyze the data with the previous characteristics, Data Mining and Visualization is used primarily. A case with a high number of dimensions is the Quality Exam and Educational Achievement (EXCALE) in 3rd grade in Mathematics carried out by the National Institute for the Evaluation of Education (INEE). It is accompanied by a context questionnaire that measures the conditions of students in three environments: Personal Environment; Familiar surroundings; School environment. In some cases, there are more than 100 variables between evaluation and context.

To reduce the complexity in the analysis of the dimensions, were evaluated and used algorithms to reduce their number. Finally, a method was used to find the relevant attributes of a set of data, those correlated with the variable of interest (academic performance in Mathematics). In the reduction of dimensions, data loss is taken care of using Data Mining, as if it were a classification problem through algorithm C4.5 and Naive Bayes for each evaluation.

Because measured dimensions are not always repeated in the one-year assessment with the assessment of another year, it cannot be treated as a classification or prediction problem directly. With visualization techniques, the aim is to facilitate understanding between the relevant dimensions in the different years of application.

Patterns and trends were observed in variables of interest such as modality, academic aspirations and academic background (General Average, previous average in Mathematics), the attention and frequency with which students understand the teacher and that correlate with the academic performance of the students. With the reduction of dimensions, it was possible to increase the correct classifications of the algorithms used, the generation times of the classification models and the size of the tree as well as the analysis space were reduced. This allowed having a visualization to show the results.

Finally, the ANCONE computer system was developed using various visualization techniques such as spatial visualization through geographic maps, Sankey diagram and scatter plots to assist the analyst in the search for interesting information.

Keywords: Data Mining, Information Visualization, Databases, Education, Dimension Reduction, EXCALE, INEE

Análisis regional de delitos de alto impacto en la ciudad de México

Análisis regional de delitos de alto impacto en la ciudad de México con mapeo de puntos de interés. Tal es la tesis de maestría de Manuel Gutiérrez Ceballos, cuyo texto completo puede obtenerse aquí.
The M. Sc. thesis of Manuel Gutiérrez, titled 'Regional analysis of high impact crimes in Mexico City with mapping of points of interest', can be dowloaded from here.

RESUMEN. La Minería de Datos muestra su utilidad de análisis en los fenómenos de interés para la humanidad, fenómenos que hoy en día involucran variables de diferentes tipos: categóricas, numéricas, booleanas, georeferencias, entre otras. Por lo anterior, los análisis que debe desarrollar la Minería de datos se vuelven más complejos, ya sea al solo realizar su descripción y después una posible predicción de hechos.

Un fenómeno de interés a analizar es la ocurrencia de delitos, fenómeno que tiene la característica indicada en el párrafo anterior, de involucrar diferentes tipos de variables, como la clasificación del delito, tiempo del hecho (día de semana, día, mes, año, hora), genero de los involucrados, localidad (en sus diferentes áreas de análisis y geo-referenciación), y otras variables más que se catalogan como confidenciales.

Las variables de primer nivel del fenómeno, podrían describirlo parcialmente, aún con la Visualización que involucre a todas ellas. Pero, para una descripción más completa, es necesario, coleccionar más datos de variables que podrían estar relacionadas con el fenómeno. En el caso de delitos, los datos a coleccionar y que podrían estar relacionados, son datos que identifiquen a objetos o sitios de interés, cercanos al lugar del delito y que podrían ser desde sitios de diversión, académicos, comerciales u otro que se puedan relacionar, además de estaciones del metro o paradas de autobús.

Para una descripción más completa, las técnicas de visualización ayudan, pero aquí surgen problemas de seleccionar las visualizaciones o diseñar las que ayuden a describir más el fenómeno.

En este proyecto se propone una plataforma de software para el análisis en su parte de descripción de fenómenos como el indicado. Este fenómeno es de interés para México, ya que cuenta con 10 ciudades en el Ranking de las 50 ciudades más peligrosas del mundo [1], utilizando los delitos de alto impacto de la Ciudad de México en el lapso de tiempo del 2013 al 2016. El análisis de descripción se realiza a diferentes niveles:

· El análisis geográfico en diferentes regiones de la ciudad (colonias, delegaciones, cuadrantes y no convencionales)
· El mapeo de información geo-referenciada de delitos con otros puntos de interés
· Así como funcionalidades que puedan aportar a un análisis temporal.

Para las funcionalidades se destacan como aportaciones, varios algoritmos propios como

· El que localiza las rutas entre dos diferentes puntos
· Y el que califica a las regiones en diferentes niveles de peligrosidad
· Además de las estructuras de almacenamiento que permiten responder las funcionalidades desarrolladas (Base de datos con información delictiva, BD de polígonos de las regiones de análisis y de puntos de interés, cubos de datos y matrices de adyacencia).

Funcionalidades que, a través de diversas presentaciones con CONACYT, SSP-CDMX, CNS, IPN, Empresariales y medios de información se han considerado útiles e innovadoras.

Manuel Gutiérrez Ceballos (de lentes) obtuvo su grado de Maestro en Ciencias el 6 de julio de 2017, en el Centro de Investigación en Computación del IPN.

ABSTRACT. Data Mining shows its usefulness in analyzing phenomena of interest to humanity, phenomena which involve variables of different types such as: categorical, numerical, boolean, geo-referenced, among others. Consequently, the analysis that must be developed using data mining become more complex, only describing the phenomenon and then a possible prediction of facts.

A phenomenon of interest to analyze is the occurrence of crimes, involving different types of variables, such as the type of crime, the time of the event (weekday, day, month, hour), gender of the victim, locality (shown in a map), and other variables that are classified as confidential.

The first-level variables of the phenomenon could describe it partially, even with the visualization that involves all of them. However, for a more complete description, it is necessary to collect more data on variables that could be related to the phenomenon. In the case of crimes, data to concentrate is information related which are identified as sites of interest, nearby crime locations as fun sites, academic, commercial and other, and also subway stations and bus stops.

To have a more complete description, visualization techniques assist, but the problems arise when selecting the visualizations, or how to design them in order to better depict the phenomenon.

In this project, a software platform is proposed for the analysis in part of the description of phenomena. This phenomenon is one of interest to Mexico, since it has 10 cities in the Ranking of the 50 most dangerous in the world [1], by using the high impact crimes of Mexico City between 2013 and 2016. The analysis of the description is performed at different levels:

· The geographic analysis in different regions of the city (colonies, delegations, quadrants and non-conventional areas).

· The mapping of geo-referenced information of crimes with other points of interest.

· As well as functionalities that have a temporal analysis.

For the functionalities which emphasize as contributions of this project, are algorithms such as

· The algorithm that locates the routes between two different points.

· And that qualifies the regions in different levels of danger.

· In addition to the storage structures that allow to respond to the functionalities developed (Database with criminal information, Database of polygons of the regions of analysis and points of interest, data cubes and adjacency matrices).

Functionalities that, through various presentations with CONACYT, SSP-CDMX, CNS, IPN, business and media companies have been considered them useful and innovative.

Cumple 30 años la Sección (ahora Departamento) de Computación del CINVESTAV-IPN

La Sección de Computación del CINVESTAV IPN fue fundada por Adolfo en 1986. 30 años después, en 2006, se transforma en el Departamento de Computación del CINVESTAV IPN. Para conmemorar ese evento, vino en 2006 el Prof. John Hopcroft. De izquierda a derecha, Adolfo Guzmán, Juan Carlos Chimal, John Hopcroft, Germán Téllez. El Prof. Hopcroft es un distinguido teórico de la computación, de la Universidad de Cornell. Nos habló de las matemáticas del futuro de la computación, que cada vez analiza más datos, redes grandes con pocos lados, y vectores ralos en espacios de muchas dimensiones.

En los portales de Oaxaca de Juárez. Semana Nacional de Ciencia y Tecnología. Oct. 2013

Llegué temprano a dar una plática, invitado por el Consejo Oaxaqueño de Ciencia y Tecnología. Fuimos el Ing. Alberto Sánchez (Director del COCYT) y yo a desayunar a los portales frente al Palacio de Gobierno, en la capital, Oaxaca de Juárez. Aquí, Adolfo toma una taza de chocolate, junto con pan de yema. Luego vendría un tasajo (carne de res asada a las brasas) con entomatadas. Alberto cosecha chiles habaneros, uno de ellos se aprecia en la parte inferior de la fotografía. Ideal para el tasajo. 22 de octubre de 2013.