My articles and publications --(full text, click here. You may be asked to sign up --it is free) --Mis publicaciones (texto completo: http://ipn.academia.edu/AdolfoGuzman Quizá le pida suscribirse --es gratis) Mi página Web -- (click here) -- My Web page (http://alum.mit.edu/www/aguzman). ALGUNOS VIDEOS SOBRE LO QUE HAGO. Conferencia 'Ciudad inteligente, con conectividad y tecnología' (oct. 2010), parte 1 (15min), parte 2 (8min), parte 3 (9min), parte 4 (2min). Entrevista por redCudiMéxico, 2012: aquí (11 min). Avances en Inteligencia Artificial, entrevista en la Univ. IBERO, Puebla, 2013. Pulse aquí (53min). Video in the series "Personalities in the history of ESIME" (for the 100 years anniversary of ESIME-IPN, in Spanish) about Adolfo Guzman": 2014, click here. (1h)
Entrevista "La visión de los egresados del IPN, a 80 años de la creación del IPN y 100 años de la creación de la ESIME, 2014: ver en youtube (1h). Seminario sobre "Big Data" (la Ciencia de Datos). 2014. Pulse aquí (56min). Seminar on "Big Data", in English, 2014. Click here (56min). Algunos trabajos sobre Minería de Datos y sus Aplicaciones (CIC-IPN, 2016): pulse aquí (5min). El auge y el ocaso de las máquinas de Lisp (Plática en la Reunión Anual 2016 de la Academia Mexicana de Computación): pulse aquí (56min). Entrevista sobre la funcionalidad y competitividad de Hotware 10: 2016, aquí (6 min). Adolfo Guzmán Arenas, Ingeniero Electrónico e investigador del Centro de Investigación en Computación del IPN, conversó sobre su trayectoria y la importancia de las ciencias aplicadas para el desarrollo del país. 2017, Canal 11, Noticias TV (30min). Cómo se construyó la primera computadora en el mundo de procesamiento paralelo con Lisp. Marzo 2018. https://www.youtube.com/watch?v=dzyZGDhxwrU (12 min). Charla "Historias de éxito en la computación mexicana", ciclo Códice IA. Entrevista a A. Guzmán, "Entre la vida y la academia": https://bit.ly/3sIOQBc (45 min). El CIC cumple 25 años. Pulse aquí (51min. Habla Adolfo: "Pasado y futuro del CIC": minutos 13.57 a 22.70 ).
Perfil en ResearchGate -- Adolfo Guzman-Arenas My URL in Google Scholar: http://scholar.google.com/citations?user=Nw5lSdEAAAAJ My ORCID number 0000-0002-8236-0469. Scopus Author ID 6602302516.

Follow me on Academia.edu

Cómo influyen las condiciones del entorno escolar, familiar, y personal, en el desempeño en exámenes de Matemáticas (prueba EXCALE)

     El Ing. Arturo Heredia Márquez obtuvo su grado de Maestro en Ciencias, en el Centro de Investigación en Computación del IPN, defendiendo exitosamente su tesis "Técnicas de visualización para asociar condiciones de estudio con los resultados en matemáticas de la prueba EXCALE". Su tesis puede descargarse aquí.
     Arturo Heredia presented his thesis "Visualization techniques to associate study conditions with results in the EXCALE test for Mathematics", and obtained his M. Sc. degree at CIC-IPN. His thesis may be dowloaded from here.

RESUMEN. En la actualidad los fenómenos de interés a analizar generan continuamente grandes volúmenes de datos. Por lo general, también contienen un alto número de variables o dimensiones, por lo cual su análisis se vuelve un problema complejo, debido al incremento en las combinaciones entre las dimensiones a relacionar con las variables de interés, y a la complejidad de la fase de preparación para las técnicas que se desean utilizar en su análisis.

     Para analizar los datos con las características anteriores, se usa primordialmente la Minería de Datos y la Visualización. Un caso con un alto número de dimensiones es el Examen de Calidad y Logro Educativo (EXCALE) en 3° de Secundaria en Matemáticas que realizaba el Instituto Nacional para la Evaluación de la Educación (INEE). Lo acompaña un cuestionario de contexto que mide las condiciones de los estudiantes en tres entornos: Entorno Personal; Entorno Familiar; Entorno Escolar. En algunos casos son más de 100 variables entre evaluación y contexto.
     Para reducir la complejidad en el análisis de las dimensiones, se valoraron y utilizaron algoritmos para reducir su número. Finalmente, se usó un método que permite hallar los atributos relevantes de un conjunto de datos, aquellos correlacionados con la variable de interés (desempeño académico en Matemáticas). En la reducción de dimensiones, se cuida la pérdida de información usando la Minería de Datos, como si se tratara de un problema de clasificación a través del algoritmo C4.5 y Naive Bayes por cada evaluación.
     Debido a que las dimensiones que se miden, no siempre se repiten en la evaluación de un año con la evaluación de otro año, no se puede tratar como un problema de clasificación o predicción directamente.  Con las técnicas de visualización se busca facilitar la comprensión entre las dimensiones relevantes en los diferentes años de aplicación.
     Se observaron patrones y tendencias en variables de interés como la modalidad, sus aspiraciones académicas e historial académico (Promedio General, Promedio anterior en Matemáticas), la atención y frecuencia con la que los estudiantes entienden al profesor y que encuentran correlación con el desempeño académico de los estudiantes. Con la reducción de dimensiones se logró aumentar las clasificaciones correctas de los algoritmos utilizados, se disminuyeron los tiempos de generación de los modelos de clasificación y del tamaño del árbol, así como del espacio de análisis.
     Por último, se desarrolló el sistema informático ANCONE que utiliza diversas técnicas de visualización como visualización espacial a través de mapas geográficos, diagrama Sankey y gráficas de dispersión de puntos para auxiliar al analista en la búsqueda de información interesante.

Palabras clave: Minería de Datos, Visualización de la Información­, Bases de Datos, Educación, Reducción de Dimensiones, EXCALE, INEE.

Arturo Heredia (quinto de izq. a der.) con su jurado de Maestría, después de haber defendido exitosamente su tesis. 3/VII/2017.
  ABSTRACT. Currently, a phenomena of interest wich we wish to analyze, continually generates  large volumes of data. In general, the data often contain a high number of variables or dimensions, so their analysis becomes a complex problem. This is due to the increase in the combinations between the dimensions to be related to the variables of interest, and to the complexity of the preparation phase for the techniques that you want to use in your analysis.

     In order to analyze the data with the previous characteristics, Data Mining and Visualization is used primarily. A case with a high number of dimensions is the Quality Exam and Educational Achievement (EXCALE) in 3rd grade in Mathematics carried out by the National Institute for the Evaluation of Education (INEE). It is accompanied by a context questionnaire that measures the conditions of students in three environments: Personal Environment; Familiar surroundings; School environment. In some cases, there are more than 100 variables between evaluation and context.
     To reduce the complexity in the analysis of the dimensions, were evaluated and used algorithms to reduce their number. Finally, a method was used to find the relevant attributes of a set of data, those correlated with the variable of interest (academic performance in Mathematics). In the reduction of dimensions, data loss is taken care of using Data Mining, as if it were a classification problem through algorithm C4.5 and Naive Bayes for each evaluation.
     Because measured dimensions are not always repeated in the one-year assessment with the assessment of another year, it cannot be treated as a classification or prediction problem directly. With visualization techniques, the aim is to facilitate understanding between the relevant dimensions in the different years of application.
     Patterns and trends were observed in variables of interest such as modality, academic aspirations and academic background (General Average, previous average in Mathematics), the attention and frequency with which students understand the teacher and that correlate with the academic performance of the students. With the reduction of dimensions, it was possible to increase the correct classifications of the algorithms used, the generation times of the classification models and the size of the tree as well as the analysis space were reduced. This allowed having a visualization to show the results.
     Finally, the ANCONE computer system was developed using various visualization techniques such as spatial visualization through geographic maps, Sankey diagram and scatter plots to assist the analyst in the search for interesting information.

Keywords: Data Mining, Information Visualization, Databases, Education, Dimension Reduction, EXCALE, INEE

No hay comentarios: