My articles and publications --(full text, click here. You may be asked to sign up --it is free) --Mis publicaciones (texto completo: http://ipn.academia.edu/AdolfoGuzman Quizá le pida suscribirse --es gratis) Mi página Web -- (click here) -- My Web page (http://alum.mit.edu/www/aguzman). ALGUNOS VIDEOS SOBRE LO QUE HAGO. Conferencia 'Ciudad inteligente, con conectividad y tecnología' (oct. 2010), parte 1 (15min), parte 2 (8min), parte 3 (9min), parte 4 (2min). Entrevista por redCudiMéxico, 2012: aquí (11 min). Avances en Inteligencia Artificial, entrevista en la Univ. IBERO, Puebla, 2013. Pulse aquí (53min). Video in the series "Personalities in the history of ESIME" (for the 100 years anniversary of ESIME-IPN, in Spanish) about Adolfo Guzman": 2014, click here. (1h)
Entrevista "La visión de los egresados del IPN, a 80 años de la creación del IPN y 100 años de la creación de la ESIME, 2014: ver en youtube (1h). Seminario sobre "Big Data" (la Ciencia de Datos). 2014. Pulse aquí (56min). Seminar on "Big Data", in English, 2014. Click here (56min). Algunos trabajos sobre Minería de Datos y sus Aplicaciones (CIC-IPN, 2016): pulse aquí (5min). El auge y el ocaso de las máquinas de Lisp (Plática en la Reunión Anual 2016 de la Academia Mexicana de Computación): pulse aquí (56min). Entrevista sobre la funcionalidad y competitividad de Hotware 10: 2016, aquí (6 min). Adolfo Guzmán Arenas, Ingeniero Electrónico e investigador del Centro de Investigación en Computación del IPN, conversó sobre su trayectoria y la importancia de las ciencias aplicadas para el desarrollo del país. 2017, Canal 11, Noticias TV (30min). Cómo se construyó la primera computadora en el mundo de procesamiento paralelo con Lisp. Marzo 2018. https://www.youtube.com/watch?v=dzyZGDhxwrU (12 min). Charla "Historias de éxito en la computación mexicana", ciclo Códice IA. Entrevista a A. Guzmán, "Entre la vida y la academia": https://bit.ly/3sIOQBc (45 min). El CIC cumple 25 años. Pulse aquí (51min. Habla Adolfo: "Pasado y futuro del CIC": minutos 13.57 a 22.70 ).
Perfil en ResearchGate -- Adolfo Guzman-Arenas My URL in Google Scholar: http://scholar.google.com/citations?user=Nw5lSdEAAAAJ My ORCID number 0000-0002-8236-0469. Scopus Author ID 6602302516.

Follow me on Academia.edu

Minería de datos --curso en el CIC. Data mining course

Esta presentación motiva al lector a estudiar la minería de datos, explica en qué consiste, cómo se aplica, para qué sirve, qué ventajas y utilidades conlleva. Hay un crecimiento explosivo de datos, nos ahogamos en un mar de datos. Pero estamos hambrientos de conocimiento. Pulsar aquí para obtener la presentación.

La minería de datos es el descubrimiento automático (o semiautomático) de tendencias, desviaciones, situaciones interesantes y anomalías en un mar de datos. Es descubrir conocimiento en los datos. Extracción de patrones interesantes (no triviales, implícitos, previamente desconocidos y potencialmente útiles) o conocimiento, en una gran cantidad de datos. También se llama descubrimiento o minado de conocimiento, extracción de conocimiento, análisis de datos, análisis de patrones, arqueología de datos, inteligencia de negocios, etc.

Sirve para apoyar decisiones de negocios, para toma de decisiones, encontrar desviaciones, detectar anomalías cuando apenas surgen. Se apoya en las bases de datos (y las bodegas de datos), la estadística, la visualización y el agrupamiento (clustering).

Basado en el libro “Data mining, concepts and techniques” 2nd. Ed. Jiawei Han and Micheline Kamber

La minicomputadora DEC PDP-12 del CINVESTAV del IPN



El Dr. Pablo Rudomín (Departamento de Fisiología) y Adolfo Guzmán (Departamento de Ingeniería Eléctrica) usaron esta computadora en el Centro de Investigación y Estudios Avanzados del IPN, allá por los años 70's. Ahora está en el Museo Tezozomoc del IPN.
En una visita al museo en agosto de 2011, vemos a los dos investigadores posando frente a la minicomputadora.

Visualización de la información por jerarquías (tesis de maestría). Visualization using hierarchies

En la actualidad el análisis en las bases de datos se dificulta por diversas razones, ya sea por tratar con los grandes volúmenes que se almacenan o por comprender las estructuras internas definidas en los datos, esto provoca que la búsqueda de anomalías o situaciones de interés en un conjunto de datos sea compleja. Supóngase que en una empresa de ventas de productos “Se desea saber en qué nivel de la clasificación (jerarquía) de productos se tienen altos niveles de ventas, digamos arriba del 80% con respecto al año anterior”. Esta consulta de negocio llamada “tendencia con niveles jerárquicos” consiste en localizar aquellos elementos en una jerarquía establecida en los datos que presenten una situación de interés para el analista, esto significa encontrar los elementos relevantes y sus subelementos necesarios para alcanzar los puntos de interés.
En este trabajo se muestra un análisis, diseño e implementación de una herramienta para resolver el tipo de pregunta de negocio planteada, lo cual consiste en la búsqueda de los elementos de interés dentro del árbol de jerarquías de una dimensión de un cubo de datos y posteriormente presentar los resultados en representaciones visuales recomendadas por los expertos de la visualización de la información. Se presentan 3 tipos de representaciones lo cuales son: Mapas de nodos, Mapas de calor y Mapas Pastel Multi-Nivel. Además de tableros de control para analizar las anomalías o puntos de interés en otros niveles de la jerarquía permitiendo así una navegación sobre los distintos niveles de granularidad y sobre otras dimensiones involucradas en el análisis. Send me email if you want the full document.

At present analysis in databases is difficult due to various reasons: either because of large volumes stored, or internal structures in the data set. This causes the search for anomalies or situations of interest in a data set to be complex. Suppose in a product sales company this situation occurs: They want to know what level of classification (hierarchy) of products with high sales levels, say above 80% over the previous year. This consulting business called "trend in hierarchy" is locating those items in a hierarchy in the data submitted by a situation of interest to be analyzed. This means finding the relevant elements and the elements necessary to achieve the landmarks.
This paper presents an analysis, design and implementation of a tool to solve the kind of business question posed. This consists in finding items of interest within the hierarchy tree of data cube dimension and then presents the results in visual representations recommended by information display scientists. There are 3 types of representations which are nodes maps, heat and Pastel Multi-Level maps. In addition to dashboards analyzing anomalies or points of interest in other levels of the hierarchy, which allows navigation on different granularity levels and other dimensions involved in the analysis.

La revista CIENCIA (jul-sep 2011) habla de Computación

Los invito a leer el número de julio-septiembre 2011 (http://goo.gl/GWJpx) de la revista CIENCIA de la Academia Mexicana de Ciencias (http://www.revistaciencia.amc.edu.mx/), se pueden bajar los artículos (gratis). En este número escriben

Uso de nuevas tecnologías de la computación para mejorar la interacción en una urbe

Ciudad digital: sociedad inteligente.

Desde el punto de vista de un informático, una ciudad es un conglomerado de entes (personas físicas y morales --empresas, organizaciones, dependencias...) que producen, consumen, procesan y almacenan información. Confluyen en una urbe dos fenómenos: (a) el hacinamiento o aglomeración de entes que aún se rigen por costumbres, leyes y servicios diseñados cuando la concentración era menor, y (b) el auge acelerado de la computación, en particular su abaratamiento, y la casi gratuidad de la transmisión de información. Esto hace que los informáticos tengamos una oportunidad ejemplar de aplicar los nuevos métodos y técnicas de nuestra profesión para remodelar la manera de actuar, de interactuar y de conducirse en una urbe o megaconglomerado.

Es preciso rediseñar los modelos de interacción entre nosotros, porque (a) no estábamos acostumbrados a vivir tan apretados, y (b) aún no aprovechamos las bondades y lo barato de los servicios informáticos con que contamos. Por ejemplo, solicitar servicios es aún presencial; actos jurídicos (demandar, desfogar una audiencia, ofrecer pruebas) aún son presenciales y síncronos (ocurren en determinado edificio a determinada hora de determinado día); estudiar es presencial; votar es presencial.

Tenemos que pensar en ideas de cómo cambiar nuestras costumbres, nuestros modelos de interacción y nuestra manera de funcionar, aprovechando la comunicación casi instantánea y casi gratuita, y evitando el transporte físico de personas o entes y de mercancías o satisfactores.

Temas a abordar:Tecnologías para los servicios y toma de decisiones ciudadanas.
Reemplazar documentos de papel. "Junto con su solicitud que deberá firmar con tinta azul, deberá traer dos copias de su acta de nacimiento, copia de su credencial para votar, por ambos lados, así como constancia de ..., todos apostillados por el cónsul mexicano en su ciudad natal." La firma digital.
Acceso digital para los mexicanos-­-gobierno,banca y comercio digital. Ciudadanos transparentes.
Aprendizaje en presencia de la ubicuidad de la información. Qué aprender. Cómo aprender. Aprender a localizar fuentes de información.
Buscadores de documentos (Google) versus sistemas de conocimiento almacenado (programas que contestan preguntas no triviales en base a la información que contienen) --deducción de las respuestas. Ejemplo: Wolfram Alpha.
Seguridad informática, seguridad pública y seguridad privada. Las cámaras de video siempre vigilan.
La cédula única de identidad. Mi identidad en poder de la computadora. Los documentos oficiales, títulos, diplomas y escrituras se guardan en la computadora. La computadora tiene mi título. Más cédula de identificación ciudadana o cédula de identidad con datos biométricos.Democracia, autodeterminación y procesos electorales. Votar por internet o por teléfono.
Impacto de los medios en la toma de decisiones. Propaganda focalizada.
Otro ejemplo: Gobierno electrónico.
Otro ejemplo: Software que ayuda a la atención de una contingencia severa (catástrofe) causada por un sismo de gran magnitud en una urbe.
Más información (transparencias) aquí.

Para ver el video "Ciudad inteligente con conectividad y tecnología", pulse aquí (parte 1, 14min); aquí (parte 2, 8min). 2010.