My articles and publications --(full text, click here. You may be asked to sign up --it is free) --Mis publicaciones (texto completo: http://ipn.academia.edu/AdolfoGuzman Quizá le pida suscribirse --es gratis) Mi página Web -- (click here) -- My Web page (http://alum.mit.edu/www/aguzman). ALGUNOS VIDEOS SOBRE LO QUE HAGO. Conferencia 'Ciudad inteligente, con conectividad y tecnología' (oct. 2010), parte 1 (15min), parte 2 (8min), parte 3 (9min), parte 4 (2min). Entrevista por redCudiMéxico, 2012: aquí (11 min). Avances en Inteligencia Artificial, entrevista en la Univ. IBERO, Puebla, 2013. Pulse aquí (53min). Video in the series "Personalities in the history of ESIME" (for the 100 years anniversary of ESIME-IPN, in Spanish) about Adolfo Guzman": 2014, click here. (1h)
Entrevista "La visión de los egresados del IPN, a 80 años de la creación del IPN y 100 años de la creación de la ESIME, 2014: ver en youtube (1h). Seminario sobre "Big Data" (la Ciencia de Datos). 2014. Pulse aquí (56min). Seminar on "Big Data", in English, 2014. Click here (56min). Algunos trabajos sobre Minería de Datos y sus Aplicaciones (CIC-IPN, 2016): pulse aquí (5min). El auge y el ocaso de las máquinas de Lisp (Plática en la Reunión Anual 2016 de la Academia Mexicana de Computación): pulse aquí (56min). Entrevista sobre la funcionalidad y competitividad de Hotware 10: 2016, aquí (6 min). Adolfo Guzmán Arenas, Ingeniero Electrónico e investigador del Centro de Investigación en Computación del IPN, conversó sobre su trayectoria y la importancia de las ciencias aplicadas para el desarrollo del país. 2017, Canal 11, Noticias TV (30min). Cómo se construyó la primera computadora en el mundo de procesamiento paralelo con Lisp. Marzo 2018. https://www.youtube.com/watch?v=dzyZGDhxwrU (12 min). Charla "Historias de éxito en la computación mexicana", ciclo Códice IA. Entrevista a A. Guzmán, "Entre la vida y la academia": https://bit.ly/3sIOQBc (45 min). El CIC cumple 25 años. Pulse aquí (51min. Habla Adolfo: "Pasado y futuro del CIC": minutos 13.57 a 22.70 ).
Perfil en ResearchGate -- Adolfo Guzman-Arenas My URL in Google Scholar: http://scholar.google.com/citations?user=Nw5lSdEAAAAJ My ORCID number 0000-0002-8236-0469. Scopus Author ID 6602302516.

Follow me on Academia.edu

INAOE conferred an Honorary Ph D degree to Adolfo Guzman, on November 9, 2012

El INAOE confiere el Doctorado Honoris Causa a Adolfo Guzmán Arenas.

Adolfo Guzmán and José Franco López show in their neck their honorific Ph Degree conferred on November 9, 2012.

     La ceremonia se efectuó el 9 de noviembre de 2012 en el Instituto Nacional de Astrofísica, Óptica y Electrónica, Tonanzintla, Puebla, México. 
El día 8 Guzmán impartió la conferencia magistral "Cuando las computadoras entiendan lo que lean, ¿qué pasará?" en el Auditorio del Centro de Información del Instituto.  Más fotos: pulse aquí. 

INAOE conferred Adolfo Guzman a honorific Ph. D. degree

Doctorados Honoris Causa conferidos por INAOE. Honorific Ph. D. degrees conferred
Dr. Karen Strom            13 nov. 1995           Dr. Edgar Sánchez Sinencio    13 nov. 1995
Dr. Elfego Ruíz Schneider    13 nov. 1995    Dra. Paris Pismish        1996
Dr. Jumpei Tsujiuchi        1996                     Dr. Daniel Malacara         1996
Dr. Franco Maloberti        1996                    Dr. Mikhail Petrov        11 nov. 1997
Dr. Don L. Kendall         11 nov. 1997         Dr. Güido Munch            11 nov. 1997
Dr. Francisco Barnés de Castro 2 mar.1998 Dr. Ilya Prigogine         21 mar. 1998
Dr. Francisco Sánchez Martínez 2 mar 1998 Dr. Arcadio Poveda Ricalde     14 nov. 1998
Sir Peter L. Knight        14 nov. 1998           Dr. James C. Wyant        10 nov 2008
Dr. José Luis Huertas        Nov-2011           Dr. George Stegman        Nov-2011
Dr. Adolfo Guzmán Arenas 9 nov. 2012   Dr. José Franco López        9 nov. 2012

  Adolfo Guzmán y José Franco, galardonados con un grado de Doctor Honoris Causa el 9 de noviembre, muestran su presea, al cuello, junto con los miembros que presidieron la ceremonia de graduación. Al centro, el Dr. Alfonso Carramiñana, Director General del INAOE.

La misión del INAOE es contribuir, como Centro Público de Investigación a la generación, avance y difusión del conocimiento para el desarrollo del país y de la humanidad, por medio de la identificación y solución de problemas científicos y tecnológicos y de la formación de especialistas en las áreas de Astrofísica, Óptica, Electrónica, Ciencias Computacionales y áreas afines.
El Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) fue creado por decreto presidencial el 11 de noviembre de 1971 como un organismo descentralizado, de interés público, con personalidad jurídica y patrimonio propio, ubicado en Tonantzintla, Puebla, con los siguientes objetivos:
  • Preparar investigadores, profesores especializados, expertos y técnicos en astrofísica, óptica y electrónica.
  • Procurar la solución de problemas científicos y tecnológicos relacionados con las citadas disciplinas.
  • Orientar sus actividades de investigación y docencia hacia la superación de las condiciones y resolución de los problemas del país.
  • Con este decreto el INAOE tiene la facultad de impartir cursos y otorgar grados de maestría y doctorado en las diversas disciplinas que en él se desarrollan.
EL INAOE es heredero de una gran tradición científica que data de 1942, cuando Luis Enrique Erro fundó el Observatorio Astrofísico Nacional de Tonantzintla. En aquel entonces, Tonantzintla se escogió como el lugar idóneo para la instalación del Observatorio, el cual cumplía con las exigentes normas de calidad como noches despejadas y en cantidad por año, así como altura geográfica y mínima incidencia luminosa de poblaciones cercanas, ya que en la capital de la República no era posible instalar un moderno Observatorio. Más información en www.inaoep.mx/
 
 El Dr. Enrique Súcar, Director de Investigación del INAOE (a la derecha), leyó la semblanza de A. Guzmán.
              Breve descripción de A. Guzmán. 
El Dr. Adolfo Guzmán Arenas nació en Ixtalte­pec, Oax. Es Ingeniero en Comuni­ca­ciones y Electrónica (Escuela Superior de In­geniería Mecánica y Eléctrica, IPN) y Doctor en Computación (Massa­chu­setts Institute of Technology).

     Como docente, fue profesor del Depto. de Ing. Eléctrica del MIT; Dept. of Machine Intelligence and Perception, University of Edin­burgh; CINVESTAV-IPN; IIMAS-UNAM; UPIICSA-IPN; desde 1995, del CIC-IPN, del que fue Director fundador (1996-2002). Fundó la Maes­tría en Computación del IIMAS-UNAM; la Maestría y Doctorado en Computación del CIN­VES­TAV-IPN, de UPIICSA-IPN, y del CIC-IPN.

     Como investigador, ha desarrollado CON­VERT (lenguaje para manipulación de símbo­los, su tesis de licenciatura fue traducida al inglés y al braille); SEE (programa para detec­tar cuerpos tridimensionales en imágenes; fue su tesis de doctorado); números de forma (para medir el parecido entre dos formas); PR (Per­cep­ción Remota, proyecto para detectar y cuantifi­car, desde imágenes de satélite, cose­chas, cuerpos de agua…, que obtuvo Mención Honorífica en el Premio Nacional Bana­Mex de Agricultura); MDT (modelos digitales del terreno); AHR (a heterarchical reconfigurable ma­chi­ne; máquina multipro­cesador basada en flujo de datos); máquinas multiprocesadoras con jerar­quías de memorias (MCC, Austin, TX); la teoría de la confusión; la teoría de la inconsistencia; OM* (ontology merging), árboles envolventes (para sólidos voxelizados).

     Algunos desarrollos tecnológicos: Chief Engi­neer (lenguaje, intérprete y compilador para SSDL, un lenguaje visual paralelo de alto nivel) en International Software Systems, Austin, TX; Ana­Sin (Analizador-sintetizador, combinación de bo­de­ga de datos y minería de datos); EVA (Espacios vir­tuales de aprendizaje, para enseñanza remota); Clasi­tex© (programa que detecta de qué temas habla un documento); BiblioDigital© (una biblioteca digital distribuida dotada de un buscador poderoso); RieSis (software para ayudar a atender una contingencia severa causada por un terremoto de gran magnitud).

     Algunos de sus desarrollos productivos han sido en el Centro Científico de América Latina de IBM de México (fue su Director); MCC (Austin, TX); ISSI, Austin, TX (Chief Engi­neer); Software­Pro Inter­national (CEO); SE­TRA­VI-GDF (asesor del Secretario); CIATEQ, Que­ré­taro (diseño de un procesador para medir flujo en tube­rías de com­bus­tibles); TEPJF (Director General de Siste­mas); ahora colabora en la SCJN (análisis de texto; clasi­fi­cación de documentos).
     Algunos reconocimientos: Es Ciudadano Distin­­gui­do de Salina Cruz, Oax.; el Ayunta­mien­to de Ix­taltepec, Oax., develó una placa en la casa don­­de él nació; miembro del SNI; Premio Na­cio­­nal de Cien­cias (otorgado por el Presidente Zedillo); Pre­sea Lázaro Cárdenas; miembro del Con­sejo Con­sul­tivo de Ciencias; de la Academia de Ingeniería (México); de la Academia Mexicana de Ciencias; Senior Member IEEE; Life Member IEEE; Fellow of the ACM; Member of the ACM Publications Board (2003-06); Gran Orden de Ho­nor Nacional al Mérito Autoral (INDAUTOR); mem­ber of the Educational Council (MIT); un laboratorio de la UAM-Atzcapot­zalco lleva su nombre, así como otro de la Escuela Prima­ria y Secun­daria Ann Sullivan (Edo. Mex.).
 The ceremony took place in the Information Center (Main Auditorium of INAOE), Tonanzintla, Puebla, Mexico. Here we see Adolfo after his graduation. About 80 M. Sc. students and 20 Ph. D. received also their degrees in this ceremony. Also Dr. José Franco, President of the Academia Mexicana de Ciencias, was awarded an honorary Ph. D. degree.


Short description of Adolfo Guzmán. 
Dr. Adolfo Guzman-Arenas is a Communica­tions and Electronics Engineer, from the Escuela Superior de Ingeniería y Mecánica y Eléctrica (Facul­ty of Electrical and Mechanical Enginee­ring) of the Instituto Politécnico Nacio­nal (IPN, or National Polytechnic Institute). He obtained his M. Sc. and Ph. D degrees from MIT.

      He has been Assistant Professor at the E. E. Dept., MIT; at the Dept. of Machine Intelligence of Uni­versity of Edinburgh; at the Centro de Investi­ga­ción y Estudios Avanzados del IPN. (Center for Research and Advanced Studies of IPN), where he founded the M. Sc. and Ph. D. programs in Computer Science; at the Instituto de Investi­ga­ción en Matemáticas Aplicadas y Sistemas, UNAM (Institute for Research in Applied Mathe­matics and Systems), where he was Head of the Computer Science Dept., and at UPIICSA (the Inter­disciplinary Unit) of IPN.

      He has been Director of the IBM Latin American Scienti­­fic Center. He has been Senior Member of the Technical Staff at MicroElectronics and Computer Corpo­ration (MCC); Vice president of Engineering at Interna­­tional Software Systems, and President and founder of SoftwarePro International, corpora­tions in Austin, Texas, this last devoted to develo­ping commer­­cial packages and Software Enginee­ring tools, the most recent being BiblioDigital©, a distributed digital library.

      In 1994 he received the National Prize in Infor­matics, from the Mexican Academy of Informa­tics. In 1996, from the hands of President Zedillo, he received the National Prize of Sciences and Arts and from his same hands, in 1997, the Lázaro Cárdenas Award.

      In 1996 he founded the Centro de Investiga­ción en Computación (CIC, or Center for Compu­ting Research) of IPN and directed it until 2002. In that year he was made Fellow of the Associa­tion for Computing Machinery (ACM), and in 2003-2006 he was member of the ACM Publica­tions Board. He is Life Member of IEEE (Institute of Electrical and Electronics Engineers). At CIC he works in the use of Artificial Intelligence for text analysis, knowledge representation, semantic proces­sing and application of information sys­tems. In 2007-2009 he took a leave of absence from CIC to head the Systems Unit of the Electoral Court (TEPJF).
     More at http://alum.mit.edu/www/aguzman
El Dr. José Franco (izq.), el Dr. Adolfo Guzmán (centro) y el Dr. Alfonso Carramiñana, Director General del INAOE, conversan con la hija del Dr. Guillermo Haro, fundador del INAOE, antes de la ceremonia de graduación.

Video (entrevista) a A. Guzmán, sobre su doctorado honoris causa

Red CUDI México. (11min, 2012). El INAOE conferirá el Doctorado Honoris Causa a Adolfo Guzmán Arenas. La ceremonia será el 9 de noviembre de 2012 en el Instituto Nacional de Astrofísica, Óptica y Electrónica, Tonanzintla, Puebla, México. El día 8 Guzmán impartirá una conferencia magistral en el Auditorio del Centro de Información del Instituto. Para ver el video, pulse aquí.

Software to address a severe emergency in a large city, caused by a big earthquake. Software para atender una contingencia severa causada por terremoto

RieSis, SOFTWARE PARA PROTECCIÓN CIVIL ANTE RIESGO SÍSMICO (terremoto en una gran urbe)
Los fenómenos geológicos e hidrometeorológicos se rigen por leyes todavía desconocidas en su mayor parte. Estos fenómenos afectan a la población mundial ubicados en zonas de peligro sin considerar normas de construcción ni las zonas afectables por inundaciones. Todos los países con frontera con el Cinturón de Fuego del Pacífico y los del Caribe, padecemos de tiempo en tiempo, terremotos. Hemos elaborado un “Plan Operativo anti Sísmico Protector de la Población” que describe las funciones y acciones que debe desarrollar el gabinete de un gobierno para atender y solucionar los efectos destructivos que un terremoto cause a sus habitantes. Este Plan Operativo supone 12 centros desde donde se girarían instrucciones, informes de avances, solicitudes de cantidades y especies, suministros, (sangre, medicamentos), entre otros muchos.
Las primeras horas después de un terremoto de gran magnitud, son cruciales. El tiempo y la preparación son decisivos para proporcionar una atención aceptable a la población afectada. Eso hace indispensable incluir la informática en el proceso, lo que automatizará el desarrollo de las múltiples actividades que deben implementarse simultáneamente. 
The geological and hydrometeorological phenomena are governed by laws still largely unknown. These phenomena affect the world population located in hazardous areas that did not consider considering building standards and flood affectable areas. All countries bordering the Pacific Ring of Fire and the Caribbean suffer from time to time, earthquakes. We have developed an "anti Seismic Operational Population Protector Plan" which describes the functions and actions to be developed by the city government to address and resolve the destructive effects that an earthquake will cause to citizens. This Operational Plan will be now embodied and supported by an on line software that will allow people to report damages, buildings affected, bridges collapsed, etc. At the same time, the autorities will be able to see in Google Maps the places affected, the help (volunteers, rescue elements, engineers, trucks, cranes...) sent, and the progress of the reaction to the emergency. Each site will have a cronological log (viewable via a browser), where the authorities and the people at large can see what is happening where, how progress is being achieved, and they can also add additional comments, pictures (taken from their mobile cell telephones or from their laptops or digital cameras).

The first hours after a major earthquake, are crucial. The time and preparation are critical to provide acceptable care to the affected population. That makes it essential to include the information in the process, which will automate the development of multiple activities to be implemented simultaneously.
Proponemos construir el software RieSis, necesario para apoyar al Plan Operativo. En general, RieSis proporcionará comunicaciones efectivas entre los doce grupos de trabajo (Detección, Evaluación, Salvamento, Atención Hospitalaria, Refugios Temporales, Restablecimiento, Seguridad Pública, Adquisiciones de emergencia, Abasto (logística), Consejería Jurídica, Administración, Comunicación Social), el personal en campo y los puestos de mando secretariales (de las secretarías de gobierno), estatales, municipales, y con los del ejército, además de salvaguardar y administrar los datos sobre recursos, personas y daños, y llevar control del flujo de la atención al siniestro. RieSis estará localizado en un Centro de Control, su diseño será distribuido (en varias plataformas informáticas) para tener mayor comunicación con los grupos de trabajo e informantes (incluyendo a los Coordinadores de Sitio), y para redundancia. Los informantes (de daños, víctimas, rescatistas, grúas…), incluyendo personas espontáneas ingresarán información vía Internet. RieSis mostrará los sitios (y sus condiciones, estado, víctimas…) afectados mediante una interfaz gráfica, accesible a cualquier persona en Internet.
RieSis es un proyecto que hemos terminado y entregado (diciembre 2014) en el Centro de Investigación en Computación del IPN, auspiciados por el Instituto de Ciencia y Tecnología del DF (Ahora, Secretaría de Ciencia, Tecnología e Innovación del DF).
RieSis is a finished project, built at the Centro de Investigación en Computación del IPN and sponsored by ICyTDF.
The image shows places with wounded people, as the result of a severe earthquake.
En la prensa nacional:
"Construyen en el CIC-IPN software para ayudar a atender en una gran ciudad los efectos de un sismo desastroso". GACETA IPN, 24 feb. 2012.
"Trece mil cámaras nos vigilan" Mi nota en La Crónica, 15 feb. 2012.
"Cámaras del bunker revisan en 5 minutos el DF, tras sismo". El Universal, 13 dic. 2011.Revisión manual de las cámaras. 
"Conoce el búnker más grande de América Latina". El Universal, 15 de marzo de 2012.
"Software para apoyar la atención a una contingencia sísmica severa" Mi nota en La Crónica, 4 de mayo de 2011.
Videos sobre RieSis:
Para ver una entrevista sobre RieSis (4min, 30jul2015), pulse aquí.
Un video más largo (34min, 2014) sobre RieSis: pulse aquí
Manuales sobre RieSis:
Manuel del usuario (16MB), pulse aquí. Manuel de referencia (20MB), pulse aquí.


The image shows the initial log of "San Simon", a place in Mexico City that was damaged. A picture of the building partially collapsed was entered into RieSis by a bystander using his digital camera. Later, the Site Coordinator (that coordinates the help at the site) arrived, and it has begun to register victims. One of them is Pedro Lopez, with his left arm broken. Pedro was given a brazalet with bar code, for easy identification, and his picture was taken and entered into the blog, so that his relatives or friends can see his status and location.

Integrantes del Proyecto RieSis, agosto 2012

Parados, de izquierda a derecha, Pte. Eduardo Godínez Ortinez, Act. Jorge Viera Haro, Pte. Cristóbal Solís Patrón. Sentados, Ing. Luis Wintergerst Toledo, Adolfo Guzmán Arenas. En agosto 24, 2012, concluyó Cristóbal su estancia "Veranos de la Ciencia" en RieSis (CIC-IPN), bajo el auspicio de la Academia Mexicana de Ciencias. El Proyecto RieSis está descrito más abajo, ver "Software para una contingencia severa causada por terremoto"

Paralelización de un subconjunto de consultas SQL con unión natural utilizando una GPU

En su tesis de Maestría (CIC-IPN, junio 2012), Ángel Omar Cervantes Ramírez paraleliza una consulta formada por la unión natural de dos tablas (de base de datos relacionales), usando el procesador gráfico de una computadora convencional (PC), de escritorio. Pulse aquí para descargar su tesis.

Resumen.
El cómputo paralelo siempre ha tenido una gran variedad de aplicaciones, lograr paralelizar tareas que en un principio son de ejecución secuencial representa un nuevo reto. Si se analiza el problema a resolver y se desarrollan estrategias correctas, la recompensa resulta ser satisfactoria, se obtienen tiempos de respuesta más cortos para el mismo trabajo, solo que ahora dicho trabajo es atendido por un conjunto de unidades de procesamiento trabajando al mismo tiempo. Hoy en día, existe una novedosa plataforma para desarrollar cómputo paralelo, aunque es una tecnología relativamente de reciente desarrollo ha tenido muchas aplicaciones con buenos resultados en áreas tan diversas que llama la atención y motiva a buscar nuevas nichos de aplicación. La tecnología en cuestión, es el GPU-Computing, o computo paralelo sobre una tarjeta de video.
En este trabajo aplicamos el GPU-Computing sobre el área de las bases de datos. Basándonos en el plan de ejecución real del manejador de bases de datos SQLite, las operaciones de resolución de dicho manejador fueron reprogramadas en la plataforma de desarrollo CUDA para poder procesar las mismas instrucciones dentro de una GPU. De esta forma, obtuvimos un motor de búsqueda capaz de resolver un subconjunto de operaciones del lenguaje SQL mediante cómputo paralelo (concretamente consultas unitabla, multitabla y operaciones de agregación). Este motor de búsqueda en paralelo se apoya en el manejador SQLite, pero obtiene tiempos de respuesta más rápidos para las consultas que es capaz de resolver. Además de reprogramar el plan de ejecución, se atendieron los problemas propios que el paralelismo implica, tales como, administración eficiente de la memoria, distribución equitativa de la carga de trabajo entre todas las unidades de procesamiento, y una coordinación controlada para la recuperación de los resultados.

Abstract.
Parallel computing has always had a wide range of applications, achieve parallelize tasks that originally are sequential execution represents a new challenge. If we analyze the problem to solve and develop the right strategies, the reward is satisfactory, you get shorter response times for the same job, only now that work is served by a set of processing units. Today, there is a new platform for developing parallel computing, although it is a relatively newly developed technology has had many successful applications in such diverse areas that attracts attention and motivates to seek new niche applications. The technology in question is the GPU-computing, or parallel computing on a video card.
In this paper we apply the GPU-Computing on the databases area. Based on the actual execution plan engine SQLite databases, its resolution operations were reprogrammed in the CUDA development platform to process the same instructions but in a GPU. Thus, we obtained a search engine capable of solving a subset of SQL operations through parallel computing (specifically unitable queries, multitable queries and aggregation operations). This parallel search engine is based on the SQLite, but you get faster response times for queries that is able to solve. In addition to reprogramming the execution plan, were attended to the problems inherent parallelism implies, such as efficient memory management, equitable distribution of workload among processing units and controlled coordination for recovery results.

Sistema de extracción y representación del conocimiento a partir de documentos descriptivos

En su tesis de Maestría (CIC-IPN, Junio 2012), Gabriela López Yebra nos dice cómo hacer ontologías (estructuras semánticas) a partir de documentos en español que describen cosas concretas. Pulse aquí para descargar un artículo sobre este trabajo.

Resumen:
Se presenta un método basado en búsqueda de patrones en textos y un sistema de reglas para encontrar relaciones ontológicas en documentos descriptivos de objetos concretos del mundo real escritos en lenguaje natural.
Se desarrolla una adaptación del método de búsqueda de patrones para agregarle un sistema de reglas que permite que las relaciones encontradas se extiendan a relaciones específicas buscadas dentro de un documento.
Se utilizan técnicas de análisis de lenguaje natural para procesar el texto, posteriormente se encuentran las relaciones buscadas en base a un archivo de reglas y se genera una salida en lenguaje OM.
Las pruebas se realizan en el idioma español, sin embargo es posible extender el método a cualquier idioma.

Abstract:
The document presents a method based on finding patterns in text and a set of rules to find ontological relations in descriptive documents for specific real-world objects, such documents are written in natural language.
It develops an adaptation of the pattern search method to add a rule system that allows the method to find extra relationships.
The use of natural language processing tools enables the system to find relationships based on a defined rules file, the relations found are then represented in OM language for ontologies.
The tests are performed in Spanish, but it is possible to extend the method to any language.

Ya apareció nuestro libro "Arañas Distribuidas"

Arañas distribuidas. Asignación efectiva de trabajo.  Búsqueda automática de información y documentos en Internet evitando duplicidad de esfuerzos.  Editorial Académica Española. Para adquirirlo, pulse aquí.

Distributed crawlers. Effective assignment of work. Automatic search of information and documents in Internet, avoiding duplication of efforts. To buy it, click here.

La computación desde sus inicios, como en la actualidad, es utilizada como una herramienta que le ayuda al hombre a resolver problemas de su vida diaria. En este trabajo nos enfocamos a hallar y recuperar documentos que yacen en la Web, por medio de programas que los localizan y los recuperan, a texto completo. Estos programas (llamados arañas, o crawlers en inglés) pueden ser instalados en una o varias máquinas. En este último caso se coordinan entre sí para evitar duplicar (o sextuplicar, si se instalaran en seis máquinas) esfuerzos. Un documento se recupera una sola vez, aunque varias arañas se “topen” con él. Un Web crawler es un programa que inspecciona de manera metódica y automatizada las páginas de la Internet. Para un Web crawler es sumamente importante no duplicar trabajo, pues una dirección URL duplicada puede originarle perder varias horas o incluso días de trabajo ya que otra de sus tareas es extraer direcciones URL incluidas dentro de ella y procesarlas de igual manera. El presente trabajo muestra la definición de una arquitectura que resuelve el problema de duplicidad y optimiza el espacio asociando a cada página web 4 de los principales temas de los que trata.

Construcción de una herramienta para la identificación y resolución de pronombres (anáforas) en una oración


Objetivo. Construir un identificador de anáforas directas de un texto en lenguaje natural, que sustituya dichos elementos del texto por otros equivalentes para facilitar el manejo del mismo.
 Objetivos particulares. Crear una herramienta que identifique las referencias anafóricas directas en un texto etiquetado, resuelva la referencia y remplace la ocurrencia con el sustantivo al cual apunta. Para probar la herramienta se tomarán como ejemplo documentos de la Web, en los cuales se remplazarán las anáforas directas por los sustantivos a los que se hace referencia.
 Autores de esta tesis de licenciatura (ESCOM-IPN): Toledo Gómez Israel; Valtierra Romero Eric.

Introducción. En este trabajo se ha planteado resolver una parte del problema que surge al profundizar en el campo de lo que se denomina “referencias temporales” en el texto, de la necesidad de contemplar y tomar en cuenta diversos aspectos que participan en la configuración semántica que conlleva a su resolución; función referencial, dispositivo enunciativo, semántica veri-condicional, temporalidad y modalidad, restricciones discursivas, etc. Al proporcionar una herramienta que identifique y resuelva referencias anafóricas directas (pronominales) de forma automatizada.
Resumen. Se describe la investigación que conlleva el resolver las anáforas directas del español. El método utilizado emplea un etiquetador libre que es producto de un trabajo terminal relacionado al propio proyecto de investigación.
 En la investigación se encontró la necesidad de modificar el resultado devuelto por el etiquetador para poder obtener además del etiquetado, una enumeración de las palabras para identificarlas de manera única y de esta manera manipular su posición dentro del texto original y con esto poder resolver las referencias anafóricas directas por medio de la manipulación del contexto, uso de lingüística y gramática.
El texto completo de la tesis puede obtenerse pulsando aquí.
El video (parte 1) que describe el trabajo puede obtenerse o verse pulsando aquí.
El video (parte 2) que describe el trabajo puede obtenerse o verse pulsando aquí.



Sugerencias para colaborar en proyectos europeos de investigación

En estas transparencias doy algunas sugerencias y puntos a considerar cuando se desea colaborar con universidades e instituciones europeas, en proyectos de investigación, de desarrollo tecnológico y de ata tecnología, en especial de computación.

Pulse aquí para descargar las transparencias.

Uso de marcos para la desambiguación de preposiciones


 Diana Villanueva , Escuela Superior de Cómputo (ESCOM) del Instituto Politécnico Nacional, (IPN)] juki_dp@hotmail.com,  
Alma-Delia Cuevas-Rasgado, Instituto Tecnológico de Oaxaca, almadeliacuevas@gmail.com,  
Omar Juárez, ESCOM-IPN, omarjg82@gmail.com,  
Adolfo Guzmán-Arenas, Centro de Investigación en Computación del IPN, a (punto) guzman (arroba) acm (punto) org

Resumen- En Procesamiento de Lenguaje Natural (PNL), la desambiguación es el procedimiento para resolver conflictos con nombres de conceptos que son polisémicos (tienen distinto significado), de hecho, la desambiguación de frases es un problema que no se ha resuelto totalmente en PNL. Existen diversos tipos de desambiguaciones por ejemplo la desambiguación de sustantivos (la palabra camisa tiene distintos significados 1) como prenda de vestir que cubre del tronco hasta la cadera o medio muslo, 2) piel seca que se desprende periódicamente de la serpiente, membrana fina que cubre algunos frutos y legumbres, 3) cubierta suelta de papel con que se protege la portada de un libro, 4) revestimiento de un artefacto o pieza mecánica), de verbos (lavar tiene varios significados limpiar una cosa mojándola o empañándola con agua u otro líquido, quitar el pecado o defecto moral, en minería se refiere a purificar un minera por medio del agua, dar color o sombras a un dibujo con tinta diluida en agua), mezcla de sustantivos y preposiciones (sobre) por citar algunos. 

     El  presente artículo describe la implementación de un algoritmo para desambiguar las preposiciones de una oración, algunas preposiciones son: a, ante, bajo, cabe, desde, contra, en, por, según, sin, entre, so, con, hacia, sobre, hasta, de,  tras, para. Esta herramienta se utilizará en un analizador de textos (en construcción)  que convierte un documento de texto en lenguaje natural a su correspondiente representación de ontologías. Todo lo anterior con la finalidad de que a futuro un programa pueda acceder a la información de esta ontología contestando preguntas en lenguaje natural solicitadas por un usuario (proyecto Uso de Marcos para convertir Texto a Redes Semánticas, actualmente en desarrollo).

Palabras Clave- Métodos Heurísticos, Inteligencia Artificial, Procesamiento de Lenguaje Natural, Análisis de Texto. 

Para descargar el artículo de Diana Villanueva Palacios, ESCOM-IPN, pulse aquí.
Pulse aquí para ver el video de Diana explicando el funcionamiento y uso de su desamabiguador de preposiciones del idioma español.

Las bibliotecas personales de José Luis Martínez, Antonio Castro Leal y Jaime García Terrés

Estas bibliotecas personales fueron donadas a CONACULTA; se encuentran en el Patio de Escritores de la Ciudadela, Plaza de la Ciudadela 2 y Balderas, México DF. Invitado por la Lic. Consuelo Sàizar, Directora de CONACULTA, Adolfo Guzmán Arenas estuvo en la visita. 9 de mayo de 2012. En la imagen aparece ella acompañada del Lic. Joaquín Díez-Canedo Flores, Director General del Fondo de Cultura Económica (FCE).

Columna mía sobre computación y aplicaciones, en LA CRÓNICA


El Consejo Consultivo de Ciencias publica semanalmente una columna sobre ciencia en LA CRÓNICA, en la Sección Opinión. Aquí presento mis columnas sobre computación y sus aplicaciones. Pulse el título del artículo para descargarlo.
Uno de los creadores de la Inteligencia Artificial muere. Marvin Minsky. 
Trece mil cámaras de video nos observan en las calles del DF.  Cómo sacarle mayor provecho, usando software, a la gran inversión ya hecha.
Cuando las máquinas entiendan lo que leen Cuando respondan preguntas sobre los documentos que han leído.
Software para apoyar la atención a una contingencia sísmica severa  Conocer pronto los daños, ubicarlos, y administrar la ayuda ordenada por las autoridades.
La calidad del software y la certificación de su proceso de manufactura  Mitos, creencias y supersticiones sobre cómo medir la calidad del software.
Riesgos y desventajas de la Cédula Única de Identidad  La Cédula de Identidad Ciudadana (o la credencial para votar, conlleva ciertos peligros.
Ventajas de la cédula única de identidad  La Cédula de Identidad Ciudadana, anunciada en julio de 2009, presenta ventajas atractivas.
El programa Ciudad con conectividad y tecnología, del ICyTDF  Creado el 27 de abril de 2007, el Instituto de Ciencia y Tecnología del DF apoya el desarrollo de tecnología y aplicaciones de computación y comunicaciones digitales...
¿Qué son los dispositivos lógicos programables, y para qué sirven? Acceder al artículo en LA CRÓNICAAcceder al artículo en academia.edu

Algunos temas de tesis con la red de videocámaras del DF

Propuestas para temas de tesis en computación. Visión por computadora, cámaras de video instaladas en las calles, avenidas y espacios públicos de la Ciudad de México. Trece mil cámaras nos vigilan. Pulse aquí para obtener Presentación en powerpoint.Hay trece mil cámaras operando en los espacios públicos y en el Metro de la Ciudad de México. Todas se vigilan manualmente. En el Instituto Politécnico Nacional (UPIICSA) hay un laboratorio que es parte del sistema.

Tema 1. Detección de imágenes anómalas. Ejemplo: la barda de enfrente desaparece. La calle se llena de humo. Hay fuego visible. Personas corren desaforadamente.
Tema 2. Detección de calles bloqueadas y su señalización en mapa de Google Maps.  Congestionamiento, estado del tráfico, circulación lenta, calles saturadas.
Tema 3. Mapa en tiempo real (en Google Maps) de la congestión de las vías públicas.
Tema 4. Detección y señalización (en mapa de Internet) de problemas de tránsito.
Tema 5. Detección y señalización (en mapa de Internet) de eventos naturales. Áreas inundadas, árboles caídos, anuncios espectaculares caídos, postes de teléfono, de luz, derribados.
Tema 6. Detección y señalización en mapas de Google Maps de eventos humanos. Tumultos. Manifestaciones, marchas. Celebrciones. Mítines.
Tema 7. Detección y señalización sobre mapas visibles en Web de eventos sobre seguridad. Abandono de bultos y objetos sospechosos en vías públicas. Imágenes de quiénes lo hicieron, y a qué horas. Vehículos que ya llevan varios días en el mismo lugar. Indigentes, borrachos que duermen en la acera (o personas muertas).
Tema 8. Detección y señalización en mapas de Internet de edificios caídos y sitios dañados (por un terremoto o explosión, por ejemplo).
Tema 9. Detección y señalización en mapas en línea de caravanas y convoyes de vehículos.
Tema 10. Seguimiento de un vehículo y su señalización en mapa de Internet.
Tema 11. Seguimiento de personas.

Automatic building of an ontology from a corpus of text documents using data mining tools

Israel Toledo, Gilberto Martínez-Luna, Adolfo Guzman-Arenas. 
How to find new knowledge by examination of a body of English documents.

ABSTRACT In this paper we show a procedure to build automatically an ontology from a corpus of text documents without external help such as dictionaries or thesauri. The method proposed finds relevant concepts in the form of multi-words in the corpus and non-hierarchical relations between them in an unsupervised manner. Click here for full document.

RESUMEN En este artículo mostramos un procedimiento para construir automáticamente una ontología a partir de un corpus de documentos de texto sin ayuda externa tal como diccionarios o tesauros. El método propuesto encuentra conceptos relevantes en forma de frases temáticas en el corpus de documentos y relaciones no jerárquicas entre ellos de manera no supervisada.

Aprendizaje de protocolos ASTM para equipos clínicos (análisis de laboratorio)

     Esta tesis de maestría de Juan Rivero Mercado construye (automáticamente) protocolos de comunicación para equipos clínicos (equipos para análisis de muestras humanas, como sangre, orina...). Un "protocolo de comunicación" es un programa de cómputo necesario para interconectar un (nuevo) equipo clínico con el software o interfaz de usuario del laboratorio o sitio donde se llevan a cabo estos análisis. Dado un equipo clínico que se desea conectar, el software que presenta Juan construye el protocolo de comunicación necesario, fijándose en protocolos similares y haciendo varias pruebas (con la ayuda del equipo o de un simulador) hasta que se obtiene un protocolo exitoso, o el método falla. Aún en este caso, se obtiene un protocolo parcialmente exitoso. La ventaja de este método es su rapidez: unos diez minutos, comparado con varias semanas de trabajo de un programador que desee construir el protocolo manualmente. Pulse aquí para obtener la tesis completa.
     The present research aims to develop a system capable of reducing time and money to companies active in this area. Specifically, lacking a protocol for a given laboratory equipment, the system presented here will build the protocol automatically, eliminating the need for manual preparation.
     The solution offered in this research is a learning engine that produces communication protocols; learning takes place based on the responses received by the clinic team, adapting and rebuilding the communication scheme. The learning system has a database of features that describe parts of the communication ASTM E1394-97, the individual parts are mutated according to the response and the stage of the workflow of the clinical equipment.
     During the tests we obtained two tables of measures of success: the first indicates the percentage of successful learning, the second shows the percentage of success with respect to speed.
     The results indicate that the success and development time of the communication protocol is far greater than the time it takes for a developer to perform the same task.