Reparar, recuperar y revelar, la IA aplicada a los archivos del horror.
por Roberto González (*)/Wired/Red Latina sin Fronteras.
En Uruguay, Argentina y Chile, guardianes de archivos históricos y expertos en tecnología están uniendo fuerzas para hacer accesibles y analizables millones de folios producidos durante las dictaduras de hace medio siglo.
En abril de 2024 se llevó a cabo una reunión entre científicos de datos, ingenieros, informáticos y familiares de personas desaparecidas de Argentina, Chile y Uruguay para discutir un tema de relevancia no solo histórica, sino historiográfica: el uso de la tecnología para analizar los archivos documentales de las dictaduras por las que atravesaron dichos países hace medio siglo.
Fue la primera reunión de ese estilo que se ha llevado cabo en el cono sur. La sede fue en Montevideo. Ahí, investigadores de la Universidad de la República de Uruguay presentaron una metodología nueva para extraer información de una serie de documentos elaborados hace décadas por el Organismo Coordinador de Operaciones Subversivas (OCOA); un órgano, comandado por el ejército que se encargó de la persecución, captura y tortura de disidentes políticos desde 1972 y hasta al menos 1975.
Esta metodología, descrita en un artículo académico publicado en agosto durante la Conferencia Latinoamericana en Informática 2024, está enfocada en resolver un problema común a la hora de analizar archivos antiguos: muchos de ellos están en formatos que dificultan su estudio.
Las fichas de la OCOA analizadas en esta investigación son imágenes extraídas de algunos de los rollos de microfilm que conforman el Archivo Berrutti. Muchas son copias de documentos llenados a mano o con máquina de escribir. Esto dificulta enormemente operaciones tan sencillas como buscar el nombre de una personas cuya detención bien podría estar registrada en algún documento del archivo.
Antes de este proyecto, miembros de colectivos como Madres y Familiares de Uruguayos Detenidos Desaparecidos (Famidesa) tenían que pasar horas leyendo cada ficha y extrayendo información manualmente. Tal fue el caso de Ignacio Errandonea Goicochea, quien llenó al menos dos cuadernos de notas al intentar estudiar el millón de folios del Archivo Berrutti.
Para abordar el reto de hacer del archivo más manejable y, sobre todo, inteligente, Mateo Nogueira, ingeniero en computación y autor líder de la investigación, primero desarrolló un algoritmo para diferenciar entre las las secciones en blanco de las fichas y las que contuvieran información.
Una vez identificadas las secciones, otro algoritmo se encargó de clasificarlas, diferenciando, por ejemplo, entre los apellidos paterno y materno de las víctimas. Además, a través de este algoritmo, se identificó la nacionalidad de las personas, así como estado civil, domicilio, ocupación y otras características.
Finalmente, usaron distintas herramientas de reconocimiento óptico de caracteres (OCR), que ayudan a transcribir documentos impresos a un formato más similar al de los documentos de texto de Word. El programa que tuvo un mayor nivel de éxito en transcribir correctamente las fichas fue el software de código abierto Calamari. Sin embargo, los mejores resultados se obtuvieron después de que Mateo y sus colegas hicieran ajustes para que la herramienta se adaptara mejor al tipo de caracteres que estaba leyendo.
Durante cada etapa de la metodología, Mateo hizo pruebas con tal de medir la efectividad de las distintas herramientas. Para ello, él y su equipo iban tomando muestras de los rollos de microfilm y cotejaron cuánta información se extraía correctamente a través de la cadena de algoritmos.
Al evaluar la identificación de secciones de fichas, el nivel de éxito fue del 95%. La clasificación de secciones tuvo el mismo porcentaje de precisión global. El reconocimiento de caracteres tuvo más errores antes de recibir entrenamiento por parte del equipo de investigación. Sin embargo, tras las correcciones, el nivel de éxito aumentó considerablemente. De una muestra de 99 documentos, Calamari hizo 89 transcripciones correctas, sin embargo, tras la corrección y ajustes, el número aumentó a 95.
Después de todo ese trabajo, Mateo obtuvo su grado de maestría. Por su parte, las personas interesadas en revisar los documentos de la OCOA ahora contarán con un buscador que les ahorrará horas de revisión manual de documentos
La tecnología al servicio del archivo en América Latina
El trabajo de Mateo no es el único de su tipo. En la Universidad de la República compañeros suyos han estado trabajando en otros aspectos de los archivos de la dictadura como parte del proyeto Cruzar, una iniciativa lanzada en 2018, en que docentes y alumnos de las facultades de Información y Comunicación, por un lado, y la de Ingeniería, por otro, se unieron en la tarea de sistematizar la información de los archivos de la dictadura.
Un ejemplo de estos esfuerzos lo ofrece Gregory Randall, profesor de la Facultad de Ingeniería y asesor de Mateo. Alumnos suyos, a quienes no dirigió, desarrollaron una herramienta para reconocer los distintos sellos con los que las fuerzas represivas timbraban sus documentos, de tal forma que, con identificar la estampa, pueden saber de qué organismo provino una hoja.
El caso de Argentina
Fuera de Uruguay, también existen proyectos similares que buscan aprovechar la tecnología para el análisis de archivos de las dictaduras. Una de las alianzas con más trayectoria es la del Archivo Provincial de la Memoria con la Universidad Nacional de Córdoba (UNC), en Argentina.
En 2014, Marcelo Yornet estaba al frente del área de informática de este archivo, cuya tarea es resguardar los documentos producidos durante la dictadura argentina. Ese año, se aliaron con la Facultad de Matemática, Astronomía y Física de la Universidad Nacional de Córdoba “para desarrollar investigaciones alrededor de procesamiento de lenguaje natural y algunas otras técnicas de lo que hoy llaman inteligencia artificial”.
Con estas herramientas hicieron una labor similar a la de Mateo, pero con una serie de documentos llamada Boletines Reservados del Ejército Argentino. De ahí, extrajeron información que les permitió reconstruir los movimientos de las tropas durante la dictadura. Esto abrió vetas de investigación para averiguar quiénes estaban presentes durante las acciones de represión.
Análisis en Chile
Por otro lado, en Chile, el colectivo Nuestra MemorIA (por inteligencia artificial) reúne a seis investigadores –tres de ciencia de datos y tres de ciencias sociales– para abordar retos como el de OCR y el reconocimiento automático de voz. También están trabajando en el reconocimiento de personas y organismos mencionados en archivos. También buscan identificar acciones llevadas a cabo por autoridades, tales como llevar a alguien preso. Además, están trabajando para lograr análisis de fotografías y reconocimiento facial para aplicarlo a archivos de la dictadura chilena.
Domingo Mery, científico de datos y uno de los miembros de esta iniciativa, recuerda que la idea surgió tras un café con su colega abogado Hugo Rojas. “Me decía que había mucha necesidad de hacer ciencia de datos con los archivos de la memoria, que hay mucha información y que hoy en día es prácticamente todo manual”, recuerda el investigador de la Universidad Católica de Chile.
A partir de ahí, buscaron alianzas con organismos que resguardan los archivos de la dictadura chilena, como el Centro de Documentación del Museo de la Memoria y los Derechos Humanos. Su objetivo fue desarrollar herramientas que sirvieran a personas como María Luisa Ortíz y Walter Roblero, quienes trabajan en dicho centro.
Domingo destaca, por ejemplo, una plática en la que Walter le aseguró que en una película llamada La Batalla de Chile iban a encontrar imágenes de personas que fueron desaparecidas después de que fuera filmada. El investigador y archivista le entregó la fotografía de alguien que creía haber visto en dicho documental, y tras horas de analizar fotograma tras fotograma con algoritmos de reconocimiento facial, dieron con el rostro.
Las dictaduras en América Latina
Tanto Uruguay, como Argentina y Chile son algunos de los países que en la década de los setenta fueron marcados por una operación transnacional liderada por Estados Unidos conocida como el Plan Condor, cuyo objetivo fue eliminar disidencias políticas de izquierda. Durante este periodo, organismos represores de las dictaduras secuestraron, torturaron, violaron, asesinaron y desparecieron a personas con motivo de sus inclinaciones políticas.
Debido al alcance regional de este periodo de violencia, los investigadores de estos tres países coinciden en la importancia de que las nuevas tecnologías habiliten la cooperación en el análisis de sus archivos históricos.
“Una herramienta que permita avanzar en la lectura y en la investigación de archivos de las otras dictaduras nos va a ayudar inclusive en la búsqueda nuestra”, explica Ignacio Errandonea.
Su hermano, Juan Pablo Errandonea, es uno de los muchos desaparecidos cuya historia empieza fuera del Uruguay: “Mi hermano desapareció en Buenos Aires en septiembre de 1976. Se supone que lo trasladaron para acá, para Uruguay, y no sabemos más nada de él”, añade.
Un problema de presupuesto
Aunque los alcances de esta tecnología son prometedores, los investigadores se enfrentan a varias limitaciones en su trabajo. Por ejemplo, el proyecto Cruzar está obligado a usar únicamente software que puedan correr de manera local en sus computadoras, sin enviar a la nube documentos del archivo, los cuáles siguen siendo confidenciales.
Sin embargo, Gregory Randall agrega que “también hay motivos económicos. Casi todas estas herramientas que trabajan en la nube son de paga. Puede haber acuerdos, pero al final es mucha plata. Eso no tenemos”. Aunque el proyecto Cruzar surge de un acuerdo con el gobierno uruguayo, Randall explica que ni él ni sus alumnos reciben un financiamiento extra por formar parte de dicha iniciativa.
El equipo de Nuestra MemorIA también se enfrenta a limitaciones económicas, y actualmente busca financiamiento para avanzar sus investigaciones.
Por su parte, para Ignacio Errandonea el límite más drástico de los avances tecnológicos es el acceso a la información. Él considera que las herramientas que se están desarrollando, “desde el punto de vista de la búsqueda de los desaparecidos, hoy por hoy, no nos aporta mayormente. Por más que le pongas herramientas hasta que no surjan nuevas informaciones, no vamos a avanzar.”
Actualmente, el Archivo Berrutti cuenta con 1,500 rollos de microfilm. Sin embargo, Ignacio explica que en la numeración de los rollos han encontrado cifras que rebasan los 3,000, por lo que actualmente se encuentra incompleto. “lo que falta fundamentalmente es la parte operativa. Esa no la han entregado las fuerzas armadas”, añade.
En Chile, María Luisa Ortíz destaca la ausencia de los archivos producidos por los servicios de inteligencia. “Han sido sistemáticamente negada la existencia de esos archivos, por lo tanto no han sido recuperados. Se esgrime que han sido destruidos, que no hay huellas de ello”.
Por su parte, Marcel Yornet describe los archivos con los que ha trabajado como “colaterales”, y destaca la ausencia de aquellos documentos que fueron centrales en la descripción de la represión en Argentina.
En países que no atravesaron una dictadura, aunque sí vivieron hechos históricos violentos, como el conflicto armado en Colombia o la guerra sucia en México, también hay vacíos de información.
Por ejemplo, Andrea González, quien trabajó en el área de Análisis de Datos de la Comisión de la Verdad en Colombia, explicó en entrevista con WIRED que el Ministerio de Defensa y las Fuerzas Armadas se negaron a proporcionar información solicitada.
Pese a ello, Ignacio Errandonea considera que el potencial de estas herramientas sigue siendo importante. “Quizá cuando podamos tener los rollos de la parte operativa, ahí sí se pueda avanzar”.
(*) Roberto González es colaborador en WIRED en Español y periodista de ciencia independiente en Ciudad de México. Cubre principalmente la intersección entre salud y conflictos medioambientales, con enfoque en América Latina y el Caribe. Su trabajo ha aparecido en español e inglés en Science Magazine, Eos de la AGU, New Scientist, SciDev Net, entre otros.
Fuente: https://es.wired.com/articulos/archivos-de-las-dictaduras-de-america-latina-renacen-con-ayuda-de-ia
Link enviado a CT por Red Latina sin Fronteras.
Descubre más desde Correo de los Trabajadores
Suscríbete y recibe las últimas entradas en tu correo electrónico.
Be the first to comment