El reconocimiento óptico de caracteres (OCR), es un proceso dirigido a la digitalización de textos, los cuales identifican automáticamente a partir de una imagen símbolos o caracteres que pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos. Así se puede interactuar con estos mediante un programa de edición de texto o similar.

Esto permite preservar y hacer accesibles antiguos documentos impresos por imprentas o escritos con máquinas de escribir, posibilitando que los archivos originales sean guardados en armarios cerrados para evitar su destrucción o desgastes, ya que las personas pueden consultar copias digitales. Así también, pueden buscar, descargar, copiar, recortar, y pegar el contenido de estos documentos históricos.

La página española

prensahistorica.mcu.es/es/consulta/busqueda.cmd , de La Biblioteca Virtual de Prensa Histórica de España, es un ejemplo a seguir. Aparecen 42 páginas de San Juan de Cuyo, desde 1853 a 1914. En el mismo sitio web, se encuentra una mención del Terremoto de San Juan de 1894, el 27 de diciembre del mismo año, por el periódico español "El Guadalete", donde da una cifra exagerada de 12.000 muertos.

Por dar otros ejemplos, los libros de Diarios de sesiones de la Cámara de Diputados de la Nación, donde figura disputas históricas entre cantonistas, yrigoyenistas y conservadores, están digitalizados por la Biblioteca de la Región Sur de la Universidad de California.

Recientemente la historiadora francesa, Denise Anne Clavilier, encontró en el portal gallica.bnf.fr/accueil/?mode=desktop un documento inédito escrito en idioma francés por Domingo F. Sarmiento. Este recurso está ampliamente difundido en Europa como el resto del mundo y, muy especialmente, en Estados Unidos y Australia.

En la República Argentina, en especial la provincia de San Juan, su empleo es nulo. Su realización es sencilla. Se necesita un escáner, un software (Cognitive Open OCR, Simple OCR, Softi Free OCR) y personal que lo lleve a cabo. Si esto se concretara, sería una revolución cultural.

En conclusión, un porcentaje mínimo de la historia nacional argentina está informatizado por naciones extranjeras. Las preguntas obligadas serían las siguientes…Si otros países pueden utilizar el reconocimiento óptico de caracteres. ¿Por qué nuestros archivos nacionales, provinciales, municipales o eclesiásticos no lo utilizan?

 

 

Ricardo Sánchez, Profesor en informática.