Utiliza y colabora
El proyecto Arxiversa es una prueba de concepto que se deriva del trabajo acumulado en el proyecto RECNETS I (2018-2022, financiado por el Ministerio de Ciencia y Competitividad) y en el proyecto Explorando cambios sociales silenciosos (2017-2019, financiado por la Fundación BBVA). Ambos sirvieron para afinar los procedimientos de transcripción automática y etiquetado XML de los libros del Oficio de Hipotecas de Girona, así como para desarrollar los procedimientos para estructurarlo en una base de datos. Cuando se hayan llegado a los dos libros de 1805, se habrán transcritos 104.718 imágenes referidas a un total estimado de 136.500 escrituras notariales.
Los resultados de la transcripción mantienen una relativa buena calidad, con una tasa de error en torno al 5% en lo que respecta a los caracteres y entre el 10 y el 15% en lo que respecta a las palabras, según el volumen. Estos errores son un poco más frecuentes en los topónimos y los antropónimos, dos datos críticos para la mayoría de los objetivos de investigación. Por este motivo, es importante que cualquier uso de los datos vaya acompañado de un proceso de supervisión y corrección inevitablemente manual.
El objetivo del proyecto ARXIVERSA y de esta plataforma web es crear un instrumento que permita que, al mismo tiempo que se consulta la base de documentos, se pueda realizar la depuración y corrección de las transcripciones. El segundo objetivo es invitar a todos los usuarios potenciales de la base a colaborar en este proceso de supervisión. Ofrecemos un trato de ganar-ganar que, al mismo tiempo que permite su explotación, también contribuye a la mejora de las transcripciones. Por este motivo, si estás interesado en acceder a la base, te pedimos que hagas la supervisión de aquellos documentos que utilices. La plataforma te permitirá leer la imagen original para comprobar la calidad de la transcripción e introducir las enmiendas que correspondan.
Durante el año 2023 también se organizarán varias campañas de colaboración con orientaciones específicas para extender esta demanda de colaboración al máximo de usuarios posible.