Web Agency

Inventari digitali e archivi virtuali, l’applicazione dell’informatica umanistica alla documentazione storica della Sardegna

Alessandra Derriu

in n. 3/2011

 

Il progetto di ricerca, finanziato dalla Regione Sardegna, sostenuto dal Dipartimento di Storia dell’Università di Sassari e dalla Diocesi di Alghero Bosa, per agevolare la ricerca scientifica e l’innovazione tecnologica, ha lo scopo di applicare i moderni linguaggi digitali alla documentazione storico-archivistica dell’Isola.

Nell’ambito di tale progetto, è stato realizzato, sotto la guida della Soprintendenza Archivistica per la Sardegna, l’Inventario dell’Archivio del Capitolo Cattedrale di Alghero, che conserva documentazione in latino, castigliano, sardo e catalano dal XV al XX secolo, divisa in 69 serie per un totale di un migliaio di unità archivistiche, tra registri, volumi, filze, buste e fogli sciolti. La modesta consistenza delle unità, e di contro la complessità e l’importanza della documentazione, ha permesso di avere a disposizione un modello di inventario adatto alla sperimentazione. È stato elaborato un esempio di Inventario archivistico adeguatamente trattato a livello informatico per essere immesso on-line ed essere fruibile dal maggior numero di utenti, specialisti nel settore e semplici appassionati.

I files word dell’Inventario sono stati trattati con il linguaggio di codifica XML, un complesso di istruzioni, tags, che inseriti nel testo, danno la possibilità di arricchirlo con informazioni di tipo strutturale e semantico. Le parole marcate acquistano così significati aggiuntivi: per esempio una parola segnata dal tag toponimo, Roma, verrà identificata dal motore di ricerca come tale. Questi marcatori vengono introdotti nel testo seguendo delle regole e dei criteri che vanno stabiliti in fase di progettazione e che creano la DTD (document type definition), la grammatica in base alla quale si può codificare il testo. La possibilità di aggiungere queste informazioni semantiche, chiamate anche metadati, ha permesso di descriverne la struttura fisica, quale per esempio capitoli e sotto capitoli, e di fornire informazioni aggiuntive, struttura logica, alle parole prescelte. Sia l’operazione di creazione dei metadati che quella di inserimento di essi necessita di conoscenze che vanno dall’informatica alla materia di pertinenza del testo trattato, nel nostro caso nozioni storiche ed archivistiche. Per l’Inventario dell’Archivio del Capitolo di Alghero, che era già di per sé un contenitore di testo, si è proceduto a creare una struttura che lo rispecchiasse e ne esplicitasse le funzioni di “scatola di dati”. L’Archivio è stato per noi l’elemento “Madre”, il contenitore che genera altri contenitori “figli” e “nipoti”, come l’unità C del computer. Tutti i dati del computer sono memorizzati in questa singola unità in cui le cartelle e le sottocartelle, annidate, contengono parti di dati in una struttura logica di semplice gestione. Sfruttando questo meccanismo della nidificazione, che consente di incorporare un oggetto all’interno dell’altro, è stato possibile creare uno schema che mettesse in luce la composizione dell’Archivio in serie e il vincolo archivistico delle unità espresso attraverso la segnatura. La nidificazione, il vincolo tra “Madre”, “figli” e “nipoti”, è speculare a quello tra Archivio, serie e unità archivistica (registro, volume, foglio sciolto). È stata esplicitata la struttura dell’Archivio con i marcatori XML dichiarando nella grammatica gli elementi che lo componevano (es. Introduzioni, Capitoli, Serie, Schede), l’ordine che dovevano seguire (es. Capitolo prima di paragrafo) e la consistenza che potevano avere (es. uno, più di uno, infinita). È stato assegnata così alle parole una funzione di contenitore di testo, per esempio di capitolo piuttosto che di paragrafo. Per descrivere i contenuti del documento, come per la struttura, si è proceduto alla creazione di nuovi marcatori che, inseriti nel testo, ci hanno permesso di attribuire per esempio ad una parola il significato di istituzione, piuttosto che di antroponimo. Volendo indicare che la parola Bonifacio è un antroponimo abbiamo creato il marcatore con il quale identificare tutte le parole che sono antroponimi. Questa operazione permette di semplificare la creazione di applicazioni che svolgono operazioni intelligenti con i documenti elettronici, ovvero, un motore di ricerca sarebbe in grado di eseguire ricerche agevoli nel Web per trovare tutti i documenti in cui Bonifacio è marcato come un antroponimo nei nostri files XML. I metadati inseriti nel testo riguardano la sua struttura, le sue partizioni, le sue funzioni documentarie e i suoi contenuti. Le informazioni aggiunte in fase di codifica resteranno nascoste in fase di visualizzazione del testo. Si è scelto di dare molto spazio all’utilizzo di tags che predisponessero i testi per la costruzione automatica di indici. Il modello di codifica adottato segue tre linee guida, semplicità, adattabilità e flessibilità, concetti che hanno portato ad una grammatica che permettesse la creazione di documenti XML modello, facili da leggere, adattabili ad altri archivi e ad altre realtà di studio. Sono stati studiati gli standard di descrizione EAD ed EAC che costituiscono l'esplicitazione in formato XML della struttura descrittiva rispettivamente delle ISAD(G) e delle ISAAR(CPF). Il grande sviluppo di internet degli ultimi anni ha portato un interesse sempre maggiore verso questo strumento, per lavorare, comunicare, cercare informazioni. Attraverso la sua interfaccia coinvolgente, il World Wide Web è un mezzo diffuso in innumerevoli settori. La grande diversità dei servizi che deve fornire ha messo a dura prova però l’HTML il linguaggio creato per la visualizzazione dei dati più che per la loro caratterizzazione. Per risolvere questo problema è stato creato il linguaggio da noi adottato, l’XML, che è estensibile e permette ai progettisti di documenti di gestire fonti multiple di dati. L’ XML supporta un’ampia gamma di applicazioni, tra cui strumenti di creazione, motori per la visualizzazione di contenuti, strumenti di traduzione e applicazioni di database. La sua progettazione è rapida, e i documenti possono essere creati facendo ricorso a strumenti di semplice utilizzo, quali editor di testo normale. L’ XML permette poi ai singoli, a gruppi di persone o ad organizzazioni di creare il proprio linguaggio di markup, specifico per ogni tipo di informazione da trattare, ed è quindi utilizzabile per molte applicazioni e in diversi settori. La grammatica e lo schema di codifica creato utilizzano quindi un linguaggio che permette la facile condivisione dei dati in ambiente informatico e la creazione di innumerevoli files simili. La definizione formale digitale che è stata concepita è uno standard per la rappresentazione di inventari archivistici, un prodotto che si propone come modello per altre successive codifiche di documenti affini. I files XML, pronti ad essere immessi on line, con la loro grammatica, anch’essa a disposizione del mondo scientifico, sono predisposti per essere utilizzati per diversi tipi ti ricerca. Attraverso l’inserimento dei tags nel testo, oltre a pubblicare e condividere il documento, si provvede a mettere a disposizione dell’utenza moltissime informazioni che a livello cartaceo non è possibile fornire. I testi che abbiamo trattato, arricchiti dalle nuove informazioni dei metadati si mostrano nella loro struttura fisica e nei loro contenuti permettendo indagini su informazioni prestabilite, leggibili da qualunque motore di ricerca, su antroponimi, toponimi, date, cariche, istituzioni, lingue straniere. (Progetto finanziato dalla Regione Sardegna con legge regionale del 7 agosto 2007, n. 7 “Promozione della ricerca scientifica e dell’innovazione tecnologica in Sardegna”. Responsabile scientifico del progetto prof.ssa P.F. Simbula del Dipartimento di Storia dell’Università degli Studi di Sassari. Per la Diocesi di Alghero-Bosa referente don Antonio Nughes)


     Scarica il file DIGITAL_Derriu Alessandra ALL.pdf

Fondazione Ansaldo