Antiche scienze informatiche

Nuove tecnologie informatiche per l'orientalistica antica: uso e valore

Rizza Alfredo

Riproduzione di una tavoletta di Boğazköy contenente la versione bilingue hattico-etea del mito del dio-luna che cade dal cielo.

Prima parte
Scienze umane e informatica L'orientalistica e l'informatica Panoramica web
Seconda parte
Il nodo essenziale CAANES

Parte prima

Scienze umane e informatica

Cosa fa l'informatica agli scienziati "umani"?

Apprendimento ed ingegno sono ciò che indubitabilmente e necessariamente costituiscono il processo d'uso di tecnologie informatiche. Le scienze umane, ma non solo quelle, in verità, sono contraddistinte da un modo di ragionare che potremmo definire ipotetico, incerto, sempre bisognoso di revisioni; anche, in modo particolarmente interessante, per certi aspetti, diagnostico. Il ragionamento diagnostico [cfr. L. Magnagni, Ingegnerie della conoscenza, Marcos y Marcos, Milano, 1997] è forse quello che meglio fa risaltare due fra i fondamentali poli della questione: il concetto di "controllo" e quello di "creatività ". Non solo, presenta la ricerca scientifica come un'arte di "risoluzione di problema". Affrontare un problema significa assieme cercare di risolverlo e proporre delle tecniche di ragionamento per condurre con maggior precisione la ricerca alle soluzioni più¹ adeguate. Ma cosa ci guida in una ricerca? Non potendo fare dell'epistemologia "vera" stilo solo alcune banalità (che è sempre meglio almeno provare a tenere presenti).

"Atteggiamento"; "uso di tecniche di ragionamento" e "comprensione" sono concetti che vanno visti sullo sfondo della nostra cultura (da intendere come l'ambiente entro cui siamo socialmente partecipi), della nostra formazione culturale (con termini ancora più equivoci sarei tentato a dire conoscenza e sensibilità) e delle nostre pre-comprensioni (cose che teniamo per digerite, anche se non le abbiamo mai ingoiate, nulla di grave, anzi di comune).

Se, pensando al processo conoscitivo di una nostra ricerca, ci chiedessimo dove si inserisce l'uso e il ruolo delle tecnologie informatiche, sbaglieremmo a considerarle dei semplici strumenti. Da un lato, infatti, è vero che le macchine compiono semplicemente operazioni ad alta velocità; però, dall'altro lato, una tecnologia non è mai costituita solo dagli strumenti fisici con i quali può essere applicata, ma è essa stessa un processo conoscitivo, un modo di vedere le cose, un filtro, un contenuto di pensiero. Il sempre maggiore uso di tali tecnologie è, infatti, accompagnato da una nuova "discorsività" e sempre più si nota un cambiamento nel vocabolario degli studiosi. Ma questo è segno d'altro. Se crediamo che « il soggetto che fa scienza è un soggetto addestrato, che ha assimilato cioè un dizionario, una tradizione di ricerca, l'archivio di un sapere e i modi di un saper fare» [cfr. S. Borutti, Teoria e interpretazione. Per un'epistemologia delle scienze umane, Guerini e assoc. ed., Milano, 1987], possiamo cominciare a capire l'importanza di considerare l'informatica con maggior attenzione epistemologica, rinunciando a vedere nel computer un oggetto completamente separato e inconciliabile con i nostri studii, che può essere "sfruttato" in qualche modo senza un nostro coinvolgimento. Nel processo conoscitivo di una ricerca, quindi, l'informatica si inserisce naturalmente un po' a tutti i livelli. Dunque , cosa ne otteniamo dall'uso (che si presenta sempre più inevitabile), oltre a quanto appena detto?

Archiviazione di grandi quantità di dati con ingombri minimi (di tempo, logistici ed energetici).
Disponibiltà d'accesso ai dati su scala mondiale.
Controllo dei dati e delle loro relazioni in operazioni di ricerca scientifica.

Le tecnologie informatiche non risolvolno il problema. Ma l'informatica non è solo un "supporto" ma interviene nel controllo, nella proposta di soluzioni, nella presentazione dei risultati e ... nella creazione del problema stesso (e ciò a più livelli...).

L'orientalistica e l'informatica

Ovvero, ci siamo anche noi, anche se non sempre abbiamo capito precisamente dove

Anche lo studio delle culture del Vicino Oriente antico si sta sempre più avvicinando alle nuove tecnologie, con le conseguenze a cui abbiamo fatto riferimento sopra e con diverse prospettive. Nel campo dell'educazione, appoggiandosi alle nuove tecniche multimediali; in quello della messa a disposizione dei materiali e dei dati sulla world wide web; nella raccolta del materiale di studio, utilizzando varie forme di basi di dati; nell'utilizzo delle risorse informatiche per studiare il materiale.

Vedremo poi alcuni esempî. Qui voglio solo ricordare come sia oggi assai importante creare una conoscenza di base del mondo delle nuove tecnologie che possa rendere più mirati gli investimenti. Alcune nozioni fondamentali da considerare nella giusta luce sono ovviamente quelle legate alla rapida obsolescenza hardware e software, alla portabilità, alla flessibilità ecc.

Panoramica web

Initiatives, Standards, and Digital Library Projects

Il portale dell'Accademia di Mainz

SVH-Project ("Staatsverträge der Hethiter")

Esempi di digitallizzazione delle tavolette cuneiformi (sito di G. G. W. Müller)

Tecnomanzia

Seconda parte

Il nodo essenziale

Ovvero, importanza del rapporto contenuti/presentazioni

L'attenzione al rapporto contenuti/presentazioni determina la qualità finale della realizzazione del progetto. I supporti informatici, da come si può evincere dai siti visitati, offrono possibilità sia di analisi del materiale che di presentazione dello stesso. I tipi di presentazione vanno dalla pubblicazione dello studio effettuato per la comunità scientifica alla presentazione "multimediale" per ragioni educative e/o pubblicitarie. Sapere quale obiettivo si vuole perseguire aiuta a effettuare i giusti investimenti. Una costellazione di software è oggi disponibile per gli scopi più diversi ed è necessario essere ben informati su alcuni punti critici come portabilità e flessibilità.

Abbiamo visto che in progetti quali ETCSL, CDLI o TITUS la base di partenza è incentrata sulla costituzione di un corpus elettronico pensato sia per scopi di ricerca che di presentazione.

L'uso di tecnologie in cui l'attenzione agli aspetti di contenuto e di presentazione è più elaborata, può rivelarsi alla lunga come una scelta positiva. Da questo punto di vista i linguaggi di marcatura offrono la possibilità di creare corpora basati sul contenuto, in cui cioè, venga marcato specificatamente il contenuto del materiale. Dalla creazione di un corpus così concepito è poi possibile lavorare sia nel senso della ricerca più precisa e raffinata sia nel senso della presentazione del materiale nei più disparati sistemi. Partire, invece, da una organizzazione del materiale pensata immediatamente per ragioni di presentazione, può poi costringere alla riorganizzazione di tutto il materiale raccolto, qualora si volesse passare a scopi scientifici di ricerca.

Pensando al materiale di studio più tipico per l'Orientalistica antica, sia per quanto riguarda interessi archeologici, storici, filologici ecc. sia per interessi didattici più generici, dalla vista ai siti web dei progetti più importanti mi pare che si possano trarre le seguenti considerazioni:

- piena adesione allo sviluppo di corpora con linguaggi di marcatura (principalmente XML)
- impegno allo sviluppo dei documenti in conformità a standard internazionali
- impegno alla pubblicazione e al mantenimento costante dei corpora sulla world wide web
- impegno a seguire con interesse le proposte e le ricerche delle nuove tecnologie collegate ai linguaggi di marcatura

L'unico problema, a mio avviso, sta nel modo in cui si tratta la struttura del contenuto, o, meglio, nel modo in cui si decide quali elementi debbano essere presi in considerazione per creare il corpus. Il "contenuto" di un testo cuneiforme, come di tutti gli altri testi del resto, è variegato, e comprende informazioni "archeologiche" (luogo e contesto di ritrovamento, stato di conservazione ecc.), "filologiche" (di scrittura, conservazione, di contenuto grammaticale generale, spesso con terminologia specifica per ogni disciplina derivante da sistemi d'analisi specifici e tradizioni terminologiche distinte) e "linguistiche" (strutture d'analisi sviluppate dalla linguistica, uso di categorie d'analisi e terminologia standard ecc.).

Da questo punto di vista, pare carente l'attenzione a fornire strumenti d'analisi anche per ilinguisti. Questo può rivelarsi grave non già per la struttura informatica in sé del corpus (una struttura pensata per esigenze non linguistiche può facilmente essere collegata ad una invece realizzata proprio per tali scopi; le tecnologie a linguaggi di marcatura sono infatti molto flessibili e potenti) quanto per l'organizzazione logica del materiale, che, pur essendo costituito per la maggior parte da informazioni linguistiche, potrebbe non essere poi in tal direzione analizzabile perché organizzato per un altro tipo di esigenza o per un settore scientifico con sistemi, convenzioni e terminologie peculiari. Quindi, pur risultando utilizzabile per le esigenze e le competenze linguistiche della specifica disciplina non riuscirebbe poi a fornire dati in modo universale.

Se pensassimo che valga la massima: «diversi scopi - diverse tecnologie informatiche», rischiamo di sbagliare. Alla base ciò che conta è la struttura logica, l'organizzazione del materiale. La scelta delle tecnologie dovrebbe essere guidata da criteri quali flessibilità, portabilità, potenza (cfr. sez. "linguaggi di marcatura") e, assieme a ciò, l'intedisciplinarietà e la collaborazione scientifica sono indispensabili.

CAANES: Computer-aided Ancient Near Eastern Studies

Ovvero, quale sortiremo domani oscuro o lieto?

Il futuro, in informatica, è assolutamente relativo al presente. Oggi, il futuro dell'Orientalistica antica, assieme ad altre discipline, è tracciato da 3 fondamentali questioni.

Linguaggi di codifica "dichiarativi"
UNICODE
Comprensione e partecipazione attiva allo sviluppo teorico

1. Linguaggi di codifica

I linguaggi di codifica si dividono in "procedurali" e "dichiarativi".

Procedurali: specificano operazioni da far compiere ad un programma su un documento digitale (nel senso di MRF, "machine readable form"). I documenti in "rich text format" (i files di testo con estensione .rtf) sono codificati con un linguaggio procedurale.

Dichiarativi: «Markup should describe a document's structure and other attributes rather than specify processing to be performed on it» [C. F. Goldfarb, The SGML handbook, Oxford University press, Oxford, 1990.] Il linguaggio base di internet, HTML, che è una apllicazione SGML, è un linguaggio dichiarativo.

Lo Standard Generalised Markup Language (SGML) è un linguaggio di marcatura molto potente ma difficile da utilizzare; inoltre, le applicazioni SGML sono spesso difficili da gestire e richiedono molte risorse. Basti pensare a quanto pesanti sono i browser internet: in parte ciò è dovuto al fatto che SGML permette l'uso sintattico scorretto ed abbreviato in fase di creazione, lasciando alle applicazioni il compito di ricostruire la sinstassi corretta in fase di lettura.

Lo EXtended Markup Language (XML) è un sottoinsieme di SGML che permette di costruire applicazioni potenti, anche se non quanto SGML, ma con maggiore semplicità e richiedendo molte meno risorse. Per "semplicità" non si intende maggiore accessibilità da parte di chiunque, ma sostanzialmente, una chiarificazione della struttura sintattica e delle regole grammaticali comuni a tutte le possibili apllicazioni XML; in un certo senso, tale semplicità è pensata più per le macchine che per gli sviluppatori; ma una volta compresa la grammatica generale ne risulta una maggior facilità d'uso anche per lo sviluppatore.

XML si propone come un meta-linguaggio completamente affidabile poiché segue gli standard internazionali. Gli standard delle tecnologie XML sono sviluppati e/o approvati dal "World Wide Web Consortium (W3C) del MIT".

Con XML si creano corpora in MRF e con alcune tecnologie correlate, in parte ancora in fase di sviluppo, si possono interrogare i corpora o trasformarli secondo diverse regole di formattazione e presentazione per tutte le esigenze editoriali e multimediali. Utilizzando i nuovi linguaggi di scripting, dal python-tcl/tk al perl o al php, per citare alcuni esempii, sono possibili molte operazioni di mantenimento, modifica ricerca ecc. del corpus. Il tutto nella più copmleta (o quasi) indipendenza dalla piattaforma (risultano di fatto privilegiati i sistemi UNIX e, come web-server, Linux).

L'uso di linguaggi dichiarativi dovrebbe anche garantire maggiore indipendenza dalla vorticosa obsolescenza hardware e software che caratterizza cosü tipicamente il mondo delle tecnologie informatiche.

Maggiori informazioni su XML sono reperibili in diversi siti a partire dal già citato www.w3.org.

2. UNICODE

3. Comprensione e partecipazione attiva allo sviluppo teorico

Nei giorni dal 12 al 13 di novembre 2001 si è tenuto, presso l'università di Pavia, un seminario sull'informatizzazione e per una catalogazione di testi cuneiformi. In tale occasione sono stati presentati i progetti delle università di Würzburg, Firenze e Pavia relativamente alla documentazione cuneiforme etea e alla glittica anatolica.

I progetti prettamente informatici presentati sono stati: 1 - SVHProjekt 2 - DaTI (M. Baldi) 3 - Corpus delle cretulae anatoliche. G. G. W. Müller e M. Baldi hanno illustrato obiettivi e stato della progettazione di 1 e 2 rispettivamente, C. Mora ha annunciato l'idea di creare un corpus elettronico delle cretulae anatoliche (3).

1- Staatsverträge des Hethiter.
Oltre alla pagina dimostrativa di prova (http://www.orient.uni-wuerzburg.de/svh/index.html) G. G. W. Müller ha presentato il software SVHjavaEditor, un editor di testo che si propone due obiettivi: primo, "an easy transformation of transliterations and translation into XML with a minimum of additional marking (#-marks)"; secondo "easier editing of complex XML-markups with UTF-8 Unicode encoding". L'editor permette di inserire il testo ittita seguendo convenzioni di traslitterazione tradizionali (le più peculiari sono il maiuscolo tondo per logogrammi/sumerogrammi, il maiuscolo corsivo per accadogrammi, il minuscolo corsivo/tondo per sillabogrammi, eventualmente il tondo/corsivo minuscolo per sillabogrammi delle lingue non etee nei testi plurilingui): il software riconosce la diversa formattazione e marca il segmento pertinente come elemento XML valido. A breve dovrebbe essere pronta la prima release.

2- Database Testi Ittiti.
M. Baldi ha illustrato la base di dati DaTI, il progetto informatico collegato alla ricerca "catalogazione dei testi etei" avviata dalle università di Firenze e di Pavia. Per l'immissione dei dati (usando UNICODE), le maschere sono divise in 4 livelli da compilarsi in successione, facilitando cosü l'operazione ed evitando di dimenticare parti necessarie. A fianco della complessità di struttura e degli accorgimenti di programmazione che dovrebbero assicurare potenza di ricerca e affidabilità di risultato mi pare importante l'attenzione alla praticabilità per i non esperti.

Da queste presentazioni e dal breve annuncio del progetto di creazione del corpus elettronico dei sigilli anatolici, sono stati posti alcuni punti fondamentali. La creazione di strumenti per l'immissione/gestione deve essere accompagnata dall'attenzione alla massima agevolazione e semplicità d'uso; pur seguendo, per diverse esigenze, diverse tecniche d'archiviazione del materiale (banche dati relazionali, documenti XML) è emersa la volontà piena di rendere la banca dati/corpus elettronico flessibile e disponibile on-line. In fine, ma non meno importante è stata sottolineata la necessità di considerare le diverse e particolari esigenze dei diversi interessi di ricerca senza rinunciare all'adesione agli standards. Anzi, è stata sottolineata dallo scrivente la necessità di dialogo con i centri di sviluppo degli standards e non solo nel già affrontato problema di UNICODE, ma anche nell'elaborazione degli elementi dei linguaggi di marcatura e nella costruzione dei data-base relazionali.

A parte le specifiche sui diversi progetti, il significato dell'incontro sta tutto nella volontà di cercare vie attraverso cui far convergere singoli e dispersivi sforzi verso progetti solidi e di vasto respiro a cui partecipino più centri di ricerca.

La collaborazione, a mio avviso, deve portare soprattutto alla progettazione di corpora a cui possano far riferimento diverse esigenze scientifiche, siano esse archeologiche, filologiche, linguistiche, storiche ecc., il dialogo con i ricercatori che nei campi delle scienze dell'antichità e più in generale, delle scienze umane si occupano di progetti informatici è, a mio avviso, conditio sine qua non per la realizzazione di strumenti destinati a resistere l'obsolescenza software/hardware e destinati a contribuire oltre la "strumentalità" alla conoscenza delle materie studiate.

Contact Author

Antiche scienze informatiche

Nuove tecnologie informatiche per l'orientalistica antica: uso e valore

Rizza Alfredo

Prima parte

Seconda parte

Parte prima

Scienze umane e informatica

Cosa fa l'informatica agli scienziati "umani"?

L'orientalistica e l'informatica

Ovvero, ci siamo anche noi, anche se non sempre abbiamo capito precisamente dove

Panoramica web

Seconda parte

Il nodo essenziale

Ovvero, importanza del rapporto contenuti/presentazioni

CAANES: Computer-aided Ancient Near Eastern Studies

Ovvero, quale sortiremo domani oscuro o lieto?

1. Linguaggi di codifica

2. UNICODE

3. Comprensione e partecipazione attiva allo sviluppo teorico