di Manuel Barbera (b.manuel@inrete.it).
Nella sezione precedente avevamo cercato di spiegarci cosa sia
il linguaggio, delineandone le caratteristiche affatto generali ma soffermandoci soprattutto
su quelle del linguaggio umano in particolare. Qui ci occuperemo invece delle lingue
storiche, parlate dagli uomini in dati punti del tempo e dello spazio.
Nei capitoli seguenti, più precisamente, introdotte alcune necessarie premesse
sulla classificazione linguistica e sulla linguistica storica, presenteremo una panoramica
dell'Eurasia linguistica, in base a due punti di vista: (a) corredare i problemi teorici della
classificazione genealogica di esempi concreti che servano al contempo ad illuminare
le aree culturali che studiamo; (b) fornire una serie di esempi di fenomeni linguistici
che appaiano in modo esemplare in lingue o famiglie raggiunte dalla nostra rassegna,
in modo da ampliare l'esemplificazione del manuale di Graffi - Scalise, basata
prevalentemente sull'italiano e sull'inglese; (c) dato che tutta la manualistica (con, probabilmente,
la sola meritoria eccezione di Lyle Campbell,
Hystorical Linguistics. An Introduction, Edimburgh, Edimburgh University Press, 1998, un manuale molto ricco che caldamente consiglio
a chi scoprisse di essere interessato alla linguistica storica) è
prevalentemente focalizzata sull'indoeuropeo, e che l'interesse della maggior parte
dei miei studenti è piuttosto spostato sull'Asia, trascureremo molto l'indoeuropeo per mettere
in maggior in rilievo, invece, le altre famiglie linguistiche dell'Eurasia.
Certo, è spiacevole limitarsi alla sola Eurasia, come se le Americhe, l'Oceania e l'Africa
non serbassero anche loro scrigni preziosi di diversità linguistica, ma in un corso
di 60 ore bisogna per forza fare rinunce dolorose ...
Avevamo ripetutamente insistito nella sezione precedente, tanto
parlando della fondazione del linguaggio come istituto "sociale" (da Saussure a
Wittgenstein) quanto della sua possibile origine (biologica evoluzionistica e
biosemiotica), sulla radicale differenza tra le lingue storiche sviluppate, in
diverse zone del tempo e dello spazio, dall'umanità ed il linguaggio come istituto
(Saussure ecc.) o facoltà generale (Chomsky). La distinzione tra lingua (anzi,
meglio, "lingue") e linguaggio è in effetti davvero fondamentale.
Una analogia potrebbe essere in biologia la distinzione tra specie (unità di
"popolazione" vivente: cfr. "lingue") e vita (condizione comune a tutte le
"popolazioni": cfr. "linguaggio"). Alla stessa maniera che la specie è l'unità
tassonomica base della scienza naturale, la "lingua" può essere considerata
l'unità base della linguistica naturale.
Anche il problema dell'origine del linguaggio deve essere rigorosamente distinto
da quello delle lingue storiche umane. È infatti spesso capitato che si sostenesse
la tesi della monogenesi delle lingue chiamandola erronemaente (e talvolta anche
fraudolentemente) "monogenesi del linguaggio": tale tesi sostiene che tutte le
lingue odierne sarebbero evolute da una unica lingua progenitrice, allo stesso modo che
tutti gli uomini hanno una unica origine genetica, (e non che il linguaggio sia una
struttura fondante della vita stessa, come abbiamo visto essere probabilmente vero).
Già nell'Ottocento i linguisti più avveduti rifiutavano tali questioni (che
chiamavano "glottogoniche"), in quanto scientificamente intrattabili. L'idea,
però, non è mai davvero tramontata, e nella seconda metà del Novecento è rinata
più forte di prima, col presunto appoggio della genetica (si tratta, in realtà,
di una illusione dovuta, tra l'altro, all'equivoco tra lingue e linguaggio). Non è
tra l'altro mancato l'appoggio (abbastanza inspiegabile) di linguisti illustri, come
Morris Swadesh
(1909-1967, noto specialista di lingue amerindie) e Joseph Greenberg (1916-2001,
il fondatore della tipologia moderna), né la diffusa divulgazione ad opera di mistificatori
dai pochi scrupoli come Merrit Ruhlen.
In realtà, basandoci sugli unici "dati" che abbiamo - ossia le lingue
esistenti od esistite che conosciamo - e sull'unica metodologia che ci garantisca
risultati scientificamente controllabili - il "metodo storico-comparativo", su cui
torneremo in seguito - arriviamo a dimostrare l'esistenza di circa 250
famiglie linguistiche (di cui 37 nella sola Eurasia), con un certo numero di lingue
che rimangono isolate (non connesse con alcuna unità genealogica verificabile);
per alcune di queste famiglie esistono ipotesi di connessioni genealogiche in altre
unità più vaste, ed alcune di queste ipotesi è anche probabile che vengano di fatto
dimostrate in futuro: ma resta il fatto che non si riesce empiricamente, a posteriori,
ad arrivare neanche lontamente vicino alla origine unica, ed ogni supposta "dimostrazione"
che ne è stata divulgata è viziata da un erroneo utilizzo del metodo comparativo e/o
da un troppo disinvolto uso dei dati linguistici (sono nate non solo parole inesistenti
ma anche lingue inesistenti ...).
Resta il presunto argomento che la monogenesi sarebbe
la tesi più "economica" per spiegare l'emergenza delle lingue umane: il che è naturalmente
vero per il linguaggio, come per le specie biologiche, ma per le lingue è
assolutamente falso. Per le specie (almeno per quelle eucariote, dotate di riproduzione
sessuata, diploide) esiste infatti la barriera riproduttiva, ossia il fatto che
la riproduzione non può avvenire tramite accoppiamento di due membri di specie
diverse; i contorni possono essere più (si pensi al fenomeno dell'ibridazione) o
meno sfumati (un asino ed un cavallo, ad esempio "possono" accoppiarsi, ma la
loro prole, il mulo, è sterile), ma il fatto è ben assodato, ed anzi è stato alla
base della definizione stessa di specie prima che lo studio dei procarioti (asessuati)
imponesse che venisse affiancato da altre caratteristiche. Per le lingue, invece,
a quanto sappiamo è vero proprio il contrario: lingue diverse si possono egregiamente
fondere in nuove lingue (è il cosiddetto fenomeno della creolizzazione: conosciamo
infatti molte lingue creole delle quali sappiamo anche abbastanza bene come "si sono create")
e ogni lingua può assumere una parte del proprio patrimonio da altre lingue (basti pensare
ai prestiti nel lessico ...). È, in pratica, come se per un organismo vivente il
patrimonio genico non venisse di norma trasmesso linearmente ma riassemblato diffusionalmente
con pezzi di genoma di diversa provenienza .... Dunque, la monogenesi per le lingue
NON è la teoria più economica (mentre lo è per le specie).
E poi: dobbiamo pure, in qualche modo rendere conto del grado di
diversità linguistica presente nel mondo.
Un calcolo approssimativo (l'approssimazione è dovuta non solo alla nostra
conoscenza ancora imperfetta di alcune aree "selvagge" come la Nuova Guinea, ma anche
alla instabiltà stessa del concetto di "lingua", cfr. il paragrafo sg.) porrebbe
il numero delle lingue esistenti intorno alle 6.000. Questo dato quantitativo, in
sé molto alto, è probabilmente l'unico fatto oggettivo inconfutabile riguardo alla
diversità linguistica del mondo. Qualitativamente, infatti, la valutazione della
"glottodiversità" (se così vogliamo chiamare il fenomeno in questione, in analogia
con la "biodiversità" che studiano i naturalisti) è inevitabilmente legata a reazioni
soggettive e ad aspettative diverse in base alle diverse teorie linguistiche
dell'osservatore: un linguista di formazione storica ed empirica sarà colpito
dalla straordinaria diversità delle lingue, mentre uno studioso
di formazione più razionalista e generativista sarà piuttosto colpito dalle somiglianze,
specie a livello di struttura profonda. Entrambe le reazioni sono probabilmente giustificate,
e rispondono a diversi progetti di studio. Provate a guardare le due seguenti frasi,
l'una traduzione dell'altra, in eskimo groenlandese (Kalaallit oqaasii, "Western
Greenlandic", la lingua ufficiale della Groenlandia) ed in inglese:
| Kal. naalaqqisaaqquaa | |||
| naala- | qqisaa- | qqu- | aa |
| 'ascoltare' | 'attentamente' | 'dire a' | 3/SOG.3/OGG.IND |
| Eng. he told him to listen carefully | ||||
| he | told | him | to listen | carefully |
| 3.SOG | 'dire'-PT | 3.OGG | INF-'ascoltare' | 'attentamente' |
[tav. 1]
Due frasi dallo stesso significato in eskimo groenlandese ed in inglese. Nell'analisi
linguistica i numeri (3) stanno per la persona verbale o pronominale, IND per
"indicativo", INF per "infinito", PT per "passato", SOG per "soggetto" ed OGG per
"oggetto". L'esempio è adattato da Michael Fortescue, Western Greenlandic, London
- Sydney - Dover, Croom Helm, 1984, p. 43.
La diversità tra le due lingue è innegabile, ma lo è anche il fatto
che entrambe rispettano la structure dependency
almeno per quanto riguarda il principio di proiezione e la teoria x-barra (se provate
a costruire, seguendo le indicazioni mie e del manuale di Graffi-Scalise, un albero
sintattico della frase in eskimo, vedrete che è un esercizio forse non facile, ma
comunque possibile), come prevede la teoria di Chomsky.
Seguire una strada piuttosto che un'altra è più che altro funzione dei vostri interessi
e di quello che volete studiare in una lingua: la singolarità e la specificità delle
sue strutture, dal punto di vista diacronico della loro formazione o da quello
sincronico del loro attuale funzionamento, o piuttosto i principi generali, la struttura
profonda - come si usa dire nella tradizione generativa - che la determinano.
Ma cosa sarà poi, in fin dei conti, una lingua? Se non ci fosse già stato intuitivamente
presente, ormai dovremmo averlo abbastanza chiaro: una specifica forma di linguaggio
usata da una determinata popolazione in un certo punto dello spazio e del tempo.
Anche se il concetto è ben definito, questo non significa che, concretamente, ci serva
a molto per identificare una lingua. Anzi, è purtroppo vero che identificare una
lingua, ossia distinguere univocamente una varietà linguistica da un'altra varietà
a lei prossima nello spazio geografico, sociale, culturale, temporale, ecc. (tanto
sullo stesso piano, lingua vs. lingua, quanto su piani subordinati, lingua vs.
dialetto, considerato quest'ultimo come sottovarietà della lingua), è un'operazione
a volte estremamente difficile, e spesso non c'è alcun consenso né sui criteri da
adottare né sui risultati da cercare.
Esempi di questa incertezza sono sotto gli occhi di tutti. Io, ad esempio, mi riferisco
alla mia madrelingua piemontese come "lingua", ma un politico vi si riferirebbe (con
intenti probabilmente diminutivi) come ad un "dialetto" - ed una analoga esperienza
potrebbe essere capitata anche ad alcuni di voi. Nella legislazione italiana, per
fare un altro esempio, il friulano ed il ladino sono considerati "lingue" minoritarie,
e sono pertanto in qualche modo salvaguardate, ma il piemontese od il veneto no,
nonostante nessun linguista (per tacere di nessun vero piemontese o veneto) nutrirebbe
dubbi sul loro "esser lingue". Un altro esempio, che muove in senso contrario,
può essere dato dal croato e dal serbo, di cui le nazioni che ne contengono la
maggioranza dei parlanti si sono sforzate di trattarle come "lingue" diverse, cercando di nasconderne
le somiglianze con l'uso di scritture diverse (l'una latina, e l'altra cirillica) e
col favorire scelte lessicali divergenti, ma che vengono di solito considerate dai
linguisti come due varietà di una stessa lingua, il "serbocroato". A volte la
differenziazione od il livellamento non sono neppure introdotti di forza da una
volontà politica nazionalista, ma sono il naturale risultato di una diversità culturale
tra comunità che pure fanno uso di uno strumento linguistico sostanzialmente simile:
è questo ad esempio, in India, il caso di hindi ed urdu, che sono divise da diversa
scrittura (nagari vs. arabica), religione (induista vs. islamica), cultura e letteratura,
pur essendo due forme della medesima lingua, ed entrambe reciprocamente non riducibili
a dialetto l'una dell'altra.
Che criteri sono, insomma, di norma usati per l'identificazione di una "lingua"? Ve ne sono
molteplici, schematicamente riconducibili a due gruppi generali: criteri extralinguistici
e criteri linguistici.
Iniziamo da quelli extralinguistici che pure, facendo noi linguisti "by trade, ci
interessano intrinsecamente meno.
Il più tipico nel nostro Occidente, figlio nel bene e nel male dal nazionalismo
romantico dell'Ottocento, è il criterio nazionale: una lingua è tale se è
la varietà standard di uno stato nazionale sovrano. Così, il sardo, la più isolata
ed originale tra le lingue romanze, sarebbe un mero "dialetto" dell'italiano, come anche
il mio povero piemontese; anche il basco, che pure è la lingua più aberrante e storicamente
inspiegata di tutta Europa, diventerebbe un "dialetto" dello spagnolo (o del francese?
che anche questa è un'altra contraddizione di questo approccio); il lussemburghese, invece,
che ogni germanista sa essere un dialetto medio-tedesco del gruppo francone mosellano,
è invece la "lingua" ufficiale dello stato del Granducato del Lussemburgo. Il criterio,
evidentemente, non è utile dal punto di vista linguistico, ed è anche piuttosto funesto
nelle sue conseguenze politiche e culturali.
Meno esiziali, e di fatto talvolta utili per determinati scopi, possono essere i
criteri sociolinguistici, culturali e di prestigio culturale o letterario.
Da questi punti di vista, ad es., praticamente tutte le varietà linguistiche presenti
in Italia si trovano sotto l'ombrello dell'italiano, rispetto al quale si pongono
sostanzialmente in un rapporto di dipendenza lingua-dialetto, cosa che (purtroppo)
è un dato di fatto, anche se contraddice la natura strettamente linguistica
e storica di quelle varietà, e del quale bisogna per forza tenere conto.
I criteri linguistici sono comunque, naturalmente, i più pertinenti per
identificare una lingua in quanto tale; idealmente, anzi, dovrebbero essere i soli
a contare realmente, sennonché le lingue sono pur sempre costruzioni sociali ...
Il criterio più "ingenuo" che ci si può affacciare naturalmente alla mente è la
quantità di coincidenza, ossia quanto delle regole e del lessico è simile od
uguale in due lingue. Nei casi estremi, ed un poco a spanna, le cose sono abbastanza evidenti:
nelle due frasi in eskimo ed inglese della tavola precedente non troviamo nulla di simile,
mentre tra i l'àj màl ao còl e i l'àj màl al còl, 'ho mal di collo' rispettivamente
nella parlata della bassa Valsusa ed in quella di Torino, le somiglianze sono molto più
delle differenze (nel campione scelto la sola diversità è nell'espressione dell'articolo determinativo,
[u] vs. [l]), sicché nel primo caso avremo due lingue diverse, mentre nel secondo
due dialetti della stessa lingua, o, più accuratamente, due forme dello stesso "diasistema", nel
senso di 'sommatoria, matrice componenziale, di una serie di sistemi tra loro convergenti
in alcuni parametri e divergenti in altri' con cui è stato introdotto dal sociolinguista
Uriel Weinreich (in Is a Structural Dialectology Possible?, in "Word" X (1954) 388-400,
poi raccolto in italiano in Lingue in contatto, con saggi di Giuseppe Francescato,
Corrado Grassi e Luigi Heilmann, Torino, Bollati Boringhieri, 1974, traduzione
arricchita di Languages in Conctat, New York, 1953). Significativo, comunque,
è che il test in questione da solo non sia in grado di definire una percentuale assoluta
di divergenze che segni il confine tra lingue diverse: il metodo del diasistema è
descrittivamente efficace, ma discriminativamente inefficiente;
è proprio, in effetti, quando le cose non sono così nette, ossia proprio quando più ci troviamo in
dubbio, che il sistema perde efficacia, e non consente di trarre decisioni definite.
Il secondo criterio cui potremmo fare ricorso è quello dell'intercomprensibilità:
se tra parlanti di due varietà linguistiche non c'è comprensione reciproca (sia
pure imperfetta), allora ci troveremmo di fronte a due lingue distinte. Il criterio è a tutta
prima molto attraente, perché permette riscontri oggettivi ed è radicato su una
prerogativa essenziale della lingua, l'uso. Purtroppo anche in questo caso non è
tutto oro quel che luce ... Tutto il discorso presuppone che l'intercomprensione sia
simmetrica (se io capisco te, tu capisci me): purtroppo la comprensione,
come l'amore, non è detto che debba essere sempre ricambiata, ossia, più formalmente,
non gode dalla proprietà reciproca. Forse un esmpio concreto ci aiuterà a comprendere
meglio la questione.
Una area in cui, nel corso del Novecento,
l'attività dei linguisti è stata particolarmente attiva nel definire le "lingue"
con cui dovevano confrontarsi (anche praticamente, per preparare programmi di istruzione
primaria in lingua) è il Messico, che è una delle zone a più grande varietà linguistica
del mondo: nello stato di Oaxaca, in particolare, su una superfice di poco più ampia
del Portogallo sono tuttora parlate circa cento lingue diverse, tra cui le più numerose
sono le lingue zapoteche e le mixteche (entrambe appartenenti ad una delle famiglie
linguistiche più vaste e meglio studiate dell'America, l' "otomangueo"). Per definirne
il numero (oggi stimato intorno risp. alle 38 ed alle 29: cfr. Jorge A. Suárez, The
Mesoamerican Indian Languages, Cambridge - London - New York - New Rochelle - Melbourne
- Sydney, Cambridge University Press, 1983, p. 18) si era pensato di fare ricorso in
larga scala ai test di intercomprensibilità, con risultati affatto analoghi a quelli
che riporto qui sotto per un campione tre città zapoteche:
[tav. 2]
Percentuali di intercomprensibilità in tre città zapoteche. La percentuale critica al
di sotto della quale non c'è più comprensione accettabile si trova intorno all'80%,
o poco sotto (comunque non oltre il 70%): anche questo fattore si è rivelato, infatti,
in parte specifico lingua per lingua. Ma la conclusione più interessante è che parlanti
di Yatzeche possono capire la variante di Ocotlán, e parlanti di Tilquiapan possono
capire la varietà di Yatzeche, ma i parlanti di Tilquiapan e di Ocotlán non si capiscono
tra di loro; c'è comprensione reciproca tra Yatzeche e Tilqiapan, ma mentre i parlanti
di Yatzeche capiscono quelli di Ocotlán non accade il contrario. Riprodotto da Jorge A.
Suárez, The Mesoamerican Indian Languages, Cambridge - London - New York - New
Rochelle - Melbourne - Sydney, Cambridge University Press, 1983, p. 15; basato su S.
Egland e D. Bartholomew, La inteligibilidad interdialectal en México: resultados
de algunos sondeos, México, Institudo Lingüístico de Verano, p. 79.
La situazione può essere resa anche più evidente con uno schema lineare in cui, rispetto ad un centro, ogni singola linea ("isoglossa") rappresenta la percentuale di comprensione, al cui interno più punti possono essere raggruppati; una linea che racchiude un punto od un gruppo di punti significa anche che alla percentuale indicata non ci possono essere ulteriori raggruppamenti. L'esempio seguente rappresenta otto città dell'area mixteca settentrionale:
[tav. 3]
Percentuali di intercomprensibilità tra le principali città zapoteche settentrionali,
rappresentate con isoglosse centrate su Chazumba. Per le lingue mixteche la percentuale
critica al di sotto della quale non c'è più comprensione accettabile è stata fissata al
70% (per le lingue zapoteche è invece intorno all'80%: il fattore è, infatti, lingua-specifico).
Al 90% solo due punti possono essere raggruppati (Chazumba e Tonahuixtla), al 85% si
aggiungono altri quattro punti (Xayacatlan, Tepejillo, Cosoltepec e Las Palmas) ed
all'80% un ultimo ancora (Petlacingo). Dopo questa soglia, anche scendendo al 60%
nessun altro punto può essere raggruppato: il punto più prossimo, Chigmecatitlan, può
essere aggiunto solo al 38%. In base a quello che abbiamo detto potremmo concludere
che in questa area ci troviamo di fronte a due lingue mixteche. Riprodotto da Jorge A.
Suárez, The Mesoamerican Indian Languages, Cambridge - London - New York - New
Rochelle - Melbourne - Sydney, Cambridge University Press, 1983, p. 17; basato su S.
Egland e D. Bartholomew, La inteligibilidad interdialectal en México: resultados
de algunos sondeos, México, Institudo Lingüístico de Verano, p. 29.
Per tirare le somme di quanto abbiamo detto, possiamo dunque
concludere che determinare esattamente una lingua è una operazione spesso delicata,
per la quale possono rendersi necessari anche più criteri contemporaneamente, tra
i quali la preminenza va senz'altro data a quelli linguistici, senza tuttavia negarsi
il ricorso anche a criteri culturali e sociolinguistici. In pratica: bisogna decidere
caso per caso.
Confrontarsi con la diversità delle lingue del mondo e poterle
studiare in quanto tali significa anche attrezzarsi per "classificarle", non fosse
che per avere un sistema generale, condiviso da tutti gli studiosi, cui fare riferimento.
Tale necessità non è poi molto diversa dalle istanze che mossero
Carolus Linnaeus,
il grande naturalista svedese (poi Carl von Linne, 1707-1778) nel 1735 a proporre
il suo Systema Naturae, che ha giocato un ruolo fondamentale nello sviluppo
delle scienze naturali, e la cui struttura (anche se, ovviamente, non la sua lettera)
è tutt'ora seguita nella "sistematica" biologica. In effetti, molte delle discussioni
sul concetto di "classificazione" che sono scorse copiose in tutta la storia delle
scienze naturali dal Settecento ad oggi sono illuminanti anche per il compito del
linguista. (Un affresco storico di quelle discussioni assolutamente stimolante è quello
che ne dà Enst Mayr nel suo The Growth of Biological Thought. Diversity, Evolution,
and Inheritance, Cambridge (Mass.) - London (UK), The Belknap Press of Harvard
University Press, 1982, tradotto come Storia del pensiero biologico. Diversità,
evoluzione, eredità, edizione italiana a cura di Pietro Corsi, Torino, Bollati
Boringhieri, 1990; cfr. in particolare le pp. 83-243 dell'ed. it. dedicate a La
diversità della vita ed alla Macrotassonomia, la scienza della classificazione).
In particolare due ordini di considerazioni sono particolarmente importanti anche per la
classificazione delle lingue: quello relativo alla struttura (tassonomia) e quello
relativo ai criteri (arbitrarietà). In effetti, è la struttura del sistema linneiano,
inteso come una griglia di taxa (plurale del greco taxon 'posto'), ossia
una "tassonomia", ad essere ancora attuale (soprattutto la struttura binomiale dei nomi,
genere + specie, come Homo sapiens, la cui introduzione risale appunto a Linneo),
e non i principi con cui le specie (il taxon base) venivano definite e collocate
nella tassonomia (Linneo operava un secolo prima di Darwin, ed aveva, necessariamente,
un concetto non evoluzionistico, ed anzi essenzialistico, della specie).
Riproduco qui sotto, nella sua forma più dettagliata, la tassonomia oggi in uso nella
sistematica biologica:
[tav. 4].
Nomi e gerarchia dei taxa nella tassonomia biologica moderna. La nomenclatura
nella tavola è in inglese; è ancora, comunque, spesso usato ancora il latino, che userò
invece in questa didascalia. Solo quattro taxa, ossia regnum, classis,
genus e species, risalgono al Systema originario di Linneo,
phylum invece è stato introdotto da Georges Cuvier
(1769-1832) nel 1799; quasi tutti i taxa possono contenere dei subtaxa quando necessario (quelli stampati sono i più standard, ma sono frequenti
anche subphylum e subordo); cohors e tribus non sono usati in tutte le
tassonomie.
Riprodotto da Ernst Mayr, What Evolution Is, New York, Basic Books, 2001.
In linguistica non c'è ancora un consenso così consolidato sui taxa da usare, cosa, se ci pensate bene, anche comprensibile date le difficoltà che abbiamo visto nella determinazione del nostro taxon di base, la lingua (~ species), e del suo immediato inferiore, il dialetto (~subspecies). Una esempio di classificazione linguistica tassonomica (filogenetica ma anche sincronico-sociolinguistica e geografica: è significativo, infatti che non si possa, in questo come in altri casi, fare una classificazione "puramente" evolutiva) è quello che ho proposto per le lingue baltofinniche, e che trovate nel capitolo dedicato alle lingue uraliche (cfr. la tassonomia BF). Utile, in particolare, sarà un confronto tra i taxa della biologia e quelli che ho impiegato per le lingue baltofinniche, che trovate compendiati in una apposita tavola cui rimando.
Se l'articolazione e la consensualità della griglia di classificazione,
compendiata nel concetto di tassonomia, è la prima lezione che abbiamo imparato
dalla sistematica biologica, l'altro punto fondamentale è quello della arbitrarietà
ed appropriatezza dei principi in base ai quali viene fatta una classificazione.
Già intuitivamente è evidente che quando si fa una classificazione si hanno dei precisi
scopi pratici: se metto in ordine le minute ferramenta posso voler separare, ad esempio,
viti e chiodi lunghi da quelli corti perché ho due scatole di dimesioni diverse in cui
metterli, od invece voler separare viti da legno da bulloni da ferro perché ho zone diverse
del laboratorio per lavorare il legno ed il metallo. In entrambi i casi faccio una classificazione
decidendo di mio arbitrio (in base ai mie scopi) il criterio in base ai quali assegno
gli oggetti da classificare a taxa diversi.
Significativamente, come abbiamo rilevato, gli scopi (identificare e descrivere tutti
i vegetali e gli animali) ed i criteri (basilarmente il tipo di riproduzione) della
sistematica di Linneo sono diversi da quelli della biologia moderna, post-darwiniana, per
la quale lo scopo è piuttosto identificare la corretta filogenesi delle specie, e gli strumenti
impiegativi sono sempre più le sequenziazioni geniche, anche se le caratteristiche morfologiche
(come quelle legate alla riproduzione, care a Linneo) tengono ancora il loro posto.
Il primo "albero filogenetico" della vita è probabilmente quello disegnato da
Ernst Haeckel
(1834-1919) nel 1866, che riproduco qui sotto per via della concretizzazione materiale
- un poco ingenua, se vogliamo - del concetto che noi (matematicamente) chiameremmo
"struttura arborescente orientata" in un albero vero e proprio: la rappresentazione
ad albero della filogenesi è infatti uno schema che ha avuto grande fortuna anche nella
linguistica (cfr. la discussione più avanti nel paragrafo dedicato alle classificazioni storiche):
[tav. 5]
Il primo (1866) albero filogenetico della vita: il monophiletischer Stammbaum
di Ernst Haeckel, dalla sua Generelle Morphologie der Organismen: Allgemeine Grundzüge
der Organischen Formen-Wissenschaft, mechanisch begründet durch die von Charles Darwin
reformierte Descendenz-Theorie, Berlin, Georg Reimer, 1866. Potete utilmente confrontarlo
con il moderno albero della vita, che
avevamo presentato nelle lezioni precedenti, tanto dal punto di vista della struttura
(qui "Stammbaum" naturalistico, là "struttura arborescente orientata" generata formalmente),
quanto da quello del contenuto (l'avanzamento delle conoscenze in poco più di un secolo
di biologia è stupefacente!).
Il corrispondente della classificazione filogenetica delle specie
è, in linguistica, la classificazione storico-genealogica delle lingue, che ci occuperà
prevalentemente nei prossimi capitoli. Non è però l'unico tipo di classificazione
praticato in linguistica.
Vi sono infatti vari altri sistemi, non storici, come (1) quello quantitativo (criterio base: numero di parlanti: scopo: programmi didattici,
interventi sociali, marketing, ecc.), (2) quello geografico (criterio: vicinanza areale; scopo:
identificare caratteristiche areali, diffusionali) o (3) quello tipologico (criterio: strutture
linguistiche, morfologiche o sintattiche; scopo: quantificare il numero di caratteristiche
grammaticali delle lingue del mondo, e comprenderne le relazioni). Sono in particolare
questi ultimi due ad avere maggiore interesse linguistico.
Intorno al secondo, il criterio geografico, in effetti,
si è sviluppata una particolare disciplina, la geografia linguistica, che ha trovato proprio
in Torino, specie intorno alle figure di Matteo Bartoli (1873-1946, istriano di
origine ma insegnante all'università di Torino dal 1908), prima, e dell'Istituto
dell'Atlante linguistico italiano, poi, uno dei suoi centri principali.
La classificazione il base al criterio tipologico, invece, praticata
largamente nel corso dell'Ottocento in base a criteri
morfologici, è risorta nella seconda metà del Novecento intorno ed a partire dall'opera
del già menzionato linguista americano Joseph Greenberg (Some Universals of Grammar with
Particular Reference to the Order of Meaningful Elements, in Universals of languages,
edited by Joseph Greenberg, Cambridge (Mass.), MIT Press, 1966, pp. 73-113) concentrandosi
prevalentemente su criteri sintattici, e costituendosi in una sorta di corrente autonoma
della linguistica moderna.
[Per il momento mi limito a rimandare al manuale di Graffi-Scalise.]
Dopo le considerazioni che abbiamo fatto sulla natura delle lingue
e sul loro modo storico di costituirsi, è evidente come una tassonomia filogenetica
delle lingue sarà indubbiamente più "difficile" da costruire e di solito meno netta
di quella biologica, da cui pure ha ereditato modelli di rappresentazione e logica.
Il modello di rappresentazione ad albero, normalmente noto col nome tedesco di
Stammbaum, che abbiamo visto adottato in biologia fin da Haeckel,
è stato subito (e, con vari ammodernamenti, resta tuttora) il sistema rappresentazionale
preferenziale. Si noti comunque come già il primo e più famoso degli Stammbaum linguistici,
quello disegnato da August Schleicher per l'indoeuropeo nel 1861 non solo fosse ancora più
tempestivo di quello biologico di Haeckel del 1866 (l'Origine della specie
era uscita solo nel 1859!) ma era anche meno "ingenuamente" iconico
(niente tronchi, fronde e foglie ...) di quello di Haeckel, e pertanto, almeno
graficamente, più simile alla nostra idea moderna di mero "grafo arborescente orientato"
(cfr. ad esempio quello, biologico e puramente cladistico,
della filogenesi degli eucarioti).
La maggiore "disinvoltura" nell'uso degli Stammbaumen contraddistingue comunque la pratica
dei linguisti (come anche quella dei filologi che disegnano gli "alberi" - chiamati
"stemmi" - della tradizione manoscritta od a stampa di un testo), confrontati spesso
con la necessità di rappresentare situazioni non semplicemente lineari: si veda ad esempio
l'albero che disegnava una sessantina di anni dopo Schleicher il grande uralista
Lauri Kettunen
per le lingue uraliche, apparentemente ancora "ingenuo" e naturalistico alla Haeckel,
ma in realtà già con soluzioni moderne quali la dislocazione dei rami, per le quali
va confrontato col mio più "up-to-date"
albero "misto" del '95.

[tav. 6ab] Stammbaumtheorie: il modello ad albero delle lingue indoeuropee secondo August Schleicher, Compendium der vergleichenden Grammatik der indogermanischen Sprachen, Weimar, Böhlau, 1861-1862 (2 vll.). Riprodotto (a) dalla versione originale (sesta edizione, 1866, p. 9) ed in versione (b) "rammodernata" e volta in inglese da James P. Mallory, In Search of the Indo-Europeans. Language, Archeology and Myth, London, Thames and Hudson, 1989, p. 18. Da confrontare con quello biologico di Haeckel e quello uralico di Kettunen per la struttura, con quello moderno di Ivanov e Gamkrelidze anche per il contenuto.
La principale critica che si può muovere alla "Stammbaumtheorie"
è quella di considerare la filiazione come un procedimento sostanzialmente unilaterale
per cui in linea di principio non si possono rappresentare incroci od influssi. Come
si è visto, però, dai pochi esempi citati, si è riuscito a conseguire un minimo
di flessibilità per rappresentare le influenze areali e le commistioni laterali
anche in questo sistema.
Un approccio rappresentazionale alternativo è invece quello del "modello ad onde"
(in tedesco Wellentheorie) proposto per l'indoeuropeo da Johannes Schmidt (1843-1901) nel 1872,
secondo il quale i mutamenti linguistici si propagano ad onde, seguendo ognuno una
propria isoglossa. Questo approccio è conseguente alla raggiunta consapevolezza che le lingue
sono sistemi fortemente composti, difficilmente semplificabili in un rapporto genetico
lineare; consapevolezza che è nata soprattutto in base agli studi sulla
costruzione delle lingue creole da parte del grande linguista Hugo Schuchardt (1842-1927) ed
alle esperienze della geografia linguistica di Jules Gilliéron (1854-1926) nata intorno
all'atlante linguistico francese.
[tav. 7]
Wellentheorie: il modello ad onde delle lingue indoeuropee secondo Johannes
Schmidt, Die Verwantschaftverhältnisse der indogermanischen Sprachen, Weimar,
Böhlau, 1872. Nel paragrafo 2.1 potrete confrontare una
versione moderna
del medesimo schema preparata da Raimo Anttila. Alcune delle "isoglosse" usate
sono le seguenti: (pongo tra parentesi il numero corrispondente nello schema di Anttila):
I. Indoiranico a vs. cetera e,a,o (=3); II. satem vs.centum
(=1); III. marche casuali in -m vs. -bh (=11); ecc. Provate ora ad
identificare le altre due isoglosse usando lo schema di Anttila come riferimento ...
Riprodotto da James P. Mallory, In Search of the Indo-Europeans.
Language, Archeology and Myth, London, Thames and Hudson, 1989, p. 19.
Se la valorizzazione della natura composita delle lingue è certo
ottima cosa, il modello della Wellentheorie non era altrettanto buono per finalità
tassonomiche (ossia per produrre una classificazione genealogica delle lingue),
in quanto polverizza tutte le informazioni filogenetiche disponibili in una galassia
di micro-osservazioni puntuali, rendendo impossibile o perlomeno difficile cogliere
le grandi linee dei mutamenti. La tendenza odierna, in effetti (come ben riassume il manuale
di Graffi e Scalise a pp. 233-237), è quella di combinare in qualche modo le due tecniche,
disegnando Stammbaumen e tassonomie in qualche modo miste e multifattoriali, come
quelle che ho presentato per le lingue uraliche (cfr. lo Stammbaum
più avanti) ed ancor più per le baltofinniche (cfr. la tassonomia
più avanti).
Non è infatti vero che la propagazione "orrizzontale" delle onde renda vana la individuazione (in base al metodo storico-comparativo) dei rapporti "verticali" di genealogia descritti dagli schemi arborescenti: la realtà è che bisogna saper discriminare gli strati diversi accumulati in una lingua e saperli ricondurre alle tradizioni filogenetiche cui appartengono. La componente primaria (strato "genetico") e le secondarie (strati "diffusi") vanno sceverate e trattate con lo stesso metodo. Pensate al solito esempio dell'inglese: una analisi capillare di tutte le unità della lingua inglese che però non sappia distinguerne le principali stratificazioni, potrebbe anche concludere che si tratta di una lingua romanza abbastanza strana (sommando elementi francesi anglonormanni e latini colti il lessico di origine latina in inglese ha pari peso di quello di origine antico-inglese germanica; inoltre la maggior parte delle caratteristiche morfologiche del germanico sono state perse): se invece distinguiamo tra strato antico-inglese, strato latino, strato anglonormanno e strati più recenti, ed applichiamo ad ogni strato il metodo storico-comparativo otterremmo risultati affatto attendibili e che potremmo rappresentare in un grafo ad albero (adattato ad hoc, certo, ma pur sempre dall'elevato potere informativo: cfr. quello che ho disegnato per le lingue baltofinniche).
La complessità delle operazioni interpretative che abbiamo visto
essere necessarie per la classificazione filogenetica rende se non necessaria certo
auspicabile anche la possibilità di ricorrere ad aiuti extralinguistici. Per meglio capire il possibile uso di queste fonti, si
pensi all'esempio dell'inglese che avevamo fatto alla fine del paragrafo precedente:
sapere che dopo la battaglia di Hastings del 1066 la dinastia regnante in Inghilterra
non è più anglosassone ma bensì normanna ci può ben servire per individuare ed interpretare
lo strato linguistico francese anglonormanno; conoscere la storia dell'impero britannico
ci può aiutare a risolvere l'origine di un certo gruppo di parole (come ad esempio
chutney, che è un adattamento del hindi cat,nî); sapere che una certa
area dell'Inghilterra è stata sotto il controllo danese (Danelaw) nell'alto
medioevo, ci può dare il punto di partenza per distinguere uno strato germanico
(norreno) diverso da quello (anglosassone) della principale componente germanica
della lingua inglese moderna; ecc.
L'antichità, dunque, delle attestazioni (che è stata una delle ragioni dello
stato per lungo tempo privilegiato della ricostruzione dell'
indoeuropeo)
e la ricchezza di informazioni storiche (cfr. la strategia che adotteremo per dare
conto delle famiglie turca, mongola e tungusa e dell' "altaico" in genere) sono da
questo punto di vista una fonte di conoscenza privilegiata che purtroppo è
disponibile solo per poche famiglie linguistiche.
Un caso particolare di aiuti extralinguistici è quello offerto dai
dati archeologici tradizionali: la loro importanza, soprattutto per la conoscenza
delle fasi antiche, non coperte dalla conoscenza storica, in cui proiettiamo le
protolingue capostipiti delle famiglie linguistiche che riscostruiamo, è intuitivamente
molto grande. Altrettanto grande deve essere però la cautela nell'usarli per la
ricostruzione linguistica, in quanto le testimonianze dell'archeologia sono, in sé,
culturalmente e storicamente significanti ma linguisticamente mute. Pensate, per
comprendere il punto, al paradosso (l'esempio risale a Lyle Campbell) di un archeologo del
4.000 che faccia scavi in Brasile e trovi i resti di qualche Volkswagen: dovrebbe per
questo concluderne che in Brasile nel remoto secolo XX si parlava tedesco? Come vedete
la cautela è d'obbligo: l'importanza delle informazioni archeologiche è indubbia,
ma la loro interpretazione non è mai semplice.
Un esempio di ipotesi linguistica appoggiata sui dati dell'archeologia tradizionale
è la cosiddetta teoria dei Kurgan
sull'origine delle lingue indoeuropee (che tratteremo più avanti).
Un altro tipo di dati archeologici (in molti casi anche di tipo più moderno:
mappe dei pollini, datazioni al radiocarbonio, ecc.) spesso utili per la linguistica
storica sono quelli relativi all'insorgenza del neolitico. Mi permetto, en passant,
di ricordarvi la relatività della cronologia archeologica, basata su una griglia
di caratteristiche solo culturali e non cronologiche assolute, per cui si può avere
un "paleolitico" anche oggi, III millenio d.C., in alcune zone della Nuova Guinea,
mentre in Anatolia si era passati al "neolitico" già nel VIII-VII millenio a.C.
L'evento "neolitico", in generale, è collegato alla diffusione dell'agricoltura, ed è
stato recentemente ancorato anche ad una cronologia assoluta grazie alle datazioni
al carbonio 14 (cfr. oltre).
L'insorgere del neolitico è importante perché può forse essere collegato
all'apparizione delle famiglie linguistiche che ricostruiamo con maggiore profondità:
l'esempio migliore è quello della teoria dell'origine neolitica
dell'indoeuropeo che
tratteremo nel prossimo capitolo.
[tav. 8]
La nascita poligenetica del neolitico in più centri indipendenti e legati alla domesticazione
di cereali selvatici diversi. Riprodotto da Luca Cavalli Sforza, Gènes, peuples et langues,
Paris, Éditions Odile Jacob - Travaux du Collège de France, 1996; trad. It. Geni, popoli e
lingue, Milano, Adelphi, 1996, p. 151.
Un altro aiuto esterno alla interpretazione storica dei dati linguistici
(con tutte le cautele del caso, naturalmente, per le quali valgono le stesse avvertenze
che per i dati archeologici) può venire dai lavori della genetica di popolazione umana,
in particolare quelli sul campionamento di componenti geniche significative del DNA,
perseguiti negli ultimi venti anni da una scuola italiana (e nello specifico pavese)
di origine, ma di fatto accademicamente americana, centrata intorno alle figure di
Alberto Piazza e, soprattutto, di Luca Luigi Cavalli-Sforza.
Negli anni precedenti un grande lavoro era già stato compiuto sulla sequenziazione
(e retrocostruzione filogenetica) del DNA mitocondriale (mtDNA). Su questo tipo di
procedura avevamo già parlato nella precedente sezione a proposito della filogenesi
dei procarioti: il mitocondrio, infatti, per ricapitolare brevemente, è un organello
dotato di corredo genico proprio (distinto da quello presente nel nucleo, pertanto)
presente in (quasi) tutte le cellule eucariote, ed è, evoluzionisticamente, un
batterio (lo ritrovate infatti riportato nella tavola generale dell'albero della vita)
diventato simbionte della proto-cellula eucariota; il mtDNA è aploide e viene trasmesso
dalla sola linea materna; sequenziando un vasto campione (la cui scelta è stata comunque
discussa) di mtDNA della popolazione mondiale è stato perciò possibile ritracciare un
comune ascendente. Nonostante l'importanza di questi risultati, la scoperta è stata
in parte svuotata di valore dalla strumentalizzazione giornalistica, come se fosse
con ciò dimostrato che tutti discendiamo da un'unica donna (falso: il fatto che sopravviva la
linea evolutiva del DNA di una sola donna non significa che all'alba della specie uomo
ci fosse un'unica donna ... a parte il fatto che sarebbe stato molto triste per i protoominidi maschi,
e molto stanchevole per la nostra supposta protoominide femmina ;-), cui è stato
anche dato il nome di Eva (che strano...), ecc. ecc. Una descrizione scientificamente
corretta della questione è in Luigi Luca Cavalli-Sforza - Paolo Menozzi - Alberto Piazza,
Storia e geografia dei geni umani, Milano, Adelphi, 1997, pp. 156-166.
Per superare queste difficoltà Cavalli-Sforza si è invece concentrato sul DNA principale,
diploide, e più facilmente portatore di mutazioni, ossia di errori nella replicazione. Le
mutazioni, in assoluto, sono rare (ricordate il discorso sulla stabilità
del genoma che avevamo affrontato parlando dei procarioti?), dell'ordine di 1 su 200 milioni
di nucleotidi, ma in perlopiù avvengono in geni diversi, e lo stesso gene, nel tempo,
può subire mutazioni diverse. In una popolazione possono pertanto esistere diverse varianti
(dette "alleli") di uno stesso gene, che verrà così detto "gene polimorfico". «I geni
polimorfici, o polimorfismi, costituiscono i marcatori usati in tutti i tipi di studi
genetici, inclusi quelli riguardanti l'evoluzione» (Cavalli-Sforza cit. p. 9). Il
metodo usato dal nostro studioso consiste, dato un elevato numero di geni
che presentino alleli diversi, nell'individuare delle "componenti principali" (CP), ossia
delle classi di polimorfismi che presentino tra loro una correlazione di percentuale
significativa. Per la popolazione mondiale sono state individuate sette CP, delle
quali le prime tre sono le più quantitavamente rilevanti. Nella tavola seguente,
giusto per dare un'idea del tipo di metodo impiegato, riporto la composizione di
queste prime tre CP.
[tav. 9]
I geni polimorfici (marcatori genici) che presentano le correlazioni più elevate e definiscono
le tre "componenti" geniche principali dell'umanità; il segno "più" o "meno" indica se
l'allelo è associato ad una correlazione negativa o positiva.
Riprodotto da Luigi Luca Cavalli-Sforza - Paolo Menozzi - Alberto Piazza, The
History and Geography of Human Genes, Princeton University Press, 1994; trad.
it. Storia e geografia dei geni umani, Milano, Adelphi, 1997, p. 252.
I dati esibiti in questa tavola non dicono certo molto ai non biologi. Ma se si prova a tracciare su una mappa cromatica i risultati ottenuti dallo studio di queste prime tre CP, otterremo un panorama che ci è molto più informativo, e che concorda con alcune delle conclusioni raggiunte dalla paleontologia (come l'origine africana dell'Homo sapiens), dall'archeologia (alcune correlazioni con la diffusione dell'agricultura neolitica) ed a volte, lo vedremo nei capitoli seguenti, eventualmente anche dalla linguistica (ad es. si possono forse indivbiduare le componenti geniche dei baschi, dei pre-lapponi e (?) degli indoeuropei).
[tav. 10]
Mappa cromatica delle tre prime componenti geniche principali (DNA) della popolazione umana.
Il verde è associato alla prima componente, il blu alla seconda ed il rosso alla terza.
Ne risultano ben distinti gli africani (giallo-verde), i caucasiodi (blu-verde) e gli
australiani (rosso), mentre orientali ed amerindi mostrano la variazione genica maggiore
e condividono somiglianze da un lato con gli europei (violaceo-azzurrognolo nella Siberia
centrale) e dall'altro con gli australiani (violaceo in zone dell'America e della Siberia
antistante lo stratto di Bering). Chiaramente visibili sono anche i gradienti dovuti
alle mescolanze tra africani e caucasioidi nell'Africa settentrionale e tra caucasioidi
ed orientali nell'Asia centrale.
Riprodotto da Luigi Luca Cavalli-Sforza - Paolo Menozzi - Alberto Piazza, The
History and Geography of Human Genes, Princeton University Press, 1994; trad.
it. Storia e geografia dei geni umani, Milano, Adelphi, 1997.
I risultati di Cavalli-Sforza ( che, oltre tutto, ha esplicitamente cercato di collegarsi anche alla linguistica), va però avvertito che godono in genere di cattiva stampa presso i linguisti, per via della sua malaugurata decisione di appoggiarsi alle classificazioni linguistiche di Merrit Ruhlen, che ogni buon linguista sa essere, per dirla il più gentilmente possibile, perlomeno fantastiche. La diffidenza della comunità linguistica è certo giustificata, ma questo nulla toglie alla serietà scientifica dei risultati biologici del lavoro di Cavalli-Sforza, i cui risultati biologici sarebbe sciocco trascurare solo perché non si è d'accordo con le sue conclusioni linguistiche. Anzi, è certo da apprezzare il tentativo di interdisciplinarità e di ricerca di dialogo con discipline diverse messo in atto da Cavalli-Sforza, e perciò è tanto più da rammaricare che abbia finito per trovare interlocutori sbagliati.
Il metodo storico comparativo, cui abbiamo più volte riferito
nei paragrafi precedenti, e che trovate accuratamente descritto nel manuale di
Graffi - Scalise (ragione per cui non vale la pena di ripeterne la descrizione qui)
prima nelle sue linee generali (p. 230-3), poi con l'esempio della ricostruzione
dell'indoeuropeo (237-240) ed infine in relazione alla natura delle "leggi fonetiche"
(pp. 241-7), è l'unico metodo scientifico per stabilire la parentela linguistica.
Le sue origini, come anche per altre discipline "storiche", sono sostanzialmente
romantiche, e (nonostante la famiglia linguistica più precocemente individuata sia
in realtà quella austronesiana: Frederick de Houltman 1603; e quella più precocemente
"dimostrata" scientificamente sia l'uralica: János Sajnovics 1770), la costituzione
del metodo e tutte le sue vicende ottocentesche sono indissolubilmente legate
all'indoeuropeo (e secondariamente alle due sottofamiglie germanica e romanza).
La data storica è, infatti, il 1816, quando cui il maguntintino Franz Bopp (1791-1867)
pubblicò il suo Über das Conjugationssystem der Sanskritsprache in Vergleichung
mit jenem der griechischen, lateinischen, persischen und germanischen ('Sul
sistema di coniugazione del sanscrito in comparazione con quelli del greco, del
latino, del persiano e del germanico'), Frankfurt am Mein, 1816: la stessa data
in cui la nascente filologia testuale trovava il suo primo manifesto nel Properzio
di Karl Lachmann (1793-1851). Non erano mancati i precedenti: a risvegliare gli
interessi per gli studi orientali e del sanscrito era stato soprattutto Friedrich
Schlegel (1772-1829) col suo celebre Ueber die Sprache un Wiesenheit der Indier
('Sulla lingua e la sapienza degli indiani'), Heidelberg, 1908. Come vedete ci
troviamo davvero nel cuore del Romanticismo germanico.
Lasciando l'illustrazione del funzionamento concreto del metodo
al manuale, qui vorrei solo far comprendere meglio la logica del metodo, ed il
particolare status ontologico e scientifico dei suoi risultati: molti
dei fraintendimenti sulla possibilità di altri sistemi di comparazione, e sulla
portata scientifica dei risultati del metodo storico-comparativo, derivano infatti
proprio da una imperfetta comprensione della logica in base alla quale esso funziona.
Quello che si richiede per sostenere che due forme linguistiche (figlie: F1, F2) discendano da una
ed una sola altra forma (madre: M) è qualcosa che accomuni univocamente le figlie
distinguendole da tutte le altre forme possibili (schematicamente: [F1,2]:...),
nella fattispecie forme lessicali (radici) o morfologiche (morfemi) accomunate da
regolari corrispondenze di suoni ("leggi fonetiche"). Il requisito logico non è quello
della "somiglianza delle forme", ma della "regolare corrispondenza delle forme",
elemento per elemento dell'espressione: si richiede, in altre parole, un particolare
tipo di somiglianza che non possa essere fortuito, e non una somiglianza casuale.
Si tratta, va notato, in fin dei conti del medesimo tipo di requisito richiesto
in filologia (propriamente critica testuale) per la ricostruzione della
discendenza delle copie di un testo dal suo originale: non a caso avevo sottolineato
la coincidenza cronologica e culturale delle date di nascita del "metodo storico-comparativo"
in linguistica e "del metodo lachmanniano" in critica testuale. I "mutamenti"
che avvengono nel procedimento di copiatura di un testo sono in questo caso il
corrispettivo del cambiamento linguistico; la restituzione del testo originale è
il corrispettivo della ricostruzione della protolingua. Gli elementi che servono
per la ricostruzione, cui corrispondono in linguistica le "somiglianze sistematiche"
in radici e morfemi, sono in questo caso gli errori. Errori, però, che devono
avere requisiti logici che i filologi hanno esplicitato anche più chiaramente dei
linguistici (che è la ragione per cui uso le loro conclusioni per meglio chiarire
le idee anche a noi linguisti). Un errore per essere significativo deve essere allo
stesso tempo congiuntivo (non può essersi generato indipendentemente in più testimoni)
e separativo (non può essere stato facilmente scoperto ed eliminato in qualche
testimone): una variante banale non riunisce necessariamente i testimoni che la
presentano, in quanto può essere poligenetica, né li separa dagli altri che non la presentano,
in quanto possono averla eliminata per congettura; deve trattarsi invece
di un errore non banale, in modo da rendere improbabile tanto la poligenesi ( => congiunge
i testimoni che lo presentano in un'unica classe di discendenti del capostipite
dell'errore) e la correzione per congettura (=> separa i testimoni che non presentano
l'errore dalla classe di quelli che lo presentano).
La nozione di "corrispondenza attraverso leggi fonetiche" del metodo storico -
comparativo in linguistica storica giuoca lo stesso ruolo della "distintività",
intesa come intersezione di "separatività" e "congiuntività", in critica testuale.
Lo stesso tipo di logica (usare per la classificazione solo elementi che possano disegnare classi esclusive) caratterizza in effetti quasi tutte le classificazioni genealogiche. Anche la ricostruzione filogenetica in biologia, soprattutto quando poteva ricorrere solo alle caratteristiche morfologiche (con la genetica molecolare il ricorso a procedure statistiche diventa inevitabile), obbediva allo stesso schema: si distingue infatti tra "plesiomorfie" (caratteri ancestrali e primitivi) ed "apomorfie" (caratteri derivati o specializzati). Solo i caratteri plesiomorfi sono "distintivi" nel senso di cui sopra, dato che gli apomorfi possono essere poligenetici.
Varie teorie, infine, sono state proposte sulla natura delle forme che il metodo storico - comparativo ricostruisce: si va da posizioni assolutamente "realiste" a posizioni più astrattamente "formaliste". Per le prime la ricostruzione produce uno stato di lingua "reale" come qualsiasi lingua effettivamente usata da una comunità linguistica in un dato punto del tempo e dello spazio. Per le seconde, invece, le forme ricostruite sono di natura essenzialmente algebrica e formale: la protoforma è, in sostanza, solo la migliore funzione che genera i dati delle lingue reali. Questa impostazione "funzionale" (nel senso matematico) della ricostruzione, fu illustrata magistralmente dal solito Hjelmslev, di cui abbiamo già molto parlato (cfr. Louis Hjelmslev, Sproget. En introduktion, Charlottenlund, The Nature Method Center, 1963; trad it. Il linguaggio a cura di Giulio C. Lepschy, Torino, Einaudi, 1970 "PBE"; il libro, a differenza di altri scritti di Hjelmslev, è di facilissima e gradevole lettura: un classico da consigliare ad occhi chiusi ...). Come si sarà ormai compreso è solo questa interpretazione funzionalistica delle ricostruzioni che davvero concorda con tutte le altre osservazioni che abbiamo condotto finora: se le lingue da sottoporre alla comparazione vanno trattate come diasistemi ed analizzate nelle loro componenti, la protolingua che da queste sommatorie deriva non sarà altro che la matrice che meglio descrive tali diasistemi. Tutte le istanze più propriamente realistiche, come la plausibilità fonologica, la coerenza tipologica, e, a partire da queste, la ricostruzione interna, sono tutte operazioni successive alla imprescindibile ricostruzione algebrica, ed operazioni da effettuare sempre con tutta la cautela che la specificità imposta dall'oggetto in questione (che NON è una lingua "vera" a tutti gli effetti, come solo gli ingenui possono pensare, ma bensì solo la nostra migliore approssimazione descrittiva al problema delle origini delle lingue "vere"). Ed a questo scopo anche altri dati esterni, quali la genetica, l'archeologia, e la storia possono, come abbiamo visto, pure contribuire.
L'unica, presunta, alternativa al metodo storico - comparativo
che sia stata proposta dal dal 1816 ad oggi è il metodo della mass comparison
proposto da Joseph Greenberg (che ormai ben conosciamo per il suo contributo alla
tipologia linguistica) ed adottato tra gli altri da Merrit Ruhlen (che pure conosciamo
fin troppo bene per le sue tesi truffaldine sulla monogenesi delle lingue).
Non è qui la sede per una disamina dettagliata: per una critica sintetica potete,
ad esempio, riferirvi ad alcune pagine del più volte citato Lyle Campbell (American
Indian Languages. The Historical Linguistics of Native America, New York - Oxford,
Oxford University Press, 1997, pp. 209-214). Qui basti dire che, teoricamente, ci
aspetteremmo che la teoria della "mass comparison" non possa funzionare, dato che viola la "logica" della ricostruzione
che abbiamo faticosamente individuato nel paragrafo precedente.
Di fatto, per essere
obiettivi, la teoria di Greenberg ha dato risultati che vanno dai sostanzialmente corretti agli assolutamente
sbagliati: la classificazione delle lingue dell'Africa che fu la prima grande impresa
di Greenberg (Languages of Africa, Bloomington, Indiana University Press, 1963)
è stata, almeno nelle sue grandi linee, confermata dalle ricostruzioni
finora conseguite con il metodo tradizionale (che richiede lavori molto più lunghi
e complessi del metodo di Greenberg); l'analogo lavoro compiuto da Greenberg per le
lingue native delle Americhe (Language in the Americas, Stanford, Stanford
University Press, 1987) ha invece dato risultati ritenuti unanimamente inaccettabili
da tutti gli amerindiologi, e che sono spesso stati smentiti dalle ricostruzioni
"tradizionali". L'unica conclusione possibile è che a volte anche le teorie sbagliate
per caso ci imbroccano, specie se usate (o dimenticate?) da studiosi che conoscono
peraltro molto bene il loro campo (come fu il caso di Greenberg e le lingue africane),
ma non per questo cessano di essere sbagliate ...