Dialetti centro-meridionali

I parte - Tratti fonetici

II parte - Aree dialettali

Classificazione dei dialetti

In questa pagina intendo proporre un modello per descrivere le variazioni dialettali e le relative aree identificate nelle due parti precedenti. Il modello tradizionale si avvale delle isoglosse, linee riportate su carte geografiche che delimitano l'aerale di un certo tratto linguistico (lessicale, morfologico o, come nel nostro caso, fonetico), ma non fornisce un criterio per definire i dialetti che risultano compresi tra queste isoglosse. I linguisti ricorrono allora a descrizioni qualitative e, spesso, arbitrarie. La classificazione tradizionale prevede una sezione "mediana" ed una "meridionale intermedia" separate da una linea che va dall'Aso ad Accumoli al Circeo.

Nella II parte di queste note ho già proposto un'identificazione delle aree dialettali che risultano distinte considerando alcune isoglosse fonetiche. Inoltre ho mostrato come, contando le isoglosse che separano le aree, ovvero il loro grado di "diversità", sia possibile raggruppare più aree in macro-aree relativamente omogenee.

Tuttavia, questo metodo dà luogo a numerose piccoli "continua" e ad aree isolate, rendendo di fatto impossibile una classificazione comprensiva. In questa pagina propongo di usare un algoritmo basilare di partizione dati (clustering) al fine di raggruppare le aree omogenee in un numero dato di macro-aree. L'algoritmo in questione è il classico K-medie, che minimizza la somma delle distanze tra i dati di uno stesso raggruppamento ed il suo elemento medio. Altri studi dialettometrici hanno fatto del clustering prendendo come misura della "distanza" quella di Levenshtein fra singole parole rese nei vari dialetti, oppure, come nel caso del gruppo salisburghese di dialettometria di H. Goebl, la similarità binaria tra gli esiti delle voci per i soli punti dell'AIS. Qui invece, oltre a considerare i dialetti dei singoli paesi, uso la distanza definita nella pagina precedente, cioè quella calcolata a partire dalle stringhe di 15 caratteri che codificano i 15 fenomeni fonetici considerati. Da notare che l'algoritmo K-medie (al contrario di quelli usati da H. Goebl) dà risultati variabili, poiché usa una distribuzione iniziale stocastica. Il mio metodo prevede dunque l'esecuzione dell'agoritmo per un numero elevato di volte (distribuzioni iniziali), e la scelta della migliore partizione (quella con il valore minimo del criterio di minimizzazione).

Usando questo metodo ho ottenuto diverse ripartizioni al variare di K. Secondo il metodo delle silhouette il numero ottimo è K=8. Il risultato corrispondente è mostrato nella figura che segue. Massimi intermedi si ottengono per K=4 ("sottospazi" nella legenda) e K=2 ("spazi"). Le aree a campitura omogenea sono consistentemente classificate insieme per ogni K e dunque vanno considerate come le aree centrali dei vari gruppi. Le aree tratteggiate o puntinate presentano oscillazioni nella classificazione e vanno interpretate come aree di transizione tra gruppi puri (il colore predominante indica la maggiore vicinanza ad un tale gruppo).

Tutto_classificazione (488K)

I gruppi risultanti sono:

  • Un gruppo "perimediano" comprendente i capoluoghi AN, PG, VT, RM e LT e, in dettaglio,:
    • Nelle Marche, l'anconetano, il Conero, l'osimano, lo jesino, il senigalliese, Arcevia, Sassoferrato e il fabrianese.
    • In Umbria, il perugino, l'eugubino, il tifernate, il nocerino, l'assisiate, il tuderte, l'orvietano e l'amerino.
    • Nel Lazio, l'intero viterbese, la provincia romana ad ovest del Tevere, Roma e i castelli meridionali, il pontino con Latina.
    • In Basilicata, la frazione Monticchio di Rionero.
  • Un gruppo "mediano" comprendente i capoluoghi MC, FM, TN, RI, FR e AQ e, in dettaglio;
    • Nelle Marche, il maceratese, il camerte, il fermano, la destra Aso, nonché alcune frazioni di Arquata.
    • In Umbria, lo spoletino, il folignate, il ternano, il nursino e il narnese.
    • Nel Lazio, l'intero reatino, la provincia romana ad oriente del Tevere, la Ciociaria occidentale, la valle lepina, Terracina e Fondi, nonché Ausonia e Spigno.
    • In Abruzzo, l'aquilano sabino, il carseolano, il tagliacozzano, la Marsica occidentale e la Valroveto tranne Balsorano.
  • Un gruppo "abruzzese" comprendente i capoluoghi AP, TE, PE e CH e, in dettaglio:
    • Nelle Marche, l'ascolano (tranne alcune frazioni di Arquata) e il sambenedettese.
    • In Abruzzo, il teramano, il pescarese, il chietino-ortonese, il lancianese, il basso vastese, il peligno, la Marsica orientale, l'aquilano vestino.
    • In Molise, il termolese e Boiano.
    • Nel Lazio, il gaetano-formiano, Monte S. Biagio e parte della Ciociaria centrale.
  • Un gruppo "campano-molisano" comprendente i capoluoghi IS, CB, BN, NA, SA e CE e, in dettaglio:
    • Nel Lazio, la Ciociaria orientale, il sorano, il cassinese, l'aquinate, Pontecorvo e l'ausonio (tranne Ausonia e Spigno).
    • In Molise, tutta la regione.
    • In Campania, il napoletano, il casertano, il beneventano occidentale, il nocerino-sarnese, la costiera, le isole e il salernitano fino al Sele.
    • In Puglia, il Gargano centro-settentrionale, l'Appennino e la destra Fortore.
    • In Basilicata i centri di origine gallo-italica di Pietragalla, Potenza, Pignola, Tito, Picerno, Trecchina e alcune le frazioni di Abriola e Savoia.
  • Un gruppo "pugliese", comprendente i capoluoghi FG, BT, BA, TA, MT e BR e, in dettaglio:
    • In Puglia, il Gargano orientale e meridionale, Foggia, il lucernino, Cerignola e la sinsitra Ofanto, l'intero barlettano-andriese-tranese, l'intero barese, l'intero tarantino, l'intero brindisino tranne la fascia meridionale, il neretano.
    • In Campania, alcuni comuni dell'arianese, Atripalda e la destra Sabato.
    • In Basilicata, l'intero materano con Albano ma senza Cirigliano, Gorgoglione e Aliano, la bassa valdagri, la bassa valsinni.
    • In Calabria, l'Alto Jonio cosentino, Cassano e Saracena.
  • Un gruppo "lucano-irpino" con il capoluogo AV e, in dettaglio:
    • In Campania, la montagna di Montefusco, l'intero avellinese tranne le aree già menzionate, Acerno, Campagna, la valdisele, il Vallo di Diano tranne Sala, il Cilento settentrionale e centrale.
    • In Puglia, il bovinese, Troia, l'ascolano.
    • In Basilicata, l'intero potentino tranne Viggiano, le aree già menzionate e la fascia meridionale.
  • Un gruppo "cosentino" con il capoluogo CS e, in dettaglio:
    • In Campania, il cilentano meridionale e Sala.
    • In Basilicata, Viggiano, Maratea, Lauria e l'Alto Mercure, Terranova.
    • In Calabria, il basso Noce, Scalea, Diamante, la valdesaro, la valdicrati, il silano, il terinese e il lametino.
  • Un gruppo "salentino-calabrese" con i capoluoghi LE, KR, VV, CZ e RC e, in dettaglio:
    • In Puglia, il leccese, l'otrantino, il leucano e il gallipolino.
    • In Calabria, l'intero crotonese tranne le propaggini silane, il catanzarese, il vibonese, la locride, il palmese, il reggino.

Da notare che l'algoritmo usato non ha una misura diretta della prossimità, né della contiguità, geografica. Il fatto che naturalmente emergano raggruppamenti dialettali spazialmente continui e connessi (tranne alcune "isole", ad esempio, Campobasso) va visto come un "successo" dell'algoritmo stesso.

E' interessante confrontare i gruppi ottenuti grazie all'algoritmo con le principali isoglosse identificate dai linguisti. A tale scopo, ho preso le isoglosse seguenti: 1) limite settentrionale della sonorizzazione postnasale /nt/ > /nd/ (tando) simultanea all'assimilazione progressiva /nd/ > /nn/ (quanno), cioè la linea Roma-Ancona che tradizionalmente separa i dialetti "mediani" da quelli "perimediani"; 2) limite settentrionale della riduzione a schwa di vocali atone (compresa o non la /-a/), cioè l'isoglossa Terracina-Accumoli-Aso che tradizionalmente separa i dialetti "mediani" da quelli "alto-meridionali"; 3) limite settentrionale di /pl/ > /kj/ (chiove), cioè la poco conosciuta linea Gaeta-Sora-Termoli; 4) limite settentrionale di /cj/ > /tts/ (vrazzo), cioè la linea Salerno-Lucera-Vieste che spesso divide i dialetti "alto-meridionali" in due sezioni; 5) limite settentrionale dei sistemi vocalici tonici non-standard ("siciliano" e "sardo") che talvolta, in concorrenza col limite meridionale della schwa (qui non considerato perché molto irregolare in Calabria), separa i dialetti "alto-meridionali" da quelli "meridionali estremi"; 6) limite occidentale di /lj/ > /gghj/, ovvero un poco conosciuto fascio di isoglosse, perché parzialmente sovrapponibile con altri limiti di tratti sud-orientali, Bovino-Diamante-Melissa-Vibo.

Il confronto è riportato nelle carte che seguono. Si vede che il confine tra gruppo perimediano e mediano corrisponde all'incirca all'isoglossa 1. Il confine tra gruppo mediano e gruppo abruzzese segue, deviandosene in più punti, l'isoglossa 2. Il confine settentrionale dei gruppi sannita e napoletano-molisano rispetto ai gruppi mediano e abruzzese segue all'incirca l'isoglossa 3. Il confine tra i gruppi napoletano-molisano e sannita rispetto a quelli pugliese e irpino-lucano corrisponde grosso modo all'isoglossa 4. Il confine meridionale dei due gruppi suddetti corrisponde all'incirca all'isoglossa 5. Il confine trasversale tra i gruppi pugliese e irpino-lucano e tra quelli cosentino e salentino-calabrese coincide in larga misura con l'isoglossa 6.

Tutto_isoglosse (488K)

E' anche interessante studiare la gerarchia relativa di questi gruppi osservando come essi emergono all'aumentare del numero K.

Imponendo una partizione in K=2 gruppi, il gruppo centrale (umbro-marchigiano-laziale-abruzzese-campano) si separa da quello meridionale (pugliese-irpino-lucano-calabrese), secondo un fascio di isoglosse che ricalca la linea Salerno-Lucera-Vieste (isoglossa 4).

Tutto_K2 (240K)

Con K=3, la separazione tra il gruppo più settentrionale e quello centrale si sposta più a nord, lungo una linea che potremmo definire Gaeta-Sora-Termoli (isoglossa 3). A sud dell'isoglossa 5 emerge un terzo gruppo.

Tutto_K3 (240K)

Con K=4, la dorsale appenninica (isoglossa 2) separa il gruppo perimediano da quello centrale (abruzzese-molisano-campano), che a sua volta torna ad essere separato dall'isoglossa 4 dal gruppo apulo-lucano.

Tutto_K4 (240K)

Con K=5, il gruppo campano-molisano è ormai definito dalle isoglosse 3 a nord e 4 a sud.

Tutto_K5 (240K)

Con K=6, il gruppo centrale si suddivide ulteriormente nei gruppi mediano e abruzzese, separati dall'isoglossa 2.

Tutto_K6 (240K)

Con K=7, il gruppo apulo-lucano si suddivide ulteriormente nei gruppi irpino-lucano e pugliese, separati dall'isoglossa 6.

Tutto_K7 (240K)

Con K=8, l'ultimo gruppo ad emergere è quello cosentino (vedi carta in alto).

In questa carta riporto la classificazione tradizionale di G.B. Pellegrini (1877), oggi comunemente seguita, per cui v. alla pagina principale.

Tutto_Pellegrini (488K)

In seguito all'inclusione della Toscana meridionale, delle Marche settentrionali e della Sicilia nel calcolo della partizione ottima, il quadro è modificato come riportato nella carta seguente. Si nota che la Toscana e le Marche settentrionali vanno per intero con il gruppo perimediano, mentre la Sicilia risulta divisa tra il gruppo salentino-calabrese, che ora converrà chiamare "meridionale estremo", e quello cosentino (le aree centrali più conservative).

Tutto_classificazione_estesa (488K)