Antonio Sciarretta's Toponymy |
Tuttavia, questo metodo dà luogo a numerose piccoli "continua" e ad aree isolate, rendendo di fatto impossibile una classificazione comprensiva. In questa pagina propongo di usare un algoritmo basilare di partizione dati (clustering) al fine di raggruppare le aree omogenee in un numero dato di macro-aree. L'algoritmo in questione è il classico K-medie, che minimizza la somma delle distanze tra i dati di uno stesso raggruppamento ed il suo elemento medio. Altri studi dialettometrici hanno fatto del clustering prendendo come misura della "distanza" quella di Levenshtein fra singole parole rese nei vari dialetti, oppure, come nel caso del gruppo salisburghese di dialettometria di H. Goebl, la similarità binaria tra gli esiti delle voci per i soli punti dell'AIS. Qui invece, oltre a considerare i dialetti dei singoli paesi, uso la distanza definita nella pagina precedente, cioè quella calcolata a partire dalle stringhe di 15 caratteri che codificano i 15 fenomeni fonetici considerati. Da notare che l'algoritmo K-medie (al contrario di quelli usati da H. Goebl) dà risultati variabili, poiché usa una distribuzione iniziale stocastica. Il mio metodo prevede dunque l'esecuzione dell'agoritmo per un numero elevato di volte (distribuzioni iniziali), e la scelta della migliore partizione (quella con il valore minimo del criterio di minimizzazione).
Usando questo metodo ho ottenuto diverse ripartizioni al variare di K. Secondo il metodo delle silhouette il numero ottimo è K=8. Il risultato corrispondente è mostrato nella figura che segue. Massimi intermedi si ottengono per K=4 ("sottospazi" nella legenda) e K=2 ("spazi"). Le aree a campitura omogenea sono consistentemente classificate insieme per ogni K e dunque vanno considerate come le aree centrali dei vari gruppi. Le aree tratteggiate o puntinate presentano oscillazioni nella classificazione e vanno interpretate come aree di transizione tra gruppi puri (il colore predominante indica la maggiore vicinanza ad un tale gruppo).
I gruppi risultanti sono:
Da notare che l'algoritmo usato non ha una misura diretta della prossimità, né della contiguità, geografica. Il fatto che naturalmente emergano raggruppamenti dialettali spazialmente continui e connessi (tranne alcune "isole", ad esempio, Campobasso) va visto come un "successo" dell'algoritmo stesso.
E' interessante confrontare i gruppi ottenuti grazie all'algoritmo con le principali isoglosse identificate dai linguisti. A tale scopo, ho preso le isoglosse seguenti: 1) limite settentrionale della sonorizzazione postnasale /nt/ > /nd/ (tando) simultanea all'assimilazione progressiva /nd/ > /nn/ (quanno), cioè la linea Roma-Ancona che tradizionalmente separa i dialetti "mediani" da quelli "perimediani"; 2) limite settentrionale della riduzione a schwa di vocali atone (compresa o non la /-a/), cioè l'isoglossa Terracina-Accumoli-Aso che tradizionalmente separa i dialetti "mediani" da quelli "alto-meridionali"; 3) limite settentrionale di /pl/ > /kj/ (chiove), cioè la poco conosciuta linea Gaeta-Sora-Termoli; 4) limite settentrionale di /cj/ > /tts/ (vrazzo), cioè la linea Salerno-Lucera-Vieste che spesso divide i dialetti "alto-meridionali" in due sezioni; 5) limite settentrionale dei sistemi vocalici tonici non-standard ("siciliano" e "sardo") che talvolta, in concorrenza col limite meridionale della schwa (qui non considerato perché molto irregolare in Calabria), separa i dialetti "alto-meridionali" da quelli "meridionali estremi"; 6) limite occidentale di /lj/ > /gghj/, ovvero un poco conosciuto fascio di isoglosse, perché parzialmente sovrapponibile con altri limiti di tratti sud-orientali, Bovino-Diamante-Melissa-Vibo.
Il confronto è riportato nelle carte che seguono. Si vede che il confine tra gruppo perimediano e mediano corrisponde all'incirca all'isoglossa 1. Il confine tra gruppo mediano e gruppo abruzzese segue, deviandosene in più punti, l'isoglossa 2. Il confine settentrionale dei gruppi sannita e napoletano-molisano rispetto ai gruppi mediano e abruzzese segue all'incirca l'isoglossa 3. Il confine tra i gruppi napoletano-molisano e sannita rispetto a quelli pugliese e irpino-lucano corrisponde grosso modo all'isoglossa 4. Il confine meridionale dei due gruppi suddetti corrisponde all'incirca all'isoglossa 5. Il confine trasversale tra i gruppi pugliese e irpino-lucano e tra quelli cosentino e salentino-calabrese coincide in larga misura con l'isoglossa 6.
E' anche interessante studiare la gerarchia relativa di questi gruppi osservando come essi emergono all'aumentare del numero K.
Imponendo una partizione in K=2 gruppi, il gruppo centrale (umbro-marchigiano-laziale-abruzzese-campano) si separa da quello meridionale (pugliese-irpino-lucano-calabrese), secondo un fascio di isoglosse che ricalca la linea Salerno-Lucera-Vieste (isoglossa 4).
Con K=3, la separazione tra il gruppo più settentrionale e quello centrale si sposta più a nord, lungo una linea che potremmo definire Gaeta-Sora-Termoli (isoglossa 3). A sud dell'isoglossa 5 emerge un terzo gruppo.
Con K=4, la dorsale appenninica (isoglossa 2) separa il gruppo perimediano da quello centrale (abruzzese-molisano-campano), che a sua volta torna ad essere separato dall'isoglossa 4 dal gruppo apulo-lucano.
Con K=5, il gruppo campano-molisano è ormai definito dalle isoglosse 3 a nord e 4 a sud.
Con K=6, il gruppo centrale si suddivide ulteriormente nei gruppi mediano e abruzzese, separati dall'isoglossa 2.
Con K=7, il gruppo apulo-lucano si suddivide ulteriormente nei gruppi irpino-lucano e pugliese, separati dall'isoglossa 6.
Con K=8, l'ultimo gruppo ad emergere è quello cosentino (vedi carta in alto).
In questa carta riporto la classificazione tradizionale di G.B. Pellegrini (1877), oggi comunemente seguita, per cui v. alla pagina principale.
In seguito all'inclusione della Toscana meridionale, delle Marche settentrionali e della Sicilia nel calcolo della partizione ottima, il quadro è modificato come riportato nella carta seguente. Si nota che la Toscana e le Marche settentrionali vanno per intero con il gruppo perimediano, mentre la Sicilia risulta divisa tra il gruppo salentino-calabrese, che ora converrà chiamare "meridionale estremo", e quello cosentino (le aree centrali più conservative).