Antonio Sciarretta's Toponymy |
Tuttavia, questo metodo dà luogo a numerose piccoli "continua" e ad aree isolate, rendendo di fatto impossibile una classificazione comprensiva. In questa pagina propongo di usare un algoritmo basilare di partizione dati (clustering) al fine di raggruppare le aree omogenee in un numero dato di macro-aree. L'algoritmo in questione è il classico k-medie, che minimizza la somma delle distanze tra i dati di uno stesso raggruppamento ed il suo elemento medio. Diversamente da molti studi dialettometrici che hanno applicato k-medie (in realtà varianti più sofisticate dell'algoritmo base) prendendo come misura della "distanza" quella di Levenshtein fra singole parole rese nei vari dialetti, qui uso la distanza definita nella pagina precedente, cioè quella calcolata a partire dalle stringhe di 10 caratteri che codificano i 10 fenomeni fonetici considerati.
Usando questo metodo, ed imponendo successivamente la ripartizione in 2, 3, 4 e 5 macro-aree, ho ottenuto le carte seguenti.
I dati e i risultati sembrano confermare le classificazioni dei dialettologi (che non usavano k-medie). Volendo fare 2 gruppi, si separano chiaramente due aree che ricordano i gruppi metafonetici di Pellegrini, quello centrale e quello sud-orientale, dal resto dei dialetti siciliani. Aggiungendo un terzo gruppo, si separano i dialetti di origine gallo-italica di Nicosia e Sperlinga, S. Fratello, Novara e Aidone. Con K=4 l'area centrale si fraziona in una parte che resta insieme all'area sud-orientale ed una che va da sé. Con K=5 si separa un gruppetto di dialetti, tutti influenzati dal gallo-italico, tra l'Etna e i Nebrodi.
Una volta classificati con questo metodo tutti i dialetti centro-meridionali, il risultato che si ottiene per la Sicilia è in linea con la classificazione parziale K=4 o K=5 qui sopra. In Sicilia compaiono aree afferenti a due raggruppamenti dialettali: quello cosentino (che comprende l'area centrale in giallo qui sopra) e quello meridionale estremo (siciliano-calabrese-salentino) che comprende le altre aree.