Dialetti pugliesi

I parte - Tratti fonetici

II parte - Aree dialettali
Classificazione dei dialetti

In questa pagina intendo proporre un modello per descrivere le variazioni dialettali e le relative aree identificate nelle due parti precedenti. Il modello tradizionale si avvale delle isoglosse, linee riportate su carte geografiche che delimitano l'aerale di un certo tratto linguistico (lessicale, morfologico o, come nel nostro caso, fonetico), ma non fornisce un criterio per definire i dialetti che risultano compresi tra queste isoglosse. I linguisti ricorrono allora a descrizioni qualitative e, spesso, arbitrarie. Ad esempio, la classificazione di G.B. Pellegrini distingue sei varietà, tre pugliesi: dauno-appenninica, garganica, apulo-barese, appartenenti al gruppo "meridionale intermedio", e tre salentine: settentrionale, centrale e meridionale, appartenenti al gruppo "meridionale estremo". Il confine tra i due gruppi è costituito dalla soglia messapica (o linea "Taranto-Brindisi"); l'Ofanto segna il confine tra dauno-appenninici e apulo-baresi, mentre i garganici sono definiti geograficamente. Restano esclusi alcuni centri al confine nord classificati come molisani. Per la zona garganica, diverse altre classificazioni più precise sono state proposte (Valente, Stehl, Granatiero), le quali in genere prevedono una separazione tra una parte settentrionale (dauna), che presenta affinità con i dialetti appenninici e molisani, e una meridionale (apulo-foggiana), con alcuni centri che confluiscono nel più vasto raggruppamento apulo-barese.

Nella II parte di queste note ho già proposto un'identificazione delle aree dialettali che risultano distinte considerando alcune isoglosse fonetiche. Inoltre ho mostrato come, contando le isoglosse che separano le aree, ovvero il loro grado di "diversità", sia possibile raggruppare più aree in macro-aree relativamente omogenee.

Tuttavia, questo metodo dà luogo a numerose piccoli "continua" e ad aree isolate, rendendo di fatto impossibile una classificazione comprensiva. In questa pagina propongo di usare un algoritmo basilare di partizione dati (clustering) al fine di raggruppare le aree omogenee in un numero dato di macro-aree. L'algoritmo in questione è il classico k-medie, che minimizza la somma delle distanze tra i dati di uno stesso raggruppamento ed il suo elemento medio. Diversamente da molti studi dialettometrici che hanno applicato k-medie (in realtà varianti più sofisticate dell'algoritmo base) prendendo come misura della "distanza" quella di Levenshtein fra singole parole rese nei vari dialetti, qui uso la distanza definita nella pagina precedente, cioè quella calcolata a partire dalle stringhe di 10 caratteri che codificano i 10 fenomeni fonetici considerati.

Usando questo metodo, ed imponendo successivamente la ripartizione in 2, 3, 4 e 5 macro-aree, ho ottenuto le carte seguenti.

I dati e i risultati sono parzialmente in linea con le classificazioni dei dialettologi (che non usavano k-medie). Ripartendo in K=2 gruppi, si ritrova la linea "Taranto-Brindisi" che separa i dialetti pugliesi (con taranto, Ceglie e Ostuni) da quelli salentini (con Brindisi ecc.). Aggiungendo un terzo gruppo, emerge quello costituito dai dialetti nord-occidentali, con il versante settentrionale del Gargano, Foggia e parte dell'Appennino, grosso modo corrispondente ai dialetti dauni e apulo-foggiani delle classificazioni tradizionali. Con K=4 emerge una zona appenninica, con le isole di Poggio Imperiale e Tremiti, mentre per compensazione il gruppo apulo-barese si estende verso sud, occupando il Salento settentrionale (Brindisi e Gallipoli). Con K=5 questo Salento settentrionale si separa.