Wikipedia in lombardo: dite addio al caos

di | 23 Novembre 2021

Chi conosce la storia di Wikipedia in lombardo sa che è stata lungamente travagliata. Creata nel 2005, ha avuto per anni un’amministrazione fortemente catalanista che voleva creare la koiné lombarda eliminando ogni differenza interna attingendo al catalano.

Si sceglie una grafia legittima, creata da un linguista con idea base koinezzante, e si inizia a inserire parole catalanissime come:

  1. Dia per giorno, invece di dì e dé: perché era presente in UN testo mantovano del ‘400
  2. Terratremoli invece di terremot, perché sì
  3. Congiont (cungjuunt) invece di insema, l’insieme matematico

Ma ci sono vari altri esempi, basta guardare qualche pagina vecchia.

Poi, quando ci si rese conto che “el Dia del terratremoli l’alcalde …” non era granché comprensibile al lombardofono medio ci fu un tentativo di chiusura dell’enciclopedia, un colpo di mano che funzionò e portò alle dimissioni dell’amministrazione catalanista.

La nuova amministrazione era decisamente meglio, ma non ancora perfetta: aveva una visione, come dire… Iperdialettista, per cui l’Adda era un confine invalicabile, la Wikipedia in lombardo un sacrificio da fare per avere uno spazio, fosse necessario marcare ogni singola differenza e così via.

Tant’è che, se la perniciosa Koiné venne quasi del tutto eliminata, dico quasi perché sono resistiti ad oggi circa 300 articoli più o meno nascosti, e vennero eliminati vari articoli creati coi bot di poche righe, decine di migliaia di articoli tipo aeroporti del Vietnam, si mantennero comunque varie idee di quella amministrazione, tra cui alcuni template per la definizione dei dialetti: i principali erano dialuurt per il lombardo occidentale e dialort per quello orientale, lì si specificava grafia e dialetto usato, poi esistevano dei template specifici, ognuno con un sistema di categorizzazione propria.

Per quanto teoricamente esistessero delle regole e la gran parte della comunità le rispettasse, sono usciti alcuni articoli con classificazioni un po’ a caso, grazie anche ad un uso confusionario dei template, quindi alcuni dialetti avevano tre categorie: una creata da un template, una da dialort e l’altra da dialuurt, alle volte persino quattro, se ci si metteva qualche categoria manuale.

Da qualche tempo, con una base d’utenza ormai radicalmente cambiata, questo “modello 2010” ha perso sempre più di utilità, con le sue mille eccezioni, e si è deciso di cambiarlo.

Così, novembre 2021 è stato dedicato a questo cambiamento, basato su due principi semplici:

  1. Una classificazione obbligatoria su base grafica, con una categoria unica per grafia, che si fa tramite un template che va messo in ogni pagina, in base alla grafia che si usa
  2. Una classificazione dialettale semi-obbligatoria, che si inserisce come parametro del template.

Ciò risolve vari problemi:

  1. Non si possono creare combinazioni impossibili (il template del lombardo orientale non riconosce come valida l’opzione lodigiano, ad esempio, mentre prima si poteva avere una voce in bergamasco, ma scritta in bresciano)
  2. Un dialetto = una categoria, non c’è più il problema di varie categorie
  3. Permette alla comunità di controllare meglio le cose

Questo lavoro, con l’adattamento dei template che abbiamo dovuto in parte ricostruire, è terminato a metà mese. Ma c’era ancora molto lavoro da fare: abbiamo dovuto sistemare varie categorie che avevano dentro articoli messi male, o doppiamente categorizzati, abbiamo dovuto fare altre sistemazioni.

Oggi, però, è un giorno simbolo: l’ultima categoria di quelle vecchie, ossia “Lombard Occidental”, è stata svuotata. La considero, simbolicamente, la fine di una grande era in un’enciclopedia a cui collaboro dall’ormai lontano 2015. Vergant è stata l’ultima pagina di questa era.

E ora è finita? Beh, no. Ci sono varie categorie con pagine senza template, che dovranno essere categorizzate a mano o con un bot. Bisognerà inoltre rinominare le categorie in una grafia panlombarda, ci sono poi un’ottantina di pagine che dovranno essere sistemate perché usano più varietà, ci sono ancora alcune pagine di servizio scritte con i “cassetti” in più dialetti, circa 200 articoli nella koiné e 200 altri in grafie non più ammesse.

In sostanza, bisogna fare ancora molto per nettare l’enciclopedia, ma si potrà fare con relativa calma. E, soprattutto, ora, non rischiamo più casini come quelli dell’epoca…

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *