
In un clima di generale avanzata del multilinguismo -sul fronte sociale, geopolitico ed educativo, ma anche e soprattutto online- emerge un'esigenza forte di strumenti in grado di favorire il superamento delle barriere interlinguistiche e rendere possibile la comunicazione interculturale. In ambito lessicografico, ciò si traduce nella richiesta crescente di risorse lessicali elettroniche multilingui, rivolte tanto ad utenti umani -apprendenti di lingue straniere e traduttori- quanto ad applicazioni informatiche -traduzione automatica in primis. Sempre più diffusa, in particolare, è la domanda di informazione esplicita relativa al patrimonio culturale nelle diverse lingue, che ha alimentato negli ultimi anni, in Italia e all'estero, la pubblicazione di testi dedicati ai beni culturali, dai siti web dei musei alle guide turistiche, passando per i cataloghi d'arte fino a opere di saggistica. Nonostante ciò, allo stato attuale, non esistono in Europa né strumenti dedicati né centri di formazione che consentano di preparare o sostenere adeguatamente i traduttori o le altre figure del campo del turismo culturale. Le poche risorse disponibili, sviluppate generalmente in ambito terminologico o informatico, tendono inoltre a non tenere adeguatamente conto di quelle problematiche di ordine teorico-filosofico che necessariamente si presentano di fronte alla necessità, per quanto applicativa, di allineare sistemi linguistici diversi. Obiettivo concreto del progetto è quello di sviluppare un database lessicale trilingue dedicato a un dominio circoscritto ad alto carico culturale -quello del lessico della pittura- che possa risultare innovativo, tanto a livello metodologico quanto strutturale, rispetto alle risorse esistenti. Un oggetto attento alle problematiche teoriche e utile per lo sviluppo di dizionari-macchina o risorse per traduttori, rivolto a uno dei settori lessicali di più difficile trattamento, nonché a lungo trascurato dalla tradizione lessicografica italiana.
Fine ultimo del progetto è quello di realizzare una risorsa utile, nonché radicalmente innovativa: se la maggior parte delle risorse multilingui esistenti tendono a restituire un'immagine monodimensionale del fenomeno dell¿equivalenza, in netto disaccordo con i risultati della ricerca teorica, l'intento è qui quello di rappresentarla in tutta la sua complessità, indicandone il livello e rendendo conto delle manifestazioni di ambiguità lessicale; se buona parte delle risorse favoriscono l'informazione paradigmatica per trascurare quello sintagmatica, quest¿ultima verrà collocata al centro dell'attenzione, nella convinzione che il comportamento distribuzionale delle parole possa in qualche modo gettare luce su quelle problematiche di distanza culturale che innervano il fenomeno della traduzione. Nella maggior parte dei casi, inoltre, la principale fonte dei dati è rappresentata da risorse lessicografiche preesistenti: solo in pochi casi vengono utilizzati corpora monolingui -così in EuroWordNet (Vossen1998)- o paralleli -Babelnet (Navigli, Ponzetto 2010)- e sempre in sinergia con il dato lessicografico. L'idea è qui quella di adottare un approccio integralmente bottom-up, a base testuale, fondato sulla costruzione e interrogazione di un corpus parallelo multilingue, che sia campo di esplorazione concreta dei fenomeni complessi dell'equivalenza. Nel rivolgersi a un campo applicativo limitato -un sotto-dominio del lessico dell'arte- l'intento è in buona parte anche quello di individuare un metodo di lavoro efficace e funzionale, potenzialmente ripetibile. Non solo, ma l'adozione della struttura del database tenta di dare finalmente attuazione all'indicazione avveniristica di Nencioni, che già nel 1981 riconosceva nella banca dati la forma del dizionario del futuro. La lessicografia italiana vanta oggi alcuni importanti dizionari informatizzati di impianto distribuzionale, ma si tratta di risorse monolingui (Dizionario Analogico della Lingua Italiana, Feroldi e Dal Pra 2011; Grande Dizionario Analogico, Simone 2011) o soltanto bilingui (Grande Dizionario Elettronico Italiano-Neerlandese/Neerlandese-Italiano, Lo Cascio 2005), e in ogni caso generali, non rivolti a un particolare dominio lessicale. Riguardo al dominio di interesse, una risorsa importante è il Multilingual Conservation Dictionary (Bogdanowska 2011), dedicato al lessico della conservazione dei beni culturali e caratterizzato da un approccio metodologico affine: si tratta in effetti di un database costruito a partire dalla ricerca su corpora paralleli; tuttavia, l¿impianto del dizionario non è distribuzionale e inoltre l¿italiano risulta poco rappresentato. Maggiore spazio viene attribuito alla lingua italiana nel Glossary of Art Conservation (Xarrié 2006), comprendente anche inglese, francese, tedesco e castigliano e basato su un corpus testuale; ma ancora una volta, non si tratta di una risorsa distribuzionale. Eppure, proprio il comportamento distribuzionale delle parole, il loro combinarsi in schemi sintattici, collocazioni ed espressioni idiomatiche, viene riconosciuto da più parti, in ambito teorico, come centrale ed anzi fondante nel processo di costruzione dei significati. Non solo, ma si ritiene che una descrizione dettagliata del profilo distribuzionale -language-specific- di equivalenti interlinguistici possa risultare potenzialmente illuminante nei confronti del problema chiave della distanza culturale; un problema, quello della lingua-cultura, particolarmente rilevante entro un dominio lessicale così intriso di storia e tradizione come quello dell¿arte. La risorsa, che comprenderà circa 600 lemmi nominali e verbali (ipoteticamente, 200 per ciascuna delle tre lingue sorgenti), riporterà dunque per ogni entrata le seguenti informazioni:
- categoria grammaticale;
- categoria semantica (del tipo [Artefatto], [Persona], etc);
- equivalente;
- tipo di equivalenza;
- strategia traduttiva;
- lemmi con cui l'equivalente co-occorre, suddivisi in `attributi', `operazioni' ed `estensioni idiomatiche' per i nomi, `oggetti' ed `estensioni idiomatiche' per i verbi.
Naturalmente, per ogni lemma della lingua sorgente saranno riportati uno o più equivalenti per ciascuna delle altre due lingue di arrivo.
Nel tentativo di recuperare e combinare in sinergia, entro il processo di sviluppo di un oggetto concreto, idee e risultati provenienti da diversi settori disciplinari di riflessione teorica, ci si propone di applicare anche alla lessicografia multilingue -a lungo trascurata- quella necessità di convergenza tra pratica lessicografia e teoria linguistica più volte ribadita da De Mauro in ambito monolingue.