La ricerca qui proposta si colloca all'interno della fraseologia contrastiva proseguendo e sviluppando ulteriormente una ricerca precedente, diretta dalla stessa proponente, in cui si è esaminata la fraseologia di un'ampia parte dell'opera in prosa di Italo Calvino e delle sue traduzioni in 16 lingue diverse (5 romanze, 6 germaniche e 5 slave) elaborando anche un'applicazione web (detta CREAMY, Calvino REpertoire for Analysis of Multilingual PhraseologY) che consente una sua dettagliata registrazione e analisi di primo livello. Il progetto proposto intende estendere i risultati fin qui conseguiti sia in termini linguistico-traduttologici, sia in termini informatici, arricchendo lo strumento con funzionalità che permettano ai linguisti analisi sofisticate dei fraseologismi.
Concretamente, per quanto riguarda il primo aspetto, si intende arricchire il quadro metodologico utilizzato fino ad adesso introducendo nell'analisi una procedura bi-direzionale, vale a dire indagando non più solo la maniera in cui la fraseologia calviniana è stata tradotta nelle diverse lingue straniere, ma anche a quali lessemi o combinazioni di lessemi italiani risale la fraseologia presente nei testi tradotti. Questo punto di vista permetterà di gettare le basi per lo sviluppo di uno strumento informatico che supporti un'analisi multidirezionale, in cui tutti i fraseologismi registrati in tutte le lingue indagate potranno essere messi in relazione tra di loro. Per quanto riguarda invece l'aspetto informatico, si intende raffinare l'applicazione CREAMY in modo tale da permettere, a partire dal repertorio già immagazzinato nella base di dati sviluppata e popolata nel progetto precedente, di realizzare analisi statistiche sia frequenziali, sia distribuzionali, sia diacroniche delle più di 100.000 espressioni polirematiche da registrare entro la conclusione del progetto
Il progetto qui delineato presenta un grado di notevole innovatività sia sul piano linguistico-traduttivo, sia sul piano informatico. Per quanto riguarda il primo aspetto, la novità principale consiste nell'introduzione del carattere bi-direzionale della ricerca descritto nel paragrafo precedente. In questo senso si nota come proprio a causa del carattere "semanticamente indeterminato" delle espressioni fraseologiche (cfr. De Mauro 1982, 2008) nella lessicografia internazionale prevalgano per ora le descrizioni monolingui, mentre nei maggiori dizionari bilingui le descrizioni fraseologiche sono in gran parte limitate alle voci di altissima frequenza. In questo quadro una parziale eccezione è rappresentata dalla serie di dizionari basati sull'edizione tedesca di "Deutsche Idiomatica. Wörterbuch der deutschen Redewendungen im Kontext" a cura di Hans Schemann (1993). In questa serie di dizionari si sono raccolti i traducenti di circa 35.000 espressioni idiomatiche in alcune lingue romanze, tra cui, oltre al francese e il portoghese, c'è anche l'italiano (cfr. "Dizionario idiomatico tedesco-italiano" a cura di Beatrice Fenati e Giovanni Rovere, Zanichelli, 2009). Tuttavia, non si dispone ancora, neanche per le opere citate, di edizioni complementari, vale a dire di opere che dal francese, portoghese o italiano traducano in tedesco. Se dunque, la lessicografia bi- o plurilingue in ambito fraseologico si trova ancora agli inizi, non c'è alcun dubbio che opere lessicografiche del genere sarebbero di estrema utilità non solo nell'ambito della ricerca linguistica contrastiva, ma anche a fini applicativi, come nel mondo della traduzione o della glottodidattica.
L'applicazione Web qui progettata riduce questo vuoto lessicografico, presentandosi come la (per ora) più estesa banca dati sulla fraseologia multilingue interattiva pubblicamente accessibile. Allo stesso tempo essa si prospetta anche come uno strumento promettente sul piano lessicologico, dato che permetterà, per la prima volta, di svolgere delle analisi contrastive in ambito fraseologico a partire dallo stesso cotesto linguistico. Sembra pertanto opportuno ampliare anche le potenzialità della funzione di analisi e estrazione dei dati fraseologici. Allo stato attuale di sviluppo del sistema, è possibile individuare le espressioni polirematiche italiane in base alle proprietà attribuite nella fase descrittiva e quindi in base alla loro appartenenza a:
- i testi calviniani [Il sentiero dei nidi di ragno (1947), Il barone rampante (1957), Il visconte dimezzato (1952), Il cavaliere inesistente (1959), Palomar (1983), Se una notte d¿inverno un viaggiatore (1979) e il testo critico Lezioni americane (1988)]
- i tipi di polirematica (espressione idiomatica, collocazione, costruzione verbo a supporto etc.)
- i campi semantici (movimento del corpo, relazioni temporali, relazioni spaziali, nutrizione, per fare solo qualche esempio)
- le marche variazionali ([neo]standard, italiano parlato, italiano popolare, italiano regionale etc.)
- le marche d'uso (alta frequenza, alto uso, alta disponibilità, comune, tecnico-specialistico etc.)
- le categorie lessicali (locuzione nominale, verbale, aggettivale etc.)
- gli eventuali caratteri polisemici,
In considerazione dell'ampio numero di polirematiche raccolte (alla conclusione della prima fase del progetto ci si aspetta la registrazione di più di 100.000 occorrenze), è a questo punto opportuno arricchire anche le potenzialità del sistema di analisi abilitando innanzitutto la stessa funzione di individuazione delle costruzioni lessicali (che, come accennato, per ora sono limitate alla sola lingua italiana) anche a tutte le lingue straniere coinvolte (v. § precedente). Oltre a ciò sarà abilitata anche un tipo di analisi statistico-frequenziale.
Concretamente per la prima volta sarà possibile (oltre all'estrazione dei fraseologismi italiani e dei loro traducenti secondo le modalità descritte nel paragrafo precedente) calcolare nei testi originali e nelle loro traduzioni anche:
- la frequenza di tutte le espressioni polirematiche, sia nell'opera complessiva, sia nei singoli testi;
- la frequenza delle espressioni polirematiche in base a tutte le categorie descrittive utilizzate nella banca dati, ossia "lemma, testo o testi e pagine di testo, tipi di polirematiche, campo semantico, marca variazionale, marca d'uso, categoria lessicale, carattere polisemico, categoria lessicali";
- la frequenza dei singoli tipi di equivalenza (totale, parziale, nullo), sia nelle singole lingue, sia nelle famiglie linguistiche, sia complessivamente in tutte le lingue indagate;
- la datazione dei testi e della distanza temporale tra la pubblicazione del testo originale e le singole traduzioni;
- le diverse rese traduttologiche nelle varie traduzioni dello stesso testo;
- la densità d'uso fraseologico, anche a partire dai singoli capitoli.