Modellazione Definizionale Multilingue per Sensi di Parola Non Discreti.
| Componente | Categoria |
|---|---|
| Roberto Navigli | Tutor di riferimento |
L'elaborazione del linguaggio naturale è quella branca dell'intelligenza artificiale che si occupa di trasferire le competenze linguistiche umane ad un agente non senziente, come un computer.
In quest'ottica, la semantica riveste un ruolo centrale nell'abilitare un elaboratore automatico all'esecuzione di compiti richiesti dall'operatore umano. Un esempio dell'applicazione della "semantica computazionale" è la disambiguazione automatica, ovvero l'abilità di un sistema di risolvere la polisemia di una parola in contesto mediante la selezione di un'accezione di senso da un inventario predeterminato. Sebbene determinare il più appropriato tra un insieme finito di sensi sia un'operazione potenzialmente triviale per la macchina, nondimeno, il concetto di discretezza nella rappresentazione delle sfumature di significato è stato criticato nella recente storia della psicolinguistica.
Per quanto detto, il progetto qui presentato si colloca in questo quadro di ricerca, e si pone come veicolo per il raggiungimento di una semantica computazionale che simuli in modo più accurato la rappresentazione semantica usata a livello umano.
Nello specifico, partendo dal paradigma della modellazione definizionale, ci svincoliamo dai limiti imposti da inventari predefiniti di senso mediante la generazione automatica di definizioni in grado di descrivere la semantica di una parola o di un'espressione all'interno di uno specifico contesto. A tal fine, e mediante l'uso di vettori contestuali di senso e di uno spazio vettoriale multilingua, siamo in grado, per la prima volta, di generare definizioni in lingue diverse, applicabili anche a concetti non presenti negli inventari di senso tradizionali.
Per valutare la bontà del nostro approccio e la qualità dell'informazione semantica in esso codificata, facciamo ricorso ai dataset standard per la valutazione qualitativa di definizioni generate automaticamente e a dataset legati a compiti apparentemente scorrelati, come il question-answering.