Il volume offre un’introduzione alla linguistica computazionale e contiene otto capitoli così strutturati. Dopo un’introduzione alla disciplina (capitolo I) e due capitoli che espongono in forma sintetica le nozioni di base di linguistica (capitolo II) e di statistica (capitolo III) necessarie per affrontare il tema del trattamento automatico del linguaggio, segue un capitolo che introduce l’apprendimento automatico (machine learning) applicato all’analisi automatica delle lingue, i metodi e le tecniche per realizzarlo e i principali algoritmi utilizzati, incluse le principali tipologie di reti neurali (capitolo IV). Segue un ulteriore capitolo di taglio computazionale (capitolo V): per eseguire compiti linguistici, i modelli computazionali utilizzano oggi come dati di input le rappresentazioni vettoriali del significato delle parole, delle frasi e dei testi, e cerchiamo qui di chiarire non solo cosa siano ma anche come sono ottenute. Costruire un modello computazionale che esegua uno o più compiti linguistici richiede nella maggior parte dei casi dei dati di addestramento, che forniscono al modello le informazioni su ciò che deve apprendere (ad esempio le classificazioni attese). Sono i dati annotati, di cui si parla nel dettaglio nel cap. VI. L’annotazione linguistica può essere considerata una vera e propria scienza, indispensabile anche per valutare le prestazioni dei modelli, e ne descriviamo metodi e obiettivi. Nel capitolo VII, sono invece descritti i principali task di linguistica computazionale. Per ragioni di spazio, abbiamo operato una selezione, ma ciascuna area (task di pre-processing, di classificazione e di generazione di testi) è ampiamente coperta, dai task storici (traduzione automatica, parsing, disambiguazione del senso delle parole) a quelli più recenti (identificazione delle opinioni, di linguaggio offensivo, del sentiment e dell’ironia, oltreché di notizie false). Infine il capitolo VIII è un capitolo operativo: fornisce informazioni sugli strumenti essenziali per imparare a «fare» linguistica computazionale e sulla loro reperibilità.
Linguistica Computazionale. Introduzione all'analisi automatica dei testi
Jezek E.
;Sprugnoli R.
2023-01-01
Abstract
Il volume offre un’introduzione alla linguistica computazionale e contiene otto capitoli così strutturati. Dopo un’introduzione alla disciplina (capitolo I) e due capitoli che espongono in forma sintetica le nozioni di base di linguistica (capitolo II) e di statistica (capitolo III) necessarie per affrontare il tema del trattamento automatico del linguaggio, segue un capitolo che introduce l’apprendimento automatico (machine learning) applicato all’analisi automatica delle lingue, i metodi e le tecniche per realizzarlo e i principali algoritmi utilizzati, incluse le principali tipologie di reti neurali (capitolo IV). Segue un ulteriore capitolo di taglio computazionale (capitolo V): per eseguire compiti linguistici, i modelli computazionali utilizzano oggi come dati di input le rappresentazioni vettoriali del significato delle parole, delle frasi e dei testi, e cerchiamo qui di chiarire non solo cosa siano ma anche come sono ottenute. Costruire un modello computazionale che esegua uno o più compiti linguistici richiede nella maggior parte dei casi dei dati di addestramento, che forniscono al modello le informazioni su ciò che deve apprendere (ad esempio le classificazioni attese). Sono i dati annotati, di cui si parla nel dettaglio nel cap. VI. L’annotazione linguistica può essere considerata una vera e propria scienza, indispensabile anche per valutare le prestazioni dei modelli, e ne descriviamo metodi e obiettivi. Nel capitolo VII, sono invece descritti i principali task di linguistica computazionale. Per ragioni di spazio, abbiamo operato una selezione, ma ciascuna area (task di pre-processing, di classificazione e di generazione di testi) è ampiamente coperta, dai task storici (traduzione automatica, parsing, disambiguazione del senso delle parole) a quelli più recenti (identificazione delle opinioni, di linguaggio offensivo, del sentiment e dell’ironia, oltreché di notizie false). Infine il capitolo VIII è un capitolo operativo: fornisce informazioni sugli strumenti essenziali per imparare a «fare» linguistica computazionale e sulla loro reperibilità.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.