Il volume offre un’introduzione alla linguistica computazionale e contiene otto capitoli così strutturati. Dopo un’introduzione alla disciplina (capitolo I) e due capitoli che espongono in forma sintetica le nozioni di base di linguistica (capitolo II) e di statistica (capitolo III) necessarie per affrontare il tema del trattamento automatico del linguaggio, segue un capitolo che introduce l’apprendimento automatico (machine learning) applicato all’analisi automatica delle lingue, i metodi e le tecniche per realizzarlo e i principali algoritmi utilizzati, incluse le principali tipologie di reti neurali (capitolo IV). Segue un ulteriore capitolo di taglio computazionale (capitolo V): per eseguire compiti linguistici, i modelli computazionali utilizzano oggi come dati di input le rappresentazioni vettoriali del significato delle parole, delle frasi e dei testi, e cerchiamo qui di chiarire non solo cosa siano ma anche come sono ottenute. Costruire un modello computazionale che esegua uno o più compiti linguistici richiede nella maggior parte dei casi dei dati di addestramento, che forniscono al modello le informazioni su ciò che deve apprendere (ad esempio le classificazioni attese). Sono i dati annotati, di cui si parla nel dettaglio nel cap. VI. L’annotazione linguistica può essere considerata una vera e propria scienza, indispensabile anche per valutare le prestazioni dei modelli, e ne descriviamo metodi e obiettivi. Nel capitolo VII, sono invece descritti i principali task di linguistica computazionale. Per ragioni di spazio, abbiamo operato una selezione, ma ciascuna area (task di pre-processing, di classificazione e di generazione di testi) è ampiamente coperta, dai task storici (traduzione automatica, parsing, disambiguazione del senso delle parole) a quelli più recenti (identificazione delle opinioni, di linguaggio offensivo, del sentiment e dell’ironia, oltreché di notizie false). Infine il capitolo VIII è un capitolo operativo: fornisce informazioni sugli strumenti essenziali per imparare a «fare» linguistica computazionale e sulla loro reperibilità.

Linguistica Computazionale. Introduzione all'analisi automatica dei testi

Jezek E.
;
Sprugnoli R.
2023-01-01

Abstract

Il volume offre un’introduzione alla linguistica computazionale e contiene otto capitoli così strutturati. Dopo un’introduzione alla disciplina (capitolo I) e due capitoli che espongono in forma sintetica le nozioni di base di linguistica (capitolo II) e di statistica (capitolo III) necessarie per affrontare il tema del trattamento automatico del linguaggio, segue un capitolo che introduce l’apprendimento automatico (machine learning) applicato all’analisi automatica delle lingue, i metodi e le tecniche per realizzarlo e i principali algoritmi utilizzati, incluse le principali tipologie di reti neurali (capitolo IV). Segue un ulteriore capitolo di taglio computazionale (capitolo V): per eseguire compiti linguistici, i modelli computazionali utilizzano oggi come dati di input le rappresentazioni vettoriali del significato delle parole, delle frasi e dei testi, e cerchiamo qui di chiarire non solo cosa siano ma anche come sono ottenute. Costruire un modello computazionale che esegua uno o più compiti linguistici richiede nella maggior parte dei casi dei dati di addestramento, che forniscono al modello le informazioni su ciò che deve apprendere (ad esempio le classificazioni attese). Sono i dati annotati, di cui si parla nel dettaglio nel cap. VI. L’annotazione linguistica può essere considerata una vera e propria scienza, indispensabile anche per valutare le prestazioni dei modelli, e ne descriviamo metodi e obiettivi. Nel capitolo VII, sono invece descritti i principali task di linguistica computazionale. Per ragioni di spazio, abbiamo operato una selezione, ma ciascuna area (task di pre-processing, di classificazione e di generazione di testi) è ampiamente coperta, dai task storici (traduzione automatica, parsing, disambiguazione del senso delle parole) a quelli più recenti (identificazione delle opinioni, di linguaggio offensivo, del sentiment e dell’ironia, oltreché di notizie false). Infine il capitolo VIII è un capitolo operativo: fornisce informazioni sugli strumenti essenziali per imparare a «fare» linguistica computazionale e sulla loro reperibilità.
2023
Itinerari
9788815290359
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11571/1471424
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact