Il volume offre un’introduzione alla linguistica computazionale e contiene otto capitoli così strutturati. Dopo un’introduzione alla disciplina (capitolo I) e due capitoli che espongono in forma sintetica le nozioni di base di linguistica (capitolo II) e di statistica (capitolo III) necessarie per affrontare il tema del trattamento automatico del linguaggio, segue un capitolo che introduce l’apprendimento automatico (machine learning) applicato all’analisi automatica delle lingue, i metodi e le tecniche per realizzarlo e i principali algoritmi utilizzati, incluse le principali tipologie di reti neurali (capitolo IV). Segue un ulteriore capitolo di taglio computazionale (capitolo V): per eseguire compiti linguistici, i modelli computazionali utilizzano oggi come dati di input le rappresentazioni vettoriali del significato delle parole, delle frasi e dei testi, e cerchiamo qui di chiarire non solo cosa siano ma anche come sono ottenute. Costruire un modello computazionale che esegua uno o più compiti linguistici richiede nella maggior parte dei casi dei dati di addestramento, che forniscono al modello le informazioni su ciò che deve apprendere (ad esempio le classificazioni attese). Sono i dati annotati, di cui si parla nel dettaglio nel cap. VI. L’annotazione linguistica può essere considerata una vera e propria scienza, indispensabile anche per valutare le prestazioni dei modelli, e ne descriviamo metodi e obiettivi. Nel capitolo VII, sono invece descritti i principali task di linguistica computazionale. Per ragioni di spazio, abbiamo operato una selezione, ma ciascuna area (task di pre-processing, di classificazione e di generazione di testi) è ampiamente coperta, dai task storici (traduzione automatica, parsing, disambiguazione del senso delle parole) a quelli più recenti (identificazione delle opinioni, di linguaggio offensivo, del sentiment e dell’ironia, oltreché di notizie false). Infine il capitolo VIII è un capitolo operativo: fornisce informazioni sugli strumenti essenziali per imparare a «fare» linguistica computazionale e sulla loro reperibilità.

Linguistica Computazionale. Introduzione all'analisi automatica dei testi

Jezek E.
;
Sprugnoli R.
2023-01-01

Abstract

Il volume offre un’introduzione alla linguistica computazionale e contiene otto capitoli così strutturati. Dopo un’introduzione alla disciplina (capitolo I) e due capitoli che espongono in forma sintetica le nozioni di base di linguistica (capitolo II) e di statistica (capitolo III) necessarie per affrontare il tema del trattamento automatico del linguaggio, segue un capitolo che introduce l’apprendimento automatico (machine learning) applicato all’analisi automatica delle lingue, i metodi e le tecniche per realizzarlo e i principali algoritmi utilizzati, incluse le principali tipologie di reti neurali (capitolo IV). Segue un ulteriore capitolo di taglio computazionale (capitolo V): per eseguire compiti linguistici, i modelli computazionali utilizzano oggi come dati di input le rappresentazioni vettoriali del significato delle parole, delle frasi e dei testi, e cerchiamo qui di chiarire non solo cosa siano ma anche come sono ottenute. Costruire un modello computazionale che esegua uno o più compiti linguistici richiede nella maggior parte dei casi dei dati di addestramento, che forniscono al modello le informazioni su ciò che deve apprendere (ad esempio le classificazioni attese). Sono i dati annotati, di cui si parla nel dettaglio nel cap. VI. L’annotazione linguistica può essere considerata una vera e propria scienza, indispensabile anche per valutare le prestazioni dei modelli, e ne descriviamo metodi e obiettivi. Nel capitolo VII, sono invece descritti i principali task di linguistica computazionale. Per ragioni di spazio, abbiamo operato una selezione, ma ciascuna area (task di pre-processing, di classificazione e di generazione di testi) è ampiamente coperta, dai task storici (traduzione automatica, parsing, disambiguazione del senso delle parole) a quelli più recenti (identificazione delle opinioni, di linguaggio offensivo, del sentiment e dell’ironia, oltreché di notizie false). Infine il capitolo VIII è un capitolo operativo: fornisce informazioni sugli strumenti essenziali per imparare a «fare» linguistica computazionale e sulla loro reperibilità.
2023
Italiano
Internazionale
STAMPA
Itinerari
1
240
240
9788815290359
Il Mulino
Bologna
ITALIA
carattere interdisciplinare tra s.s.d. L-LIN/01-Glottologia e Linguistica, s.s.d. ING-INF/05 Sistemi di Elaborazione delle Informazioni, s.s.d. INF/01 Informatica
linguistica computazionale, natural language processing, machine learning, annotazione linguistica, task linguistico, analisi automatica dei testi, intelligenza artificiale, modello computazionale
276
2
Jezek, E.; Sprugnoli, R.
none
info:eu-repo/semantics/book
3 Libro::3.1 Monografia o trattato scientifico
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11571/1471424
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact