mercoledì 25 giugno 2008

CORPUS e NUVOLE, 2

Seconda puntata di questa esplorazione tra corpora e didattica, in cui come promesso nel post precedente, indicherò le risorse che ho trovato per il corpus based approach.










Già, si chiama proprio così questo approccio che ha coinvolto particolarmente gli studi di traduzione, ma che sta diventando rilevante anche per la glottodidattica, grazie alla possibilità di consultazione delle variazioni "aggiornate" della lingua, in quest'epoca multimediale in cui le distanze tra scritto e parlato si accorciano.

Prima di proseguire, però, apro una breve parentesi. Nel frattempo, un insegnante spagnolo mi ha detto che durante le ultime elezioni di marzo, anche in terra iberica era in progetto un'indagine sul corpus delle parole della politica e che poi, non so per quale ragione, non è stata portata a termine. Potrebbero ripensarci e, malgrado il mio scetticismo iniziale, penso che se per il futuro appuntamento elettorale un linguista spagnolo dovesse presentare un corpus, correlato dalle opportune nuvolette, sarebbe interessante una ricerchina in chiave contrastiva (chi spara più promesse? E con quali munizioni?). Non è altro che una piccola idea per una migliore intercomprensione. Inoltre, i colleghi che insegnano Spagnolo per stranieri e i loro alunni avrebbero a disposizione uno strumento semplice ma potente, per confrontare le variazioni lessicali o grammaticali, nonché, - e scusate se è poco - sdrammatizzare un po' le parole dei politici.
Idee e attività
La verifica e il compito a casa per il livello superiore che ho indicato nel post precedente, me l'aveva suggerito The Use of Corpora in the Vocabulary Classroom (2004), di Yu Hua Chen dell'Università di Melbourne e l'ho adattato dall'inglese.
Tre docenti dell'Università autonoma di Madrid suggeriscono alcune applicazioni all'insegnamento dello spagnolo come lingua straniera in El corpus C-ORAL-ROM en la enseñanza de ELE (2006).
Si occupa di corpora e didattica anche per l'Italiano L2 il volume curato da M. Barni, D.Troncarelli, C. Bagna (2008):
Lessico e apprendimenti. Il ruolo del lessico nella linguistica educativa, segnalato dalla GISCEL.
Dopo aver cercato molto, tuttavia, non sono riuscita a trovare delle proposte di attività in italiano che fossero semplici da usare con gli alunni stranieri, considerando che lo scopo ultimo della nostra attività didattica è comunque l'apprendimento dello studente. Se qualcuno conosce esercizi e quant'altro, per favore sparga la voce!
Per i prefissi e suffissi i corpora potrebbero essere di aiuto. L'attività che segue non è pensata per usare un corpus, ma si potrebbe provare:
William Pittman (2003), Building Vocabulary through Prefixes, Roots and Suffixes


Da non perdere i suggerimenti di Jamie Keddie del sito Onestopenglish in Grammar and Vocabulary: corpora che purtroppo non è gratuito. Accesso gratis invece per
Methodology challenge: Google fighting in the classroom dello stesso autore.


Altre idee che mi vengono in mente per lo sviluppo della competenza lessicale interrogando i corpora:
- la fraseologia (le collocazioni di coppie di parole che formano una unità: per esempio "avanti e indietro", non si può dire "indietro e avanti")
- l'italiano per fini specifici, attraverso un corpus di articoli del Sole 24 Ore che tenga presente anche sigle e acronimi, tipo TFR, CCNL..., i prestiti dall'inglese, i residui dal latino. In questi giorni sto lavorando con gli alunni dell'Esade su alcuni documenti giuridici del diritto del lavoro, principalmente sulle modalità di assunzione e di licenziamento in Italia e in Spagna e mi imbatto spesso in termini latini: ex lege, pro soluto...



Corpora per l'italiano

CIT corpus italiano televisivo, di Stefania Spina, o meglio la pagina di ricerca. Molto utile, perchè si possono interrogare i forestierismi negli slogan pubblicitari e nei talk-show, nonché altri aspetti non soltanto lessicali (le forme di "stare + gerundio", tra l'altro). Come interrogarlo? Se si vuole cercare la distribuzione di un forestierismo, che so, "the" per esempio, digitarlo nel campo in alto a sinistra in questo modo: "the"; (cioè la parola tra due virgolette seguita da un punto e virgola).

BADIP, sito gratuito per la pubblicazione di corpora dell'italiano parlato. Da qui si accede al noto LIP (Lessico dell'italiano parlato).

COLFIS, corpus e lessico di frequenza dell'italiano scritto contemporaneo. Istituto di linguistica computazionale dell'Università di Genova. L'ho provato e funziona bene. Per le lezioni cliccate su "Corpus non lemmatizzato".

Dopodiché, per non perdere tempo consiglio di entrare nella Biblioteca dell'Università Normale Superiore di Pisa che offre un elenco completo di risorse. Oppure in
Alphabit, la webpage di Isabella Chiari, docente di linguistica computazionale all'Università la Sapienza di Roma.
È da tener presente, comunque, che i corpora del CORIS/ CORDIS per l'italiano scritto contemporaneo (Università di Bologna) non sono di accesso libero.


Multilingui

SKETCH ENGINE, (SKE). Non è gratis, ma la versione beta è consultabile per 30 giorni di prova. Semplicemente eccezionale, come mi aveva assicurato Michela, una mia collega che sta terminando il Master in Lèxic i Comunicació Lingüística all'Università di Barcellona. Ed hai ragione, Michela! Infatti Sketch Engine fornisce anche la rete semantica o le relazioni grammaticali delle parole...per ben nove lingue, tra cui l'italiano e lo spagnolo. L'account dà diritto ad accedere anche a WebBootCat, software per un corpus fai da te, di cui parlerò più avanti. Per chi è curioso di sapere come funziona Sketch Engine, può leggere qui.

Un corpus on line semplice da usare è il
LEEDS COLLECTION OF INTERNET CORPORA, del Centro Studi di Traduzione dell'Università di Leeds.

I Nunc, progetto multilingue dell' Università di Torino.


Strumenti per un corpus fai da te

Isabella Chiari si chiede:
esistono strumenti che aiutano chi fa ricerca linguistica a costruire corpora per la pubblicazione?
Ne elenca alcuni, tra cui WebBootCat, di Marco Baroni e Silvia Bernardini dell'Università di Bologna, affiancati dagli stessi autori di Sketch Engine. Diretto ai traduttori di aree specialistiche è un software che si appoggia a Google in quanto fonte inesauribile di dati, adattandolo però ai bisogni dei linguisti. Per leggere la spiegazione degli autori sulle sue potenzialità, cliccare qui.

Nuvolette fai da te
Perfino un intervento di Luca Cordero di Montezemolo alla Confindustria è finito in nuvola, guardare per credere nel laboratorio open source della IBM Many Eyes, in cui è possibile organizzare automaticamente le label clouds di un corpus. La nuvola si trova anche sul blog Tecnoetica di Davide Bennato, docente di Sociologia alla Sapienza. In quanto alla piattaforma Many Eyes, il Visual Communication Lab dell'IBM spiega come organizzare, trasferire e condividere l'informazione di un database in soluzioni grafiche di impatto visivo immediato.

TEORIA

Di studi teorici ce n'è una marea, ma a noi umili insegnanti mancano proprio le soluzioni applicate alla glottodidattica. In ogni caso, la prima cosa che ho fatto è cercare nella European Association for Computer-Assisted Language Learning (ReCALL) per sbirciare tra le sue pubblicazioni, curate dall'Università di Cambridge
(
ReCALL Journal).
Cliccate sulla copia online del maggio 1997. Presenta un articolo interessante di
T. McEnery e A.Wilson,
Teaching and Language Corpora (TALC)
In PORTAL si trovano le citazioni delle migliori pubblicazioni sul tema, come per esempio:Computer corpora and the language classroom: on the potential and limitations of computer corpora in language teaching di Gunther Kaltenböck, Barbara Mehlmauer-Larcher (Università di Vienna).From pedagogically relevant corpora to authentic language learning contents,
di Sabine Braun (Università di Tubinga).


Per orientarsi giunge a proposito il compendio di Roberta Facchinetti, docente all'Università di Verona:Corpus Linguistics, 25 years on, (2007).
Il capitolo 3 tratta dell'uso del corpus nell'acquisizione di una lingua straniera.

Altre pubblicazioni d'interesse:
Elena Tognini Bonelli (2001), Corpus Linguistics at Work, di cui è presente la
recensione on line.
AA.VV. Investigating English with corpora, (2008). Uno dei capitoli è dedicato a corpora e glottodidattica. Partecipa anche Maurizio Gotti con un capitolo dedicato a discorso specialistico (academic discourse).


Curiosità
Fino a che punto il Corpus-based Approach va collegato a degli obiettivi didattici? A quanto pare due ricercatori del MIT e dell'Università del Texas hanno deciso di usarlo da un'altra prospettiva:
A Corpus-based Approach to Finding Happines (2006)

Sembra fargli eco lo studio di David García e Francesc Alías della Facoltà di Ingegneria e Architettura La Salle di Barcellona:

Identificación de emociones a partir de texto usando desambiguación semántica (2008).Lo troverete nella Rivista della Società Spagnola per il Procesamiento del Lenguaje Natural (SEPLN), nº 40, marzo 2008.

Ma di queste cose tecniche io non me ne intendo... ;-)













Nessun commento :

Related Posts Plugin for WordPress, Blogger...