Prova di una ricerca sulla sezione della pubblicità (11.000 parole)  

 


Home
Cos'è il CiT
Composizione del corpus
Annotazione grammaticale
Articoli e bibliografia


Per informazioni, scrivere a:
Stefania Spina

  

CiT Demo

 

La trascrizione di una versione campione del CiT, di 125.000 parole, pari al 25% del corpus definitivo, è stata completata nell' ottobre 1999. Su questo campione si sta studiando un sistema di marcatura rispondente alle specifiche della TEI, capace di rendere conto della specificità dei testi televisivi. La demo è stata inoltre sottoposta a tagging con l'ausilio del software TreeTagger dell'Università di Stoccarda.

 

Tipo e numero di trasmissioni

Numero parole

Percentuale sul totale

Durata

Telegiornali: 6

  • TG1 ore 20.00 (1/12/98, 5/1/99, 20/1/99)
  • TG3 ore 19.00 (25/8/98, 28/8/98)
  • TMC ore 18.45 (4/2/99)

30.000

25%

3 ore

Sport: 4

  • Telecronaca Italia-Norvegia RaiUno (10/2/99)
  • Telecronaca Parma-Inter un tempo RaiUno (9/1/99)
  • Novantesimo minuto, RaiUno (31/1/99 e 7/3/99)

30.000

25%

3 ore e 15 minuti

Intrattenimento: 4

  • Festival di Sanremo, RaiUno (23/2/99)
  • Harem, RaiTre (6/2/99)
  • Coppie, Canale 5 (3/2/99)
  • Meteore, Italia 1 (7/10/99)

27.000

22,5%

4 ore

Attualità: 4

  • Pinocchio, RaiDue (1/10/98)
  • Porta a Porta, RaiUno (7/10/98)
  • Il Fatto, RaiUno (20/1/99, 29/1/99)

27.000

27%

3 ore e 15 minuti

Pubblicità:

  • 260 spot (aprile-maggio 1999)

11.000

27,5%

2 ore

TOTALE

125.000

25%

15 ore e 30 minuti