QUIZZONE!

Tra Asimov, Dickens, Lovecraft, Shakespeare, Tolkien e Wells, chi utilizza più parole diverse a parità di lunghezza di testo? Mettete i sei autori in ordine decrescente e vedrete in fondo se e quanto ci avete azzeccato.

La legge che descrive quante parole diverse (D) compaiono nel testo in funzione della lunghezza dello stesso (N) è detta legge di Heaps, dal nome del suo scopritore (o meglio divulgatore). All’inizio del testo la maggior parte delle parole viene incontrata per la prima volta, via via che progrediamo nella lettura il numero di nuove parole va diminuendo.

Si dimostra che è equivalente a quella di Zipf di cui abbiamo parlato in questa sede, sempre applicandola agli scritti di Tolkien. 

La legge di Heaps è parametrizzata secondo questa forma:

 D= K Nγ

 

L’esponente γ è minore di uno (di solito 0.4-0.5) risultando in un andamento stile radice quadrata (γ=0.5).

Ogni autore e ogni testo ha parametri k e γ diversi, determinati tramite un fit dei dati, fino a trovare i parametri che ne descrivono meglio l’andamento.

 

QUIZZONE concatenato: quale dei libri di Tolkien tra Lo Hobbit, Il Signore degli Anelli, Il Silmarillion e le Lettere usa più parole per unità di lunghezza? (anche qui fate la lista prima di vedere la Figura 1!)

Figura 1: Andamento del numero di parole diverse in funzione del numero totale di parole nelle opere di Tolkien.

Le Lettere svettano rispetto agli altri testi dato che si tratta di un testo di non-fiction che tratta di argomenti diversi con persone diverse e pertanto il valore di D  cresce più rapidamente. 

Abbiamo poi i due libri dei Racconti perduti in cui, come per i Racconti Incompiuti vi sono ampie parti di commento redatte dal  figlio di JRR,  Christopher che ne espandono il vocabolario.

 

Vediamo però che tutti i testi principali seguono grosso modo lo stesso andamento. Anche l’Hobbit, in cui ci si potrebbe aspettare un lessico più semplice, ha un andamento molto simile agli altri.

 

La vera sorpresa viene però dal Silmarillion, spesso considerato difficile a leggersi anche a causa del suo linguaggio apparentemente ostico, che in realtà è quello con il minor numero di parole diverse. Questo apparente paradosso può essere addotto alla quasi totale assenza di dialoghi nell’opera, che quindi ha una struttura molto particolare che si ripercuote sul suo andamento, Questo mostra anche come la legge di Heaps sia valida per un’analisi lessicale ma non per stimere la complessità di un testo, dato che considera ogni parola individualmente e non come parte di un discorso articolato. 

 

In Figura 2 abbiamo la risposta al quizzone.

Lovecraft svetta dall’alto del suo immane lessico arcaico, spaventoso e terrificante. Poi abbiamo un gruppo di autori con andamenti molto simili, penultimo Shakespeare, probabilmente anche in virtù della struttura teatrale e poetica dei suoi scritti che ne vincola il linguaggio. 

 

E ultimo, sorprendentemente, Tolkien! Anche se la distribuzione di Heaps può dipendere a bassi N dall’ordine con cui vengono considerati i libri nei corpora, anche un confronto diretto Signore degli AnelliFondazione (di Asimov) mostra come il primo utilizzi meno termini del secondo (sul medio-lungo periodo).

Asimov viene spesso descritto come autore che scrive molto chiaramente e utilizza uno stile didattico nelle sue opere anche di fiction. In realtà, come possiamo vedere, la ricchezza del suo lessico è paragonabile a quelle di Wells e Dickens (un’altra cosa che si nota è quanta roba abbia scritto Dickens). Quindi non è certamente il numero di parole diverse o il lessico utilizzato a determinare la bravura di un autore. Nel caso di Tolkien, infatti, la sua abilità sta nel creare mondi e situazioni estremamente complessi con un numero (relativamente) inferiore di termini e di avere una scrittura cristallina pur creando vari linguaggi propri e chiamando personaggi e luoghi in almeno tre modi distinti (senza appesantire la scrittura).

3. Continua

parte 2. Niente magia, siamo Elfi

parte 1. La statistica di Tolkien

parte 0. La legge di Zipf e Tolkien

parte -1: La Scienza della Terra di Mezzo

Qui una live sulla cosmologia di Tolkien

 

Figura 2: grafico di Heaps per gli autori considerati