L’essere umano si distingue dagli altri animali per l’uso della parola. La capacità dell’uomo di parlare è legata alle proporzioni del cervello rispetto alla massa corporea.

Avere un cervello più grande consente funzioni superiori come lo scambio di informazioni attraverso il linguaggio, la loro custodia nella memoria, la trasmissione delle conoscenze da un luogo all’altro e la conservazione nel tempo attraverso la scrittura e la realizzazione di opere durevoli. In definitiva è la possibilità per molti di attingere al sapere di chiunque.

Perché le relazioni tra le persone siano possibili occorre un mezzo di trasmissione delle informazioni. Serve un’uscita da un soggetto e un ingresso in un altro.


La natura ci ha dotato della fonazione, la capacità di emettere suoni spingendo l’aria dai polmoni attraverso la laringe e le corde vocali, e modularli con i movimenti della lingua e della bocca per attribuire ad ognuno un carattere distintivo. Possiamo emettere una serie di suoni continui, che chiamiamo vocali, intervallati da suoni articolatori più brevi, le consonanti.

A questa emittente acustica deve fare da ricevente l’udito, con una capacità corrispondente di distinguere i suoni vocalici e consonantici. Le onde sonore attraversano un breve percorso costituito da condotto uditivo, membrana del timpano, catena degli ossicini fino alla coclea, un organo molto sofisticato al cui interno avviene la trasformazione da suono ad impulso nervoso per il cervello. Nel cervello avviene poi la comprensione della provenienza del suono, del suo contenuto informativo, e in definitiva del significato.

La voce umana copre un ampio spettro di quelle che in musica chiameremmo note, ma in fisica frequenze, da un paio di centinaia di Hertz fino a 2000 per le vocali, e fino a 8000 per le consonanti. Anche l’orecchio è sensibile a sentire la stessa estensione di frequenze.

Che significa tutto ciò? Lo spiego con un esempio.

Avete presente quando vi dicono di aver pagato sessanta euro dal macellaio e non avete capito bene? Sessanta o settanta? Sette zero?

E’ successo che le due consonanti “s” e “t” non erano abbastanza forti da risaltare bene nella frase. Anche se il volume generale era alto. In altre parole, le vocali erano chiare ma quell’unica consonante ha creato un dubbio di interpretazione.

Per come vengono prodotte, le consonanti hanno un volume più basso delle vocali. Questo spiega in parte la difficoltà di sentirle sempre bene.

Ma il contenuto informativo delle consonanti è altissimo. In italiano abbiamo 5 vocali, ma ben 16 consonanti. Comprendere male una parola perché una singola consonante somiglia ad un’altra è piuttosto frequente. Ci penserà poi il cervello a fare le correzioni e ad attribuire alla parola il suo giusto significato. A volte con grande sforzo.

Può accadere che non ci troviamo in un luogo ideale, silenzioso, dove un’unica persona ci sta dicendo qualcosa. Siamo magari per strada, o in un ristorante, e c’è molta confusione.

Delle parole che ci vengono rivolte sentiamo bene le vocali, ma le consonanti hanno bisogno di interpretazione. Il chiasso intorno invece lo sentiamo benissimo, e supera le sfuggenti consonanti con un effetto di copertura che si chiama mascheramento.

Semplificando, la coclea possiamo immaginarla come il guscio di una chiocciola, che poi è il significato del termine. Al suo interno ci sono 15000 cellule nervose, ognuna con un filamento superiore, chiamate cellule ciliate. Sono immerse in un liquido che le onde sonore in arrivo fanno ondeggiare producendo la partenze di un segnale diretto al cervello lungo il nervo acustico. Migliaia di impulsi nervosi verranno decodificati dalla corteccia cerebrale come suoni, parole e rumori.

Mi piace pensare all’immagine di un campo di grano seminato da poco, ancora verde, con il vento che produce oscillazioni che sembrano onde che camminano. La zona iniziale della chiocciola è sensibile ai suoni acuti, quelli stridenti e metallici, e quindi all’ascolto delle consonanti. Procedendo verso la zona più interna il tappeto di cellule ciliate sarà sensibile ai toni medi e infine ai gravi. 

La zona all’apice della formazione sarà quella più protetta, perché più interna. Il giro alla base invece può facilmente risentire di traumi, dell’azione di farmaci o degli effetti dell’invecchiamento. Ecco spiegato perché in caso di abbassamento dell’udito o di presbiacusia molto spesso non si ha la sensazione di sentire poco, quanto di sentire senza riuscire a capire bene: si tende a perdere le consonanti. Il rumore invece lo sentiamo bene e maschera la comprensione delle parole nella loro completezza.

bruno odoardi
bodoardi@gmail.com
Audioprotesista pediatrico, in attività dal 1980

Leave a Reply

Your email address will not be published. Required fields are marked *