Musicheria. La rivista digitale di educazione al suono e alla musica

Le ipotesi fantastiche di Rodari, Munari e Tagg

Prove di dialogo con l’I.A. (1)

Usare l’Intelligenza Artificiale come dispositivo analitico, smontando e rimontando un oggetto musicale in modo da rivelarne l’architettura. La tecnologia di separazione delle tracce consente di utilizzare lo strumento della sostituzione ipotetica, che accomuna la semiotica musicale di Philip Tagg e le tattiche creative di Rodari e di Munari (l’ipotesi fantastica e i cambi).

Spaesare[1]

Una delle tecniche che Gianni Rodari descrive nella Grammatica della fantasia è quella dell’ipotesi fantastica:

che cosa succederebbe se un uomo si svegliasse trasformato in un immondo scarafaggio? Alla domanda ha risposto da par suo Franz Kafka nel racconto Metamorfosi. […] Quella delle ipotesi fantastiche è una tecnica semplicissima. La sua forma è appunto quella della domanda: che cosa succederebbe se…Per formulare la domanda si scelgono a caso un soggetto e un predicato. La loro unione fornirà l’ipotesi su cui lavorare. […] Che cosa succederebbe se la città di Reggio Emilia si mettesse a volare? […] Che cosa succederebbe se improvvisamente Milano si trovasse circondata dal mare?[2]

In modo simile Bruno Munari propone la tecnica dei cambi (di colore, materia, luogo, funzione, moto, dimensione, peso). Si tratta di operazioni che fanno sì che un oggetto di partenza venga decontestualizzato e assuma, quindi, caratteristiche inattese che creano sorpresa e stupore. Un esempio è il cambio di luogo, cioè quando una cosa si trova in un ambiente dove normalmente non è prevista, in un posto non suo, come, ad esempio, in certe cartoline circolanti negli anni Trenta a Milano, in cui in Piazza Duomo compariva inaspettatamente il mare[3].

 

Una persona che dorme nel suo letto non desta nessuna curiosità se è nella sua stanza, ma se invece si trova a dormire in piazza del duomo, col suo letto, il tavolinetto con la sveglia, il tappetino e le pantofole; così in mezzo ai passanti, come se niente fosse, qualcuno forse lo noterebbe.[4]

Scomporre, ricomporre, sostituire

 C’è un gioco che consiste nello smontare la realtà per ricomporne i pezzi a piacere, generando nuovi sensi, facendosi sorprendere da incontri inattesi. In questa direzione l’Intelligenza Artificiale ci fornisce nuove forme di gioco che si basano, ad esempio, sulla possibilità di separazione delle tracce di una canzone (source separation), isolando le parti principali del brano (voce, batteria, basso, piano, altro) con sufficiente qualità e precisione[5]. Tale possibilità rende facilmente utilizzabili alcuni strumenti proposti da Philip Tagg nella sua metodologia di analisi semiotica, come ad esempio la sostituzione ipotetica.
Come è facile intuire, la domanda è la stessa incontrata prima in Rodari e Munari: cosa succederebbe al senso globale del brano se sostituissi questo elemento con un altro?
Fino a pochi anni fa operazioni di questo tipo rimanevano per lo più solo “immaginabili” o richiedevano procedimenti complessi che oggi, al contrario, necessitano di pochi click all’interno di un software facilmente accessibile.
Passiamo dalla teoria alla pratica.
Giochiamo, ad esempio, con Ace of spades, dei Motorhead (1980), un brano appartenente al genere heavy metal, con la seguente sequenza di operazioni:

  1. Separazione delle tracce.

Allan F. Moore propone di pensare alla musica rock come una specie di torta a strati, ognuno dei quali è costituito da uno o più strumenti che svolgono una specifica funzione all’interno del tessuto musicale: «il rock tende da utilizzare un insieme discreto di quattro funzioni che possono essere anche condivise da altri stili “popolari”, ma che rappresentano uno dei punti di distinzione rispetto alle forme precedenti di musica europea»[6].
Il primo strato è costituito dal groove, cioè la base ritmica del pezzo; il secondo dalla linea del basso; il terzo livello dal riempimento armonico; il quarto dalla linea del canto.
Come già detto, oggi è sufficiente un click per ottenere la nostra torta in cui sono ascoltabili isolatamente i quattro strati:

 

In un contesto didattico è possibile a questo punto chiedere di descrivere ogni strato: con quali aggettivi descriveresti la voce del cantante? Come descriveresti il sound della chitarra? Cosa ti colpisce ascoltando il groove della batteria? Ti viene in mente qualche analogia fra questo ritmo e la realtà extramusicale?

Dal link seguente è scaricabile un Progetto Audacity (Motorhead Laboratorio 1) in cui le quattro tracce del brano (i primi 45’’ circa) sono ascoltabili separatamente.
https://drive.google.com/file/d/1yB8e6kN8txJEugtjzzUCrs4GRkWcuDK1/view?usp=drive_link

 

 

2. Sostituzioni ipotetiche

È possibile a questo punto giocare con alcune sostituzioni e proporre all’ascolto alcune varianti che chiariscano il senso dei vari musemi[7], ovvero gli elementi che più “danno il senso” del brano. La “grana” della voce di Ian “Lemmy” Kilmister è tesa, satura, rauca, raschiata, sofferente.
Cosa succederebbe allora se Ace of Spades fosse cantata da una voce più “pulita”? E se fosse cantata da una voce femminile? Quale impressione vi fanno queste sostituzioni? Quale versione preferite e perché?

Dal link seguente è scaricabile un progetto Audacity (Motorhead Laboratorio 2) in cui oltre alle tracce precedenti sono presenti altre tre tracce vocali, ottenute con l’IA[8], varianti della traccia originale dei Motorhead:

https://drive.google.com/file/d/1mQKgWEVMWFflKlZP1FOWCVshgJavHqEt/view?usp=sharing

 

All’interno di questo progetto è quindi possibile fare diversi tipi di ascolto e analisi:

    1. Ascoltare il brano cambiando la voce solista: cosa è cambiato nel senso globale del brano? Trovate che funzioni? Se no, perché? Lo definiresti ancora “heavy Metal”?
    2. Qual è, oltre alla voce, la parte che più dà il senso “heavy metal” al brano?
    3. Isolare le quattro voci (l’originale e le tre varianti) e confrontarle fra di loro: qual è la più rock? Quale voce è più “spaesata” rispetto al contesto? Che differenze ci sono fra le due voci femminili?
Gridare al di sopra del traffico

Philip Tagg suggerisce che il dualismo presente in musiche costruite in base alla struttura melodia/accompagnamento si possa interpretare come relazione tra l’individuo e l’ambiente in cui esso si trova E a proposito dell’Heavy Metal scrive:

Nell’heavy metal lo sfondo presenta l’immagine sonora umanizzata di una società elettromeccanica affascinante e opprimente che offre veramente poche possibilità di scampo, e che è assoggettata alla schiavitù di un tempo quasi metronomico. È tutto così rumoroso e potente che si riesce a farsi sentire solo se si alza la voce, come quando si cerca di parlare con un amico dall’altra parte di una cittadina dove passa continuamente un flusso costante di automobili. L’equivalente musicale di ciò è urlare al di sopra di tutti gli altri rumori come fa ogni dignitoso cantante rock maschio.[9]

Secondo Tagg, diversi elementi strutturali e sonori dell’heavy metal possono essere analizzati come equivalenti musicali di suoni e sensazioni tipiche dell’ambiente urbano, con quelle che lui chiama anafonie, indicando con questo termine le modalità con cui una musica instaura una relazione di analogia con eventi non musicali.

  • Il volume elevato e l’enfatizzazione delle basse frequenze (anafonia sonora)
  • Il groove ripetitivo e implacabile, associabile alla catena di montaggio, simbolo della modernità industriale (anafonia cinetica)
  • Il sound saturo e distorto della chitarra elettrica, con la tecnica dei power chord[10], tratto distintivo del Metal, viene spesso associato al rumore continuo e martellante di macchinari, motori ed altri rumori industriali (anafonia tattile).

Proviamo a sovrapporre la sola voce ad una registrazione di traffico cittadino e ascoltiamo l’effetto che fa: è credibile l’anafonia proposta da Tagg?
Possiamo montare in sequenza, con una dissolvenza incrociata, i due sfondi: lo sfondo urbano reale e quello del brano musicale, passando dal traffico reale a quello “rappresentato”, e viceversa: c’è analogia tra il traffico vero e quello “trasformato” musicalmente? Quali sono eventualmente i tratti comuni?

 In allegato: Figure e sfondi (Audio)

Conclusioni

Smontare e rimontare un brano musicale permette di visualizzare l’invisibile architettura estetica, rivelando come ogni singola parte sia una scelta di senso.
Educare sperimentalmente a questo uso “rodariano” della tecnologia significa trasformare l’Intelligenza Artificiale in un dispositivo al servizio di una Grammatica della Fantasia. In questo approccio, il rigore semiotico di Tagg e la libertà creativa di Munari e Rodari si fondono, offrendo agli studenti gli strumenti per non essere semplici ascoltatori, ma interpreti e creatori consapevoli dei mondi sonori che abitano.

 

[1] Il presente lavoro amplia il capitolo “Spaesare” presente nel mio recente libro Fantasia Sonora. Sei lezioni-laboratorio dedicate a Bruno Munari, Progetti Sonori, Mercatello sul Metauro, 2026, pp. 79-96.
[2] Gianni Rodari, Grammatica della fantasia, Einaudi, Torino, 1973, p. 26.
[3] “Se a Milano ci fosse il mare”, cartolina degli anni Trenta, Milano, Civica Raccolta delle Stampe Achille Bertarelli; immagine tratta da:
https://www.lombardiabeniculturali.it/blog/percorsi/milano-centro-piazza-del-duomo-e-la-gallleria-vittorio-emanuele-ii-parte-seconda/curiosita/.
[4] Bruno Munari, Fantasia, Laterza, Milano, 1977, p. 79.
[5] Mi riferisco a programmi come LALAL.AI, Moises, Suno, o alla funzione specifica in Logic Pro che permette di scomporre una traccia audio nei suoi componenti fondamentali (Stem Splitter).
[6] Allan, F. Moore, Analizzare il rock: strumenti e finalità, in Musica/Realtà, n.62, 2000, pp. 98-99.
[7] Il musema nella semiotica di P. Tagg è l’unità minima di significato musicale (equivalente al morfema in linguistica). Può essere un frammento melodico, una figura ritmica, un sound, un giro di accordi. Sostituendo o variando ora uno ora l’altro musema all’interno di una struttura si “mette alla prova” la tenuta o meno del senso originale del brano, identificandone così gli elementi fondamentali della significazione musicale.
[8] Il processo di variazione della voce è stato in questo caso realizzato con la piattaforma Kits AI.
[9] Philip Tagg, Popular Music. Da Kojak al Rave, a cura di Roberto Agostini e Luca Marconi, Clueb, Bologna, 1994, p. 381.
[10] Il Power Chord è un accordo di due (o tre note) con fondamentale e quinta, senza la terza. Nel caso di accordi di tre note è la fondamentale ad essere raddoppiata all’ottava. Eseguito sulla chitarra elettrica distorta dà un sound potente e aggressivo. Esempi classici si trovano in brani come Smoke on the Water dei Deep Purple, Whole Lotta Love dei Led Zeppelin e, naturalmente, in quasi tutto il repertorio di AC/DC e Metallica.

 

Spaesare[1]

Una delle tecniche che Gianni Rodari descrive nella Grammatica della fantasia è quella dell’ipotesi fantastica:

che cosa succederebbe se un uomo si svegliasse trasformato in un immondo scarafaggio? Alla domanda ha risposto da par suo Franz Kafka nel racconto Metamorfosi. […] Quella delle ipotesi fantastiche è una tecnica semplicissima. La sua forma è appunto quella della domanda: che cosa succederebbe se…Per formulare la domanda si scelgono a caso un soggetto e un predicato. La loro unione fornirà l’ipotesi su cui lavorare. […] Che cosa succederebbe se la città di Reggio Emilia si mettesse a volare? […] Che cosa succederebbe se improvvisamente Milano si trovasse circondata dal mare?[2]

In modo simile Bruno Munari propone la tecnica dei cambi (di colore, materia, luogo, funzione, moto, dimensione, peso). Si tratta di operazioni che fanno sì che un oggetto di partenza venga decontestualizzato e assuma, quindi, caratteristiche inattese che creano sorpresa e stupore. Un esempio è il cambio di luogo, cioè quando una cosa si trova in un ambiente dove normalmente non è prevista, in un posto non suo, come, ad esempio, in certe cartoline circolanti negli anni Trenta a Milano, in cui in Piazza Duomo compariva inaspettatamente il mare[3].

 

Una persona che dorme nel suo letto non desta nessuna curiosità se è nella sua stanza, ma se invece si trova a dormire in piazza del duomo, col suo letto, il tavolinetto con la sveglia, il tappetino e le pantofole; così in mezzo ai passanti, come se niente fosse, qualcuno forse lo noterebbe.[4]

Scomporre, ricomporre, sostituire

 C’è un gioco che consiste nello smontare la realtà per ricomporne i pezzi a piacere, generando nuovi sensi, facendosi sorprendere da incontri inattesi. In questa direzione l’Intelligenza Artificiale ci fornisce nuove forme di gioco che si basano, ad esempio, sulla possibilità di separazione delle tracce di una canzone (source separation), isolando le parti principali del brano (voce, batteria, basso, piano, altro) con sufficiente qualità e precisione[5]. Tale possibilità rende facilmente utilizzabili alcuni strumenti proposti da Philip Tagg nella sua metodologia di analisi semiotica, come ad esempio la sostituzione ipotetica.
Come è facile intuire, la domanda è la stessa incontrata prima in Rodari e Munari: cosa succederebbe al senso globale del brano se sostituissi questo elemento con un altro?
Fino a pochi anni fa operazioni di questo tipo rimanevano per lo più solo “immaginabili” o richiedevano procedimenti complessi che oggi, al contrario, necessitano di pochi click all’interno di un software facilmente accessibile.
Passiamo dalla teoria alla pratica.
Giochiamo, ad esempio, con Ace of spades, dei Motorhead (1980), un brano appartenente al genere heavy metal, con la seguente sequenza di operazioni:

  1. Separazione delle tracce.

Allan F. Moore propone di pensare alla musica rock come una specie di torta a strati, ognuno dei quali è costituito da uno o più strumenti che svolgono una specifica funzione all’interno del tessuto musicale: «il rock tende da utilizzare un insieme discreto di quattro funzioni che possono essere anche condivise da altri stili “popolari”, ma che rappresentano uno dei punti di distinzione rispetto alle forme precedenti di musica europea»[6].
Il primo strato è costituito dal groove, cioè la base ritmica del pezzo; il secondo dalla linea del basso; il terzo livello dal riempimento armonico; il quarto dalla linea del canto.
Come già detto, oggi è sufficiente un click per ottenere la nostra torta in cui sono ascoltabili isolatamente i quattro strati:

 

In un contesto didattico è possibile a questo punto chiedere di descrivere ogni strato: con quali aggettivi descriveresti la voce del cantante? Come descriveresti il sound della chitarra? Cosa ti colpisce ascoltando il groove della batteria? Ti viene in mente qualche analogia fra questo ritmo e la realtà extramusicale?

Dal link seguente è scaricabile un Progetto Audacity (Motorhead Laboratorio 1) in cui le quattro tracce del brano (i primi 45’’ circa) sono ascoltabili separatamente.
https://drive.google.com/file/d/1yB8e6kN8txJEugtjzzUCrs4GRkWcuDK1/view?usp=drive_link

 

 

2. Sostituzioni ipotetiche

È possibile a questo punto giocare con alcune sostituzioni e proporre all’ascolto alcune varianti che chiariscano il senso dei vari musemi[7], ovvero gli elementi che più “danno il senso” del brano. La “grana” della voce di Ian “Lemmy” Kilmister è tesa, satura, rauca, raschiata, sofferente.
Cosa succederebbe allora se Ace of Spades fosse cantata da una voce più “pulita”? E se fosse cantata da una voce femminile? Quale impressione vi fanno queste sostituzioni? Quale versione preferite e perché?

Dal link seguente è scaricabile un progetto Audacity (Motorhead Laboratorio 2) in cui oltre alle tracce precedenti sono presenti altre tre tracce vocali, ottenute con l’IA[8], varianti della traccia originale dei Motorhead:

https://drive.google.com/file/d/1mQKgWEVMWFflKlZP1FOWCVshgJavHqEt/view?usp=sharing

 

All’interno di questo progetto è quindi possibile fare diversi tipi di ascolto e analisi:

    1. Ascoltare il brano cambiando la voce solista: cosa è cambiato nel senso globale del brano? Trovate che funzioni? Se no, perché? Lo definiresti ancora “heavy Metal”?
    2. Qual è, oltre alla voce, la parte che più dà il senso “heavy metal” al brano?
    3. Isolare le quattro voci (l’originale e le tre varianti) e confrontarle fra di loro: qual è la più rock? Quale voce è più “spaesata” rispetto al contesto? Che differenze ci sono fra le due voci femminili?
Gridare al di sopra del traffico

Philip Tagg suggerisce che il dualismo presente in musiche costruite in base alla struttura melodia/accompagnamento si possa interpretare come relazione tra l’individuo e l’ambiente in cui esso si trova E a proposito dell’Heavy Metal scrive:

Nell’heavy metal lo sfondo presenta l’immagine sonora umanizzata di una società elettromeccanica affascinante e opprimente che offre veramente poche possibilità di scampo, e che è assoggettata alla schiavitù di un tempo quasi metronomico. È tutto così rumoroso e potente che si riesce a farsi sentire solo se si alza la voce, come quando si cerca di parlare con un amico dall’altra parte di una cittadina dove passa continuamente un flusso costante di automobili. L’equivalente musicale di ciò è urlare al di sopra di tutti gli altri rumori come fa ogni dignitoso cantante rock maschio.[9]

Secondo Tagg, diversi elementi strutturali e sonori dell’heavy metal possono essere analizzati come equivalenti musicali di suoni e sensazioni tipiche dell’ambiente urbano, con quelle che lui chiama anafonie, indicando con questo termine le modalità con cui una musica instaura una relazione di analogia con eventi non musicali.

  • Il volume elevato e l’enfatizzazione delle basse frequenze (anafonia sonora)
  • Il groove ripetitivo e implacabile, associabile alla catena di montaggio, simbolo della modernità industriale (anafonia cinetica)
  • Il sound saturo e distorto della chitarra elettrica, con la tecnica dei power chord[10], tratto distintivo del Metal, viene spesso associato al rumore continuo e martellante di macchinari, motori ed altri rumori industriali (anafonia tattile).

Proviamo a sovrapporre la sola voce ad una registrazione di traffico cittadino e ascoltiamo l’effetto che fa: è credibile l’anafonia proposta da Tagg?
Possiamo montare in sequenza, con una dissolvenza incrociata, i due sfondi: lo sfondo urbano reale e quello del brano musicale, passando dal traffico reale a quello “rappresentato”, e viceversa: c’è analogia tra il traffico vero e quello “trasformato” musicalmente? Quali sono eventualmente i tratti comuni?

 In allegato: Figure e sfondi (Audio)

Conclusioni

Smontare e rimontare un brano musicale permette di visualizzare l’invisibile architettura estetica, rivelando come ogni singola parte sia una scelta di senso.
Educare sperimentalmente a questo uso “rodariano” della tecnologia significa trasformare l’Intelligenza Artificiale in un dispositivo al servizio di una Grammatica della Fantasia. In questo approccio, il rigore semiotico di Tagg e la libertà creativa di Munari e Rodari si fondono, offrendo agli studenti gli strumenti per non essere semplici ascoltatori, ma interpreti e creatori consapevoli dei mondi sonori che abitano.

 

[1] Il presente lavoro amplia il capitolo “Spaesare” presente nel mio recente libro Fantasia Sonora. Sei lezioni-laboratorio dedicate a Bruno Munari, Progetti Sonori, Mercatello sul Metauro, 2026, pp. 79-96.
[2] Gianni Rodari, Grammatica della fantasia, Einaudi, Torino, 1973, p. 26.
[3] “Se a Milano ci fosse il mare”, cartolina degli anni Trenta, Milano, Civica Raccolta delle Stampe Achille Bertarelli; immagine tratta da:
https://www.lombardiabeniculturali.it/blog/percorsi/milano-centro-piazza-del-duomo-e-la-gallleria-vittorio-emanuele-ii-parte-seconda/curiosita/.
[4] Bruno Munari, Fantasia, Laterza, Milano, 1977, p. 79.
[5] Mi riferisco a programmi come LALAL.AI, Moises, Suno, o alla funzione specifica in Logic Pro che permette di scomporre una traccia audio nei suoi componenti fondamentali (Stem Splitter).
[6] Allan, F. Moore, Analizzare il rock: strumenti e finalità, in Musica/Realtà, n.62, 2000, pp. 98-99.
[7] Il musema nella semiotica di P. Tagg è l’unità minima di significato musicale (equivalente al morfema in linguistica). Può essere un frammento melodico, una figura ritmica, un sound, un giro di accordi. Sostituendo o variando ora uno ora l’altro musema all’interno di una struttura si “mette alla prova” la tenuta o meno del senso originale del brano, identificandone così gli elementi fondamentali della significazione musicale.
[8] Il processo di variazione della voce è stato in questo caso realizzato con la piattaforma Kits AI.
[9] Philip Tagg, Popular Music. Da Kojak al Rave, a cura di Roberto Agostini e Luca Marconi, Clueb, Bologna, 1994, p. 381.
[10] Il Power Chord è un accordo di due (o tre note) con fondamentale e quinta, senza la terza. Nel caso di accordi di tre note è la fondamentale ad essere raddoppiata all’ottava. Eseguito sulla chitarra elettrica distorta dà un sound potente e aggressivo. Esempi classici si trovano in brani come Smoke on the Water dei Deep Purple, Whole Lotta Love dei Led Zeppelin e, naturalmente, in quasi tutto il repertorio di AC/DC e Metallica.

 

Vuoi leggere l'articolo completo? Effettua il login

Materiali PDF
Materiali audio
Figure e sfondi
Materiali video