El so: propagació, freqüència i representació

Pendent

Guardat en aquest dispositiu.

Entrar

1. Què és el so?

El so es pot explicar des de dues perspectives diferents.

Des del punt de vista físic, el so és una pertorbació mecànica que es propaga a través d’un medi material. Aquesta pertorbació transmet energia mitjançant el moviment oscil·latori de les partícules del medi.

Des del punt de vista perceptiu, el so és l’experiència auditiva produïda quan aquestes variacions arriben a l’oïda i són interpretades pel cervell.[1][2]

Tot i que aquestes dues idees estan estretament relacionades, no són exactament equivalents. El fenomen físic pot existir encara que ningú el percebi, encara que diferents espècies o sistemes de mesura poden interpretar-lo o detectar-lo de maneres diverses.

La manera com el so es propaga depèn del medi. En gasos i líquids, es manifesta principalment com a variacions de pressió i densitat. En sòlids, en canvi, també poden aparèixer deformacions mecàniques internes del material i la propagació esdevé més complexa.[1][3]

En l’aire —el medi amb què treballem habitualment en producció musical i acústica— el so es propaga principalment mitjançant compressions i rarefaccions longitudinals de pressió produïdes pel moviment oscil·latori de les partícules del medi.

Idea clau: el que es propaga no són les partícules del medi, sinó la pertorbació i l’energia associada.

Una vibració genera una pertorbació mecànica que es propaga a través del medi en forma d’ona sonora. En l’aire, aquesta propagació es manifesta principalment com una successió de compressions i rarefaccions de pressió.

2. Què és exactament una ona sonora?

Quan una font sonora vibra —una corda, una membrana o un altaveu— altera l’estat d’equilibri del medi que l’envolta. En l’aire, aquesta alteració es manifesta principalment com una successió de compressions i rarefaccions.[1][2]

Una compressió és una regió on les partícules del medi es troben momentàniament més juntes, generant una pressió més elevada. Una rarefacció, en canvi, és una regió on les partícules es troben més separades i la pressió disminueix.[1]

Aquestes variacions de pressió no romanen estàtiques, sinó que es propaguen a través del medi en forma d’ona sonora.

És important entendre que les partícules d’aire no viatgen des de la font fins a l’oïda. El que fan és oscil·lar localment al voltant de la seva posició d’equilibri, transferint energia a les partícules veïnes.[1][3]

Per aquest motiu, una ona sonora no consisteix en un desplaçament global de matèria, sinó en la propagació d’una pertorbació mecànica i de l’energia associada.

En l’aire, aquesta propagació és principalment longitudinal: les partícules oscil·len aproximadament en la mateixa direcció en què avança l’ona.[1][2]

Les partícules del medi no viatgen amb l’ona sonora, sinó que oscil·len localment al voltant de la seva posició d’equilibri. Les regions més denses corresponen a compressions, mentre que les més separades corresponen a rarefaccions.

3. Freqüència i longitud d'ona

Una ona sonora no és una pressió fixa, sinó una variació que es repeteix en el temps. En l’aire, aquesta variació es manifesta com una successió de compressions i rarefaccions que avancen a través del medi. La freqüència indica quants cicles complets fa aquesta oscil·lació cada segon.[1][3] Es mesura en hertzs (Hz): una freqüència de 100 Hz fa 100 cicles per segon (100 cicles complets de compressió i rarefacció); una freqüència de 1.000 Hz en fa 1.000.

Des del punt de vista perceptiu, les freqüències baixes tendeixen a correspondre a sons greus, mentre que les freqüències altes tendeixen a correspondre a sons aguts.[2] Físicament, però, la freqüència no es tradueix només en si un so es percep greu o agut, sinó que correspon a la rapidesa amb què es repeteix el patró d’oscil·lació.

Mentre aquest patró es repeteix, l’ona també es desplaça a través del medi. Això vol dir que cada cicle ocupa una distància física concreta. Aquesta distància és la longitud d’ona.[1][3] Una freqüència baixa oscil·la més lentament. Com que el so continua avançant mentre completa el cicle, aquest cicle ocupa més espai. Per això les freqüències greus tenen longituds d’ona més llargues. Per altra banda, una freqüència alta oscil·la més ràpidament. En el mateix temps, hi caben més cicles, i cadascun ocupa menys espai. Per això les freqüències agudes tenen longituds d’ona més curtes.

velocitat del so = freqüència × longitud d’ona

També podem escriure aquesta relació de manera més útil per calcular la longitud d’ona:

longitud d’ona = velocitat del so / freqüència

En símbols:

λ = v / f

On λ és la longitud d’ona, v és la velocitat del so en el medi i f és la freqüència.

En aire sec a 20 °C, la velocitat del so és aproximadament de 343 m/s.[1] Per tant, si volem calcular la longitud d’ona d’una freqüència de 60 Hz:

λ = 343 / 60 ≈ 5,72 m

Això vol dir que un sol cicle complet d’una ona de 60 Hz ocupa aproximadament 5,72 metres en l’aire.

Aquest punt és fonamental en acústica de sales. Moltes freqüències greus tenen longituds d’ona comparables a les dimensions d’una habitació domèstica o d’un estudi petit, motiu pel qual poden aparèixer acumulacions, cancel·lacions i diferències molt grans de nivell segons la posició d’escolta.

Idea clau: la freqüència descriu una repetició en el temps; la longitud d’ona descriu quant espai ocupa aquesta repetició mentre el so es propaga.

La freqüència determina quantes vegades es repeteix un cicle per segon, mentre que la longitud d’ona descriu la distància física que ocupa aquest cicle en el medi. Les freqüències baixes generen longituds d’ona més grans; les freqüències altes generen longituds d’ona més curtes.

Això no vol dir, però, que una ona de 60 Hz només pugui recórrer 5,72 metres. La longitud d’ona no indica fins on arriba un so, sinó quant espai físic ocupa un cicle complet de l’ona mentre es propaga.

Una ona sonora pot continuar avançant molt més enllà de la seva longitud d’ona, sempre que conservi prou energia per ser detectable o audible. En aquest sentit, la longitud d’ona descriu la mida espacial del patró d’oscil·lació, no la distància màxima de propagació.

De fet, les freqüències greus sovint es perceben a distàncies molt més grans que les freqüències agudes.[2][3] Això es deu principalment a dos factors. D’una banda, l’aire absorbeix molt més les freqüències altes que les baixes, de manera que els aguts perden energia més ràpidament mentre es propaguen. De l’altra, les longituds d’ona llargues difracten més fàcilment al voltant d’obstacles com edificis, arbres o cantonades. [3]

Per aquest motiu, a grans distàncies sovint continuem percebent els greus d’un concert o d’un sistema de so, mentre que gran part del contingut agut ja ha desaparegut.

L’energia transportada per una ona sonora està estretament relacionada amb la seva amplitud, però no són exactament el mateix concepte. L’amplitud descriu la magnitud de l’oscil·lació de l’ona: en l’aire, això es tradueix en diferències més grans o més petites entre les zones de compressió i rarefacció.

Quan l’amplitud augmenta, les variacions de pressió també augmenten, i l’ona és capaç de transportar més energia. Aquesta relació, però, no és lineal. En una ona sonora, l’energia és aproximadament proporcional al quadrat de l’amplitud.[3]

E ∝ A²

On:

  • E és l’energia associada a l’ona sonora,
  • A és l’amplitud de l’oscil·lació,
  • ∝ indica una relació de proporcionalitat.

En aquest context, l’energia és aproximadament proporcional al quadrat de l’amplitud.

Això vol dir que duplicar l’amplitud no implica duplicar l’energia, sinó aproximadament quadruplicar-la.

En acústica i producció musical, conceptes com amplitud, energia, intensitat, nivell SPL o volum percebut sovint es confonen, però descriuen aspectes diferents del fenomen sonor. L’amplitud i l’SPL són magnituds físiques relacionades amb les variacions de pressió; la intensitat descriu l’energia que travessa una determinada superfície; i el volum percebut depèn també del funcionament del sistema auditiu humà.

Per aquest motiu, dues freqüències diferents amb el mateix nivell físic no necessàriament es perceben amb la mateixa intensitat subjectiva.

L’SPL (Sound Pressure Level o nivell de pressió sonora) és una manera de quantificar la magnitud de les variacions de pressió produïdes per una ona sonora respecte a una pressió de referència. Habitualment s’expressa en decibels (dB SPL).[2][3]

Com més grans són les variacions de pressió entre compressions i rarefaccions, més elevat és el nivell SPL i més energia transporta l’ona sonora.

Tot i això, un augment físic de l’SPL no implica necessàriament una percepció proporcional del volum. La percepció humana del nivell sonor depèn també de factors psicoacústics i de la sensibilitat de l’oïda a diferents freqüències.[2]

Nota: en el següent apartat aprofundirem en el concepte d’amplitud i la seva relació amb l’energia transportada per l’ona sonora. Conceptes com els decibels, l’SPL o la percepció subjectiva del volum es desenvoluparan més endavant en articles específics dedicats al nivell sonor i la psicoacústica.

4. Amplitud, pressió i nivell

L’amplitud descriu la magnitud de l’oscil·lació d’una ona sonora respecte al seu punt d’equilibri. En l’aire, això es tradueix en diferències més grans o més petites entre les zones de compressió i rarefacció. Quan l’amplitud augmenta, les variacions de pressió també augmenten.

Una ona amb més amplitud transporta més energia i genera variacions de pressió més grans en el medi. Per aquest motiu, amplitud i nivell sonor estan estretament relacionats. En acústica, aquestes variacions de pressió es quantifiquen habitualment mitjançant el nivell de pressió sonora o SPL (Sound Pressure Level), expressat en decibels (dB SPL).

Tot i això, un augment físic de l’amplitud o de l’SPL no implica necessàriament una percepció proporcional del volum. La percepció humana del nivell sonor depèn també de factors psicoacústics i de la sensibilitat de l’oïda a diferents freqüències.

Dues ones poden tenir la mateixa freqüència i, per tant, la mateixa longitud d’ona, però amplituds diferents. Quan l’amplitud augmenta, les variacions de pressió entre compressions i rarefaccions són més grans i l’ona transporta més energia.

Idea clau: la freqüència determina cada quan es repeteix una oscil·lació; l’amplitud determina la magnitud de les variacions de pressió associades a aquesta oscil·lació.

5. Fase i polaritat

Quan una ona sonora es repeteix periòdicament, cada cicle passa successivament per diferents estats: màxima compressió, retorn al punt d’equilibri, màxima rarefacció i nou retorn a l’equilibri. La fase descriu en quin punt d’aquest cicle es troba l’ona en un instant determinat.[1][3]

Quan dues ones tenen la mateixa freqüència però no coincideixen exactament en el temps, diem que existeix un desplaçament de fase entre elles.[1][3]

Com que un cicle complet representa una oscil·lació sencera, sovint es descriu la fase utilitzant graus angulars.[1]

  • 0° → inici del cicle
  • 90° → quart de cicle
  • 180° → mig cicle
  • 360° → final del cicle i retorn al punt inicial

Matemàticament, aquesta relació es pot entendre de manera similar a un moviment circular: un cicle complet equival a una rotació completa de 360°.[1]

Un desplaçament de fase no implica necessàriament que les ones siguin diferents, sinó que una d’elles es troba temporalment avançada o retardada respecte a l’altra.

Dues ones poden tenir la mateixa freqüència i amplitud però trobar-se desalineades temporalment. Aquest desplaçament temporal correspon a una diferència de fase.

La polaritat, en canvi, descriu la direcció positiva o negativa de l’oscil·lació respecte al punt d’equilibri del senyal.

Invertir la polaritat significa invertir verticalment l’ona: les compressions passen a correspondre a rarefaccions i viceversa.[2][3]

A diferència d’un desplaçament de fase, una inversió de polaritat no introdueix cap retard temporal. El senyal continua produint-se exactament en el mateix instant; només canvia el signe de l’oscil·lació.

Una inversió de polaritat no modifica el moment temporal en què es produeix l’ona, sinó la direcció de les variacions de pressió respecte al punt d’equilibri.

En àudio és habitual parlar informalment d’“invertir la fase”. En molts casos, però, el que realment s’està invertint és la polaritat del senyal.[2][3]

Tot i que una inversió de polaritat pot generar cancel·lacions similars a determinats desplaçaments de fase, físicament no són el mateix fenomen.

Quan dues ones interactuen entre elles, la relació de fase i polaritat pot provocar reforços, cancel·lacions parcials o cancel·lacions gairebé completes.[1][3]

En un altaveu convencional, una variació positiva del senyal elèctric acostuma a provocar un desplaçament cap endavant del diafragma, comprimint l’aire situat davant del transductor. Una variació negativa provoca el moviment contrari, generant una rarefacció.

Si dues ones iguals arriben al mateix punt amb polaritats oposades, una intentarà generar una compressió mentre l’altra generarà simultàniament una rarefacció. En aquest cas, les variacions de pressió tendeixen a compensar-se mútuament, produint una cancel·lació parcial o gairebé completa.[1][3]

Idea clau: quan diferents ones sonores coincideixen en l’espai, el que realment se suma o es cancel·la són les variacions de pressió que cadascuna genera en el medi.

Una manera molt senzilla d’experimentar aquests conceptes és provar-los directament en un DAW.

Si dupliques una mateixa pista i inverteixes la polaritat d’una de les dues còpies, les variacions de pressió de tots dos senyals tendiran a oposar-se. Si els dos senyals són idèntics i estan perfectament alineats en el temps, gran part del contingut pot cancel·lar-se gairebé completament.

En canvi, si mantens la mateixa polaritat però desplaces lleugerament una de les pistes cap endavant o cap enrere uns mil·lisegons, el que modificaràs serà la relació de fase entre els dos senyals.[2][3]

En aquest cas, no desapareixerà necessàriament tot el so, però sí que poden aparèixer reforços i cancel·lacions parcials en diferents freqüències.

6. Interferència: suma i cancel·lació

Quan diferents ones sonores coincideixen en un mateix espai, les seves variacions de pressió interactuen entre elles. Aquest fenomen s’anomena interferència.[1][3]

La manera com aquestes ones interactuen depèn de diversos factors, entre els quals destaquen la freqüència, l’amplitud, la fase, la polaritat i la relació temporal entre els senyals. Quan dues o més ones coincideixen, les seves variacions de pressió no romanen independents, sinó que se superposen i generen un nou resultat acústic.[1][3]

Quan dues ones arriben alineades i les seves variacions de pressió coincideixen en la mateixa direcció, les amplituds tendeixen a sumar-se. Aquest fenomen s’anomena interferència constructiva.[1][3]

En aquest cas, les compressions coincideixen amb compressions i les rarefaccions amb rarefaccions, de manera que les variacions de pressió resultants són més grans que les originals.

Quan dues ones coincideixen alineades en fase i polaritat, les seves variacions de pressió tendeixen a sumar-se, generant una amplitud resultant més gran.

Quan dues ones no coincideixen perfectament però tampoc es troben completament oposades, apareixen reforços i cancel·lacions parcials.[1][3]

En aquesta situació, algunes parts de les ones tendeixen a sumar-se mentre que altres tendeixen a compensar-se mútuament. El resultat és una alteració del contingut espectral i de la distribució energètica del senyal.

Aquest fenomen és especialment important en acústica i producció musical, ja que petites diferències temporals poden modificar considerablement la resposta en freqüència percebuda.[2][3]

Quan dues ones es troben parcialment desfasades, algunes freqüències tendeixen a reforçar-se mentre que altres tendeixen a cancel·lar-se parcialment.

Quan una ona intenta generar una compressió mentre l’altra genera simultàniament una rarefacció equivalent, les variacions de pressió tendeixen a compensar-se mútuament. Aquest fenomen s’anomena interferència destructiva.[1][3]

Si les dues ones són pràcticament idèntiques i arriben perfectament oposades, la cancel·lació pot arribar a ser gairebé completa.

Quan dues ones coincideixen amb variacions de pressió oposades, les seves amplituds tendeixen a compensar-se mútuament, produint una cancel·lació parcial o gairebé completa.

Quan el desplaçament temporal entre dues ones és molt petit, diferents freqüències es reforcen o es cancel·len en punts diferents de l’espectre. El resultat és una successió regular de reforços i cancel·lacions coneguda com a filtratge en pinta (comb filtering).[1][3]

Aquest fenomen és habitual en situacions com la captació amb múltiples micròfons, reflexions primerenques dins d’una sala o duplicacions temporals molt curtes entre senyals similars.[2][3]

Idea clau: la interferència no és un fenomen abstracte ni exclusivament digital. És una conseqüència física directa de la superposició de variacions de pressió en el temps i l’espai.

7. Representació del so en el temps

Quan representem un senyal d’àudio en un editor o un DAW, habitualment no veiem directament les compressions i rarefaccions físiques de l’aire. El que veiem és una representació gràfica de com varia el senyal al llarg del temps.[1][3]

Aquesta representació s’anomena forma d’ona (waveform).

Una forma d’ona és una representació temporal de les variacions del senyal. Les compressions i rarefaccions físiques del medi poden representar-se visualment com oscil·lacions positives i negatives al llarg del temps.

En una representació temporal del so:

  • l’eix horitzontal representa el temps;
  • l’eix vertical representa l’amplitud del senyal.[1][3]

Quan el senyal es troba per sobre del punt central, representa una variació positiva respecte al punt d’equilibri; quan es troba per sota, representa una variació negativa.

En un sistema acústic o electroacústic, aquestes variacions es corresponen amb canvis de pressió o amb variacions equivalents del senyal elèctric que representa aquesta pressió.[1][3]

Cada oscil·lació completa de la forma d’ona correspon a un cicle complet del senyal.

Les freqüències baixes generen menys cicles en un mateix interval temporal, mentre que les freqüències altes en generen més. De la mateixa manera, amplituds més grans produeixen oscil·lacions verticals més pronunciades.[1][3]

Idea clau: una forma d’ona no mostra directament “com sona” un àudio, sinó com varia el senyal al llarg del temps.

Tot i que la representació temporal és fonamental per entendre el comportament físic i temporal del senyal, sovint resulta insuficient per analitzar-ne el contingut freqüencial. Per aquest motiu, en producció i acústica també s’utilitzen representacions basades en l’espectre de freqüències.[1][2][3]

Per aprofundir: les formes d’ona bàsiques —sinusoïdal, quadrada, triangular o dent de serra— tenen propietats físiques i espectrals diferents. Les explorarem amb més detall a DS-01 — Ones bàsiques i formes d’ona.

8. Com representem el so en freqüència

Una forma d’ona mostra com varia el senyal al llarg del temps. En canvi, una representació espectral mostra quina energia hi ha distribuïda entre diferents freqüències.[1][2][3]

Aquesta diferència és fonamental. Una representació temporal permet observar aspectes relacionats amb la durada, la periodicitat o l’amplitud del senyal, mentre que una representació en freqüència permet analitzar-ne el contingut espectral.

En un analitzador d’espectre o en molts equalitzadors moderns, l’eix horitzontal representa les freqüències: les baixes freqüències apareixen a l’esquerra i les altes a la dreta.[2][3]

L’eix vertical acostuma a representar el nivell o l’energia relativa de cada freqüència.

Una representació espectral mostra la distribució energètica d’un senyal entre diferents freqüències. Les freqüències greus apareixen a l’esquerra i les agudes a la dreta, mentre que l’alçada indica el nivell o energia relativa de cada zona.

Aquest tipus de representació és especialment útil per identificar:

  • acumulacions de greus
  • ressonàncies
  • presència d’harmònics
  • desequilibris espectrals
  • o conflictes entre diferents elements d’una mescla

Idea clau: una forma d’ona mostra com varia un senyal en el temps; una representació espectral mostra quines freqüències formen aquest senyal.

Els espectrogrames combinen informació temporal i freqüencial en una sola representació visual.[2][3]

En un espectrograma:

  • l’eix horitzontal representa el temps
  • l’eix vertical representa la freqüència
  • i el color o la brillantor indiquen la intensitat relativa de cada component freqüencial

A diferència d’una forma d’ona, un espectrograma permet observar com evoluciona el contingut espectral d’un so al llarg del temps.

Un espectrograma combina informació temporal i freqüencial en una sola representació visual. La intensitat de cada freqüència es representa mitjançant variacions de color o brillantor.

Aquest tipus de representacions es basen en mètodes matemàtics que permeten descompondre un senyal complex en múltiples components freqüencials més simples, com les ones sinusoïdals.[1][3]

Sense entrar encara en profunditat matemàtica, aquesta idea és la base de gran part de l’anàlisi moderna d’àudio, acústica i processament digital del senyal.

Aquestes representacions són fonamentals en acústica, producció musical, restauració d’àudio i disseny sonor, ja que permeten visualitzar aspectes del senyal que sovint resulten difícils de percebre únicament amb l’oïda.[2][3]

9. Per què tot això importa en gravació, mescla i producció

Tots els conceptes que hem vist fins ara —freqüència, longitud d’ona, amplitud, fase, polaritat o representació espectral— tenen conseqüències directes en qualsevol procés de gravació, producció o mescla.[2][3]

Quan capturem o reproduïm so, no treballem amb entitats abstractes, sinó amb ones que interactuen físicament en el temps i en l’espai.

En una gravació amb múltiples micròfons, per exemple, un mateix esdeveniment sonor arriba a cada micròfon en instants lleugerament diferents. Aquestes petites diferències temporals modifiquen la relació de fase entre els senyals i poden provocar reforços, cancel·lacions parcials o filtratge en pinta (comb filtering).[2][3]

Aquest fenomen és especialment evident en:

  • bateries enregistrades amb múltiples micròfons
  • combinacions de micròfon proper i micròfon d’ambient
  • gravacions estèreo
  • o sistemes amb subgreus separats físicament dels monitors principals

Per aquest motiu, en gravació amb múltiples micròfons sovint es treballa l’alineació temporal i espacial entre senyals relacionats. La posició dels micròfons, la distància respecte a la font sonora o els petits ajustos temporals durant l’edició o la mescla poden modificar considerablement la relació de fase i, en conseqüència, el resultat tonal i espacial de la gravació.

Situacions aparentment simples, com combinar un senyal DI amb un amplificador microfonat, també poden introduir desplaçaments temporals suficients per alterar considerablement el resultat final.

La relació entre fase, temps i longitud d’ona és especialment crítica en freqüències greus, ja que les longituds d’ona llargues interactuen intensament amb les dimensions físiques de la sala.[1][3]

Per aquest motiu, petites variacions de posició poden modificar radicalment la percepció dels greus en un estudi o una sala d’escolta.

La polaritat també té implicacions pràctiques importants. Una inversió accidental de polaritat entre dos senyals relacionats pot provocar cancel·lacions importants, especialment quan els senyals comparteixen gran part del contingut espectral.

Al mateix temps, eines com els equalitzadors, els analitzadors espectrals o els espectrogrames permeten observar visualment aspectes del senyal que sovint són difícils d’identificar únicament amb l’oïda.

Una representació temporal pot revelar transitoris, periodicitat o problemes d’edició. Una representació espectral pot ajudar a detectar acumulacions freqüencials, ressonàncies o desequilibris tonals. Un espectrograma, en canvi, permet observar simultàniament l’evolució temporal i espectral del senyal.[2][3]

Idea clau: entendre el so vol dir entendre alhora el fenomen físic, els seus paràmetres bàsics i les diferents maneres de representar-lo.

Una forma d’ona, una EQ, un analitzador d’espectre o un espectrograma no són el so en si: són finestres diferents sobre el mateix fenomen.

Comprendre aquestes relacions és fonamental no només per treballar amb més precisió tècnica, sinó també per desenvolupar una intuïció auditiva més profunda sobre com interactua el so dins d’un espai, una gravació o una mescla.[2][3]

Vídeo de referència

MIT OpenCourseWare: Sound Waves

Un vídeo útil per veure el concepte de so com a ona mecànica. No cal mirar-lo com una classe sencera d'acústica; pot servir simplement per reforçar la intuïció física.

Obrir el vídeo a MIT OpenCourseWare

Referències

[1] Kinsler, L. E., Frey, A. R., Coppens, A. B., & Sanders, J. V. (2000). Fundamentals of Acoustics (4a ed.). Wiley.

[2] Howard, D. M., & Angus, J. (2017). Acoustics and Psychoacoustics (5a ed.). Routledge.

[3] Rossing, T. D., Moore, F. R., & Wheeler, P. A. (2002). The Science of Sound (3a ed.). Addison-Wesley.

Continua aprenent

Després d'aquest article

Et proposo uns quants passos propers perquè no hagis de tornar a buscar per on seguir.

Obrir la guia d'estudi