Sistemas informáticos multiusuario e en rede/Representación de son

En Galilibros, o Wikibooks en galego.


Introdución ao son[editar]

O son é o froito das vibracións que os obxectos producen no aire e que chegan aos nosos oídos en forma de ondas. Toda onda caracterízase por:

  • Frecuencia. É a cantidade de veces por unidade de tempo que se produce unha onda completa. No caso do son, é a diferencia entre sons agudos ou graves.
  • Amplitude. É a "altura" máxima que pode acadar unha onda. No caso do son, é o que determina o volume do mesmo.
  • Timbre. No caso dos sons, permite distinguir o emisor do son. Por exemplo, o timbre da voz de dúas persoas será (con toda probabilidade) distinto. Isto é porque os obxectos emiten moitas ondas moi similares que resultan nunha onda final que ten unha forma concreta, o timbre.

Dixitalización do son[editar]

O primeiro paso para comprender o modo en que se representa o son na informática, é comprender que este son é distinto do son "normal": o son analóxico. Así, mentres que o son analóxico está formado por un sinal continuo, o dixital, en contraposición, trátase dun "sinal discreto" (a saltos, para entendermos).

O proceso para transformar un sinal analóxico nun dixital consta dunha serie de pasos:

Mostraxe[editar]

Consiste en tomar mostras do sinal analóxico cada certo tempo ─un certo número de veces por segundo─. O resultado é o que se chama frecuencia de mostraxe.

Frecuencia de mostraxe[editar]

A frecuencia de mostraxe mídese en hertzios (Hz), que equivale á cantidade de veces por segundo que se toman as mostras. Canto maior sexa a frecuencia, maior será a calidade do son dixitalizado.

O oído humano só é capaz de percibir sons que teñan unha frecuencia no rango entre 20 Hz e 20.000 Hz. Determinouse que a frecuencia máis axeitada para dixitalizar sons e que estes sexan posteriormente escoitados polo oído humano é de 44.100 Hz (44,1 KHz). Isto é algo máis do dobre da frecuencia máxima do sinal orixinal, e ven determinado polo teorema de Nyquiat, que di que de utilizarmos unha frecuencia de mostraxe menor ao dobre da frecuencia do sinal prodúcese unha perda da forma do sinal orixinal.

Cuantificación[editar]

Consiste en asignarlle a cada unha das mostras un nivel de son. Cantos máis estados posibles teñamos, máis se parecerá o sinal froito da mostraxe ao sinal orixinal.

Codificación[editar]

Consiste en asignarlle un código binario a cada un dos niveis de son detectados previamente. O tamaño do código binario dependerá directamente da cantidade de estados posibles que se elixisen na fase de cuantificación.

Canles[editar]

As canles de son a cantidade de fluxos de son que comporán finalmente o ficheiro de son. Existen diversas opcións:

  • Mono. Utilízase unha única canle.
  • Estéreo. Utilízanse dúas canles para almacenar o son.
  • Poden utilizarse máis canles:
    • 2.1. Utilízase unha canle para cada altofalante regular (esquerdo e dereito) e unha terceira canle para o altofalante subwoofer (para os sons máis graves).
    • 3.1. Coma o 2.1 pero cun altofalante central adicional.
    • 5.1. Coma o 3.1, pero con dous altofalantes posteriores (esquerdo e dereito) para conseguir o chamado "efecto envolvente".
    • 6.2. Coma o 5.1, pero cun altofalante central posterior e un altofalante subwoofer adicional.

Formatos de son[editar]

Formatos de son sen compresión[editar]

O CD-AUDIO é un formato de ficheiros de son de alta calidade. Utiliza unha frecuencia de mostraxe de 44100 Hz, 16 bits para codificar cada mostra, e en formato estéreo (dúas canles). Isto significa que cada minuto neste formato ocupa 10 MB.

O formato WAV (do inglés Waveform Audio Format, "formato de son en forma de onda") é un formato propiedade de Microsoft e de IBM. Se ben pode utilizar códecs, xeralmente utilízase sen compresión. O tamaño dos ficheiros neste formato está limitado a 4 GiB.

Formatos de son con compresión[editar]

O WMA (do inglés Windows Media Audio, "son do Windows Media") é un formato de compresión de son propiedade de Microsoft.

O MP3 (MPEG-1 Audio Layer 3) é un formato patentado de transmisión e compresión de son. Utiliza un método de lonxitude variable para codificar o ficheiro de son que consiste en asignar combinacións curtas aos estados máis frecuentes, e as combinacións máis longas para os menos frecuentes.

OGG Vorbis é un formato libre de son orientado a transmisións que aplica un códec ao ficheiro orixinal.

Dolby Digital AC3 é un formato de son que comprime a información do son orixinal baseándose en eliminar as partes do son que o oído non é capaz de percibir, por exemplo mediante "enmascaramento" ─técnica que consiste en eliminar o ruído producido entre sons de frecuencias similares─. Utiliza 5.1 canles.

Formatos de son descritivo[editar]

O formato de son descritivo MIDI (Musical Instrument Digital Interface, "interface dixital para instrumentos musicais") xorde coa aparición dos sintetizadores dixitais[1]. Trátase dunha especie de linguaxe musical que permite estandarizar as notas producidas polos distintos instrumentos musicais. Non almacena o son mediante mostraxe, cuantificación e codificación, senón que se codifican os instrumentos, as notas musicais e mailas súas características.

O dispositivo que vai reproducir os ficheiros MIDI (extensión .mid) pode dispoñer do son dos instrumentos reais ou xeralos a parires dun sintetizador. Mediante programas específicos pódense editar os parámetros e realizar cambios no ficheiro de son.

Ocupan moito menos espazo que os ficheiros de son "real".

Algúns conceptos[editar]

  • Transmisión (streaming). É unha técnica que permite escoitar ou visualizar un ficheiro a través dunha rede sen necesidade de descargalo enteiro previamente. Para evitar cortes na reprodución, vaise cargando previamente un búfer.
  • Códec (codificador decodificador). É unha técnica de compresión mediante software que codifica e posteriormente decodifica un sinal de son ou vídeo mediante unhas bibliotecas de rutinas e datos.
  • Densidade de bits. É a cantidade de bits por segundo que se utilizarán para almacenar a información nun ficheiro de son. Mídese en quilobits por segundo (kbps). Pódese utilizar coma unha media para realizar a compresión. A densidade pode ser constante (CBR) cando esta é igual ao longo de todo o ficheiro de son, ou variable (VBR) cando cambia nalgunhas partes en función da súa complexidade.
  • Enmascaramento. É unha técnica que permite eliminar sinais de baixa potencia que teñan frecuencias similares a outros de maior potencia.

Notas[editar]

  1. Un sintetizador dixital é un dispositivo dixital que xera sons.