Sistemas informáticos multiusuario e en rede/Representación de son

En Galilibros, o Wikibooks en galego.
Saltar ata a navegación Saltar á procura


Introdución ao son[editar]

O son é o froito das vibracións que os obxectos producen no aire e que chegan aos nosos oídos en forma de ondas. Toda onda caracterízase por:

  • Frecuencia. É a cantidade de veces por unidade de tempo que se produce unha onda completa. No caso do son, é a diferencia entre sons agudos ou graves.
  • Amplitude. É a "altura" máxima que pode acadar unha onda. No caso do son, é o que determina o volume do mesmo.
  • Timbre. No caso dos sons, permite distinguir o emisor do son. Por exemplo, o timbre da voz de dúas persoas será (con toda probabilidade) distinto. Isto é porque os obxectos emiten moitas ondas moi similares que resultan nunha onda final que ten unha forma concreta, o timbre.

Dixitalización do son[editar]

O primeiro paso para comprender o modo en que se representa o son na informática, é comprender que este son é distinto do son "normal": o son analóxico. Así, mentres que o son analóxico está formado por un sinal continuo, o dixital, en contraposición, trátase dun "sinal discreto" (a saltos, para entendermos).

O proceso para transformar un sinal analóxico nun dixital consta dunha serie de pasos:

Mostraxe[editar]

Consiste en tomar mostras do sinal analóxico cada certo tempo ─un certo número de veces por segundo─. O resultado é o que se chama frecuencia de mostraxe.

Frecuencia de mostraxe[editar]

A frecuencia de mostraxe mídese en hertzios (Hz), que equivale á cantidade de veces por segundo que se toman as mostras. Canto maior sexa a frecuencia, maior será a calidade do son dixitalizado.

O oído humano só é capaz de percibir sons que teñan unha frecuencia no rango entre 20 Hz e 20.000 Hz. Determinouse que a frecuencia máis axeitada para dixitalizar sons e que estes sexan posteriormente escoitados polo oído humano é de 44.100 Hz (44,1 KHz). Isto é algo máis do dobre da frecuencia máxima do sinal orixinal, e ven determinado polo teorema de NyquiatWikipedia-logo-v2.svg, que di que de utilizarmos unha frecuencia de mostraxe menor ao dobre da frecuencia do sinal prodúcese unha perda da forma do sinal orixinal.

Cuantificación[editar]

Consiste en asignarlle a cada unha das mostras un nivel de son. Cantos máis estados posibles teñamos, máis se parecerá o sinal froito da mostraxe ao sinal orixinal.

Codificación[editar]

Consiste en asignarlle un código binario a cada un dos niveis de son detectados previamente. O tamaño do código binario dependerá directamente da cantidade de estados posibles que se elixisen na fase de cuantificación.

Canles[editar]

As canles de son a cantidade de fluxos de son que comporán finalmente o ficheiro de son. Existen diversas opcións:

  • Mono. Utilízase unha única canle.
  • Estéreo. Utilízanse dúas canles para almacenar o son.
  • Poden utilizarse máis canles:
    • 2.1. Utilízase unha canle para cada altofalante regular (esquerdo e dereito) e unha terceira canle para o altofalante subwoofer (para os sons máis graves).
    • 3.1. Coma o 2.1 pero cun altofalante central adicional.
    • 5.1. Coma o 3.1, pero con dous altofalantes posteriores (esquerdo e dereito) para conseguir o chamado "efecto envolvente".
    • 6.2. Coma o 5.1, pero cun altofalante central posterior e un altofalante subwoofer adicional.

Formatos de son[editar]

Formatos de son sen compresión[editar]

O CD-AUDIO é un formato de ficheiros de son de alta calidade. Utiliza unha frecuencia de mostraxe de 44100 Hz, 16 bits para codificar cada mostra, e en formato estéreo (dúas canles). Isto significa que cada minuto neste formato ocupa 10 MB.

O formato WAV (do inglés Waveform Audio Format, "formato de son en forma de onda") é un formato propiedade de Microsoft e de IBM. Se ben pode utilizar códecs, xeralmente utilízase sen compresión. O tamaño dos ficheiros neste formato está limitado a 4 GiB.

Formatos de son con compresión[editar]

O WMA (do inglés Windows Media Audio, "son do Windows Media") é un formato de compresión de son propiedade de Microsoft.

O MP3 (MPEG-1 Audio Layer 3) é un formato patentado de transmisión e compresión de son. Utiliza un método de lonxitude variable para codificar o ficheiro de son que consiste en asignar combinacións curtas aos estados máis frecuentes, e as combinacións máis longas para os menos frecuentes.

OGG Vorbis é un formato libre de son orientado a transmisións que aplica un códec ao ficheiro orixinal.

Dolby Digital AC3 é un formato de son que comprime a información do son orixinal baseándose en eliminar as partes do son que o oído non é capaz de percibir, por exemplo mediante "enmascaramento" ─técnica que consiste en eliminar o ruído producido entre sons de frecuencias similares─. Utiliza 5.1 canles.

Formatos de son descritivo[editar]

O formato de son descritivo MIDI (Musical Instrument Digital Interface, "interface dixital para instrumentos musicais") xorde coa aparición dos sintetizadores dixitais[1]. Trátase dunha especie de linguaxe musical que permite estandarizar as notas producidas polos distintos instrumentos musicais. Non almacena o son mediante mostraxe, cuantificación e codificación, senón que se codifican os instrumentos, as notas musicais e mailas súas características.

O dispositivo que vai reproducir os ficheiros MIDI (extensión .mid) pode dispoñer do son dos instrumentos reais ou xeralos a parires dun sintetizador. Mediante programas específicos pódense editar os parámetros e realizar cambios no ficheiro de son.

Ocupan moito menos espazo que os ficheiros de son "real".

Algúns conceptos[editar]

  • Transmisión (streaming). É unha técnica que permite escoitar ou visualizar un ficheiro a través dunha rede sen necesidade de descargalo enteiro previamente. Para evitar cortes na reprodución, vaise cargando previamente un búfer.
  • Códec (codificador decodificador). É unha técnica de compresión mediante software que codifica e posteriormente decodifica un sinal de son ou vídeo mediante unhas bibliotecas de rutinas e datos.
  • Densidade de bits. É a cantidade de bits por segundo que se utilizarán para almacenar a información nun ficheiro de son. Mídese en quilobits por segundo (kbps). Pódese utilizar coma unha media para realizar a compresión. A densidade pode ser constante (CBR) cando esta é igual ao longo de todo o ficheiro de son, ou variable (VBR) cando cambia nalgunhas partes en función da súa complexidade.
  • Enmascaramento. É unha técnica que permite eliminar sinais de baixa potencia que teñan frecuencias similares a outros de maior potencia.

Notas[editar]

  1. Un sintetizador dixital é un dispositivo dixital que xera sons.