Visita Encydia-Wikilingue.cómo

Mp3

mp3 - Wikilingue - Encydia

MPEG-1 Audio Layer 3
Extensión del fichero .mp3
MIME audio/mpeg
Tipo de formato: Audio
Estándar ISO/IEC 11172-3, ISO/IEC 13818-3

MPEG-1 Audio Layer III o Mp3 es un formato de audio digital basado en la compresión con pérdidas, desarrollado por el grupo de expertos Media Picture Group (MPEG) y descrito por una norma ISO.

MPEG-1 Audio o Parte 3 está diseñado para el almacenamiento y distrubució de audio en tiempo real. Mp3 es uno de los niveles de compresión de este estándar, concretamente el nivel o capa 3. Este nivel es el que tiene más complejidad y puede conseguir un bitrate de unos 192 kbps, por este motivo su uso más frecuente es la transmisión por XDSI y redes TCP/IP.

El objetivo del algoritmo de compresión de este formato es poder comprimir cualquier señal que esté destinado a ser escuchado y explotar al máximo las limitaciones del Sistema Auditivo Humano o SAH .

Mesa de contenidos

Codificador

Las técnicas empleadas en la codificación MPEG son:

Los bloques del codificador son:

Banco de Filtros

Mp3 utiliza 32 banco de filtros híbridos colocados en cascada. Este filtros son polifásicos, es decir, con un retraso bajo e incorporan una transformada Transformada de Discreta de Coseno Modificada con un número máximo de puntos de 576. Debido a la aplicación de la MDCT es puede eliminar información redundante.

Transformación en frecuencia

La transformada utilizada en la codificación es la Transformada de Discreta de Coseno Modificada (MDCT). Esta transformación incorpora un enfinestrament para evitar pre-ecos produits por un número de muestras de la transformada elevado en las zonas de silencio-percusión. Este enfinestrament se realiza mitjantçant cuatro tipos de ventanas según sea la señal:

Para pasar de ventana normal o larga a ventana corta siempre se tiene que pasar por las ventanas de transición.

Enmascaramiento temporal y frecuencial

Debido a las limitaciones del SAH se puede definir un modelo psicoacústic. Este modelo parte de descomponer la señal como lasbandas críticas del oído humano. Para poder eliminar información por enmascaramiento se utiliza una transformada de Fourier (FFT) de 576 puntos.

En este bloque se define el umbral para saber qué tonos se consideran enmascarados, y por lo tanto no audibles, y así utilizar este información para hacer la quantificatzió. Esta señal enmascarada puede ser debut a señales de bajo nivel, ruido de cuantificación, distorsión de solapament o errores de transmisión.

Enmascaramiento frecuencial

Un sonido puede ser enmascarado debido a que dentro de la misma banda crítica haya otro sonido con un nivel más elevado. Existan cuatro tipos de fenómenos en que se produce este enmascaramiento:

Enmascaramiento temporal

El SAH tiene memoria auditiva por este motivo aparece el fenòmen de enmascaramiento temporal. Este fenòmen aparece cuánto dos tonos aparecen distanciados por un intervalo de tiempo muy pequeño y uno de los tonos tiene un nivel mucho más elevado que el otro. El enmascaramiento anterior es más breve que el posterior.

Escalabilitat y Cuantificación

Los umbrales de enmascaramiento son utilizados para determinar qué asignación de bits corresponde a cada banda crítica. El codificador el que busca se encontrar un asignación de bits el más constando posible.

Codificación de Huffmann

Los bits cuantificados son codificados con Huffman y almacenadas a la cadena de bits con sus factores de escalera y su información lateral. Esta información lateral incorpora los parámetros que necesita el descodificador como pueden ser la mesa de Huffman, la conmutación de ventanas y el control de ganancia.

Descodificador

El descodificador tiene que recuperar una señal sintetizada de la señal de audio PCM de entrada al codificador.

El suyos bloques son:

Estructura Mp3

Los cuadros Mp3 son de 1152 muestras más el campo de ID3. Estas muestras están compuestas por los siguientes campos:

Camp Medida Descripción
Metadatos - ID3v2
Cabecera 32 muestras Cabecera Mp3
CRC 0 - 16 muestras Control de errores
Información Lateral 136 – 256 muestras Información lateral para realizar la descodificación
Datos - Información de audio
Metadatos 128 bytes ID3v1


Las 32 muestras de la cabecera se descomponen:

Camp Valor
Palabra de sincronización 111111111111
ID 1 (MPEG)
Capa 01 (Capa 3)
Protección de errores 1 (No)
Index de tasa de bits -
Frecuencia 00 (44100 Hz)
Padding Bit 0 (No)
Bit privado -
Frecuencia 00 (44100 Hz)
Modo -
Extensión de Modo -
Copia 0 (No derechos de autor)
Original/Copia 0 (Copia)
Enfàsis 00 (Sin enfàsis)

Tasa de bits

Mp3 permite las siguientes tasa de bits:

Las frecuencias disponibles son:

Se puede considerar que a partir de una tasa de bits de 128 kbps obtenemos una calidad parecida a la del CD con un factor de compresión de 11:1.

Ved también

Enlaces externos

Your Ad Here