| Extensión del fichero | .mp3 |
|---|---|
| MIME | audio/mpeg |
| Tipo de formato: | Audio |
| Estándar | ISO/IEC 11172-3, ISO/IEC 13818-3 |
MPEG-1 Audio Layer III o Mp3 es un formato de audio digital basado en la compresión con pérdidas, desarrollado por el grupo de expertos Media Picture Group (MPEG) y descrito por una norma ISO.
MPEG-1 Audio o Parte 3 está diseñado para el almacenamiento y distrubució de audio en tiempo real. Mp3 es uno de los niveles de compresión de este estándar, concretamente el nivel o capa 3. Este nivel es el que tiene más complejidad y puede conseguir un bitrate de unos 192 kbps, por este motivo su uso más frecuente es la transmisión por XDSI y redes TCP/IP.
El objetivo del algoritmo de compresión de este formato es poder comprimir cualquier señal que esté destinado a ser escuchado y explotar al máximo las limitaciones del Sistema Auditivo Humano o SAH .
Mesa de contenidos |
Las técnicas empleadas en la codificación MPEG son:
Los bloques del codificador son:
Mp3 utiliza 32 banco de filtros híbridos colocados en cascada. Este filtros son polifásicos, es decir, con un retraso bajo e incorporan una transformada Transformada de Discreta de Coseno Modificada con un número máximo de puntos de 576. Debido a la aplicación de la MDCT es puede eliminar información redundante.
La transformada utilizada en la codificación es la Transformada de Discreta de Coseno Modificada (MDCT). Esta transformación incorpora un enfinestrament para evitar pre-ecos produits por un número de muestras de la transformada elevado en las zonas de silencio-percusión. Este enfinestrament se realiza mitjantçant cuatro tipos de ventanas según sea la señal:
Para pasar de ventana normal o larga a ventana corta siempre se tiene que pasar por las ventanas de transición.
Debido a las limitaciones del SAH se puede definir un modelo psicoacústic. Este modelo parte de descomponer la señal como lasbandas críticas del oído humano. Para poder eliminar información por enmascaramiento se utiliza una transformada de Fourier (FFT) de 576 puntos.
En este bloque se define el umbral para saber qué tonos se consideran enmascarados, y por lo tanto no audibles, y así utilizar este información para hacer la quantificatzió. Esta señal enmascarada puede ser debut a señales de bajo nivel, ruido de cuantificación, distorsión de solapament o errores de transmisión.
Un sonido puede ser enmascarado debido a que dentro de la misma banda crítica haya otro sonido con un nivel más elevado. Existan cuatro tipos de fenómenos en que se produce este enmascaramiento:
El SAH tiene memoria auditiva por este motivo aparece el fenòmen de enmascaramiento temporal. Este fenòmen aparece cuánto dos tonos aparecen distanciados por un intervalo de tiempo muy pequeño y uno de los tonos tiene un nivel mucho más elevado que el otro. El enmascaramiento anterior es más breve que el posterior.
Los umbrales de enmascaramiento son utilizados para determinar qué asignación de bits corresponde a cada banda crítica. El codificador el que busca se encontrar un asignación de bits el más constando posible.
Los bits cuantificados son codificados con Huffman y almacenadas a la cadena de bits con sus factores de escalera y su información lateral. Esta información lateral incorpora los parámetros que necesita el descodificador como pueden ser la mesa de Huffman, la conmutación de ventanas y el control de ganancia.
El descodificador tiene que recuperar una señal sintetizada de la señal de audio PCM de entrada al codificador.
El suyos bloques son:
Los cuadros Mp3 son de 1152 muestras más el campo de ID3. Estas muestras están compuestas por los siguientes campos:
| Camp | Medida | Descripción |
| Metadatos | - | ID3v2 |
| Cabecera | 32 muestras | Cabecera Mp3 |
| CRC | 0 - 16 muestras | Control de errores |
| Información Lateral | 136 – 256 muestras | Información lateral para realizar la descodificación |
| Datos | - | Información de audio |
| Metadatos | 128 bytes | ID3v1 |
Las 32 muestras de la cabecera se descomponen:
| Camp | Valor |
| Palabra de sincronización | 111111111111 |
| ID | 1 (MPEG) |
| Capa | 01 (Capa 3) |
| Protección de errores | 1 (No) |
| Index de tasa de bits | - |
| Frecuencia | 00 (44100 Hz) |
| Padding Bit | 0 (No) |
| Bit privado | - |
| Frecuencia | 00 (44100 Hz) |
| Modo | - |
| Extensión de Modo | - |
| Copia | 0 (No derechos de autor) |
| Original/Copia | 0 (Copia) |
| Enfàsis | 00 (Sin enfàsis) |
Mp3 permite las siguientes tasa de bits:
Las frecuencias disponibles son:
Se puede considerar que a partir de una tasa de bits de 128 kbps obtenemos una calidad parecida a la del CD con un factor de compresión de 11:1.
| |||||||||||||||||||||||||||||||||||||||||||