MPEG 2
MPEG-2 para DVB [MPEG-2 "Flujo de Transporte"]
En el conjunto de estándares de TV digital denominado DVB (Digital Video Broadcasting) se especifican los fundamentos de los sistemas para diferentes medios de transmisión: satélite, cable, difusión terrestre, etc. Cada estándar define los esquemas de codificación de canal y de modulación para el medio de transmisión de que se trate, pero en todos los casos la codificación de fuente es una adaptación del estándar MPEG-2.
Más concretamente, la señal de entrada y salida especificada para todos los sistemas es la denominada “MPEG-2 Transport Stream” (TS) o “Flujo de transporte MPEG-2". La generación de esta cadena de datos se puede dividir en dos capas, la de sistema y la de compresión.
En la “Capa de Compresión” se realizan las operaciones propiamente dichas de codificación MPEG, recurriendo a los procedimientos generales de compresión de datos, y aprovechando además, para las imágenes, su redundancia espacial (áreas uniformes) y temporal (imágenes sucesivas) , la correlación entre puntos cercanos y la menor sensibilidad del ojo a los detalles finos de las imágenes fijas.
En cuanto al audio, se utilizan modelos psicoacústicos del oído humano, que tienen en cuenta la curva de sensibilidad en frecuencia (máxima entre 1 y 5 kHz), los efectos de enmascaramiento frecuencial (señales simultáneas a diferentes frecuencias) y enmascaramiento temporal (un sonido de elevada amplitud enmascara sonidos más débiles anteriores o posteriores), para reducir la cantidad de datos que hay que transmitir, sin deteriorar de forma perceptible la calidad de la señal de audio.
En la “Capa de Sistema” se realizan las operaciones que conducen a la obtención de los flujos de señal MPEG-2, consistentes en la organización en “paquetes” de los datos comprimidos y el posterior multiplexado de todas las señales asociadas al programa (vídeo, audio, datos, etc). Además de la posibilidad de multiplexado de varios programas audiovisuales, se añaden en el múltiplex diversas informaciones relativas al servicio: Tabla de Asociación de Programas (PAT), Información para Acceso Condicional (CAT), Mapa de cada Programa (PMT), Tabla de datos de la red (NIT), etc.
Características básicas de MPEG-2 TS:
Conviene resaltar dos características notables de los múltiplex MPEG-2:
- No existen protecciones contra errores dentro del múltiplex. Las citadas protecciones y la subsiguiente modulación de los flujos MPEG son objeto de bloques de procesado posteriores, que son función del medio de transmisión elegido.
- No hay especificación física o eléctrica para los múltiplex MPEG. El diseñador puede elegir los niveles de señal y tipo de conector que mejor se adapte a su aplicación.
Compresión
Moving Pictures Experts Group Layer 2 (MPEG-2) es uno de los formatos de compresión más utilizados gracias a sus códecs (codificadores-descodificadores) de bajas pérdidas.
La compresión se basa en la comparación tanto espacial (si un punto de la imagen es idéntico al de al lado, basta con enviar cuántos puntos hay iguales y dónde están) como temporal (si un frame es muy similar al siguiente, basta con enviar la diferencia entre el actual y el anterior). Así, para el segundo sistema de compresión el contenido de imagen se predice, antes de la codificación, a partir de imágenes reconstruidas pasadas y se codifican solamente las diferencias con estas imágenes reconstruidas y algún extra necesario para llevar a cabo la predicción. Respecto al primer paso de compresión, las muestras tomadas de imagen y sonido son divididas en celdas de 16x16 y transformadas en espacio-frecuencia y cuantificadas.
MPEG-2 realiza la codificación genérica de imágenes en movimiento y el audio asociado enviado directamente sin compresión desde el centro de producción en “unidades de presentación” que son sustituidas por “unidades de acceso”, que en el caso de la señal de vídeo se dividen en tres: cuadros intra (I), cuadros posteriores predecibles (P) y cuadros predecibles bidireccionales (B), arreglados en un orden específico llamado “La estructura GOP” (GOP = Group Of Pictures o grupo de imágenes). GOP es la mínima cadena MPEG completamente decodificable por sí sola. Por tanto debe tener una frame I y sus referenciadas P o B. Los cuadros I serán los que contengan la información completa del frame (aunque comprimida espacialmente) mientras que el resto se crearán en el proceso de codificación.
El resultado de la codificación MPEG de una secuencia de vídeo, es una sucesión de “Unidades de Acceso de Vídeo y/o Audio”, que serán “empaquetados” para su futura multiplexación con las diferentes señales provenientes de cada uno de los centros audiovisuales.
La tasa de bit de salida de un codificador MPEG-2 puede ser constante (CBR) o variable (VBR), con un máximo determinado por el sistema en el que vaya a ser utilizado – por ejemplo, el máximo posible en un DVD de película es de 10.4 Mbit/s. Para lograr una tasa de bits constante el grado de cuantificación es alterado para lograr la tasa de bits requerida.
Unidades de Presentación codificación Mpeg-2
Unidades de presentación de Video
En cuanto a la señal de vídeo digitalizada sin comprimir, se emplea el formato 4:2:2 con cuantificación de 8 bits recogido en CCIR Rec. 601-1, cuya “Unidad de Presentación” es una “Imagen o Cuadro” (830 kbytes para sistemas de 625 líneas).
De acuerdo con este estándar, se digitalizan las señales Y (luminancia), CR y CB (obtenidas a partir de las señales diferencia de color), utilizando las siguientes frecuencias de muestreo:
- Señal Y: 13,5MHz
- Señales CR y CB: 6,75 MHz
En estas condiciones, el flujo bruto resultante, para la citada cuantificación de 8 bits resulta ser:
- 13,5 x 8 + 2 x (6,75 x 8) = 216 Mbps
A cada línea completa, cuya duración es de 64 μs en un sistema de 625 líneas, le corresponderá el siguiente número de muestras:
- Señal Y: 13,5 x 106 x 64 x 10-6 = 864 muestras/línea completa
- Señales CR y CB: 6,75 x 106 x 64 x 10-6 = 432 muestras/línea completa
Sin embargo, el cálculo anterior incluye los sincronismos en la duración de la línea. Si se eliminase la digitalización de los intervalos de supresión, cuya duración es de 12 μs quedarían 52 μs útiles, con lo que resultaría:
- Señal Y: 864 x 52 /64 = 702 muestras vídeo/línea
En realidad se emplean, por línea activa digital:
- Señal Y: 720 muestras/línea activa digital
- Señales CR y CB: 360 muestras/línea activa digital
Con todo ello, considerando que del total de 625 líneas, solamente 576 son útiles, el flujo neto resultante para la señal digitalizada en formato 4:2:2 con cuantificación de 8 bits es:
- 216 Mbps x (720 / 864) x (576 / 625) = 165,888 =166 Mbps
- bruto x muestras x líneas = flujo neto
En esta situación, teniendo en cuenta que se transmiten 25 imágenes por segundo y que hay 8 bits por cada byte, resultará para cada “Imagen o Cuadro”: 166 Mbps / (25 x 8) = 830 kbytes / cuadro
Unidades de presentación de Audio
En cuanto al audio, la “Unidad de Presentación” es una “Trama de Audio AES/EBU”. En este caso, se requieren de 16 a 24 bits por muestra para proveer el rango dinámico y la relación señal/ruido deseados.
El formato de los datos de audio sin comprimir puede verse en la figura para una cuantificación de 20 bits. Consiste en secuencias de bloques de 192 tramas, cada una de las cuales está compuesta por dos subtramas correspondientes a los dos canales de audio estéreo.
A su vez, cada subtrama contiene los 20 bits de datos correspondientes a las muestras, precedidos por otros 4 bits de datos auxiliares, que pueden emplearse para extender la cuantificación a 24 bits. La subtrama comienza con un preámbulo de 4 bits que indica a qué canal pertenece la muestra y termina con 4 bits que aportan información sobre el canal incluyendo un bit de paridad. En total, cada subtrama tiene 32 bits.
El preámbulo de cada subtrama puede ser de tipo X, Y ó Z. Se emplea el tipo Z para indicar el comienzo de cada bloque de 192 tramas y después alternativamente los tipos X e Y para identificar las subtramas de los dos canales de audio: X para el canal 1 e Y para el canal 2.
Unidades de acceso codificación Mpeg-2
Para la compresión, la imagen de video es separada en dos partes: luminancia (Y) y crominancia (U y V) y tanto la compresión espacial como temporal se realizarán sobre cada parte. A su vez éstos son divididos en “macro-bloques” los cuales son la unidad básica dentro de una imagen. Cada macro-bloque es dividido en cuatro bloques de luminancia (divididos a su vez en bloques de 8x8 píxeles). El número de bloques de croma dentro de un macro-bloque depende del formato de color de la fuente. Por ejemplo en el formato común 4:2:0 hay un bloque de croma por macro-bloque para el canal U y otro para el canal V haciendo un total de seis señales por macro-bloque.
La codificación consiste en lo siguiente: los cuadros I (intra-codificado) son tratados de forma que los cuadros P y B primero son sujetos a un proceso de “compensación de movimiento”, en el cual son correlacionados con la imagen previa (y en el caso de el cuadro B, la siguiente). Cada macro-bloque en la imagen P o B es entonces asociado con un área en el frame previo o siguiente que esté bien correlacionado con alguno de éstos (anterior o posterior). Se crea así un "vector de movimiento" que mapea el macro-bloque con su área correlacionada, es codificado y entonces la diferencia ente las dos áreas es pasada a través del proceso de codificación. Cada bloque es procesado con una transformada coseno discreta (DCT) 8x8 . El coeficiente DCT resultante es entonces cuantificado de acuerdo a un esquema predefinido, reordenado a una máxima probabilidad de una larga hilera de ceros, y codificado. Finalmente, se aplica un algoritmo de codificación Huffman de tabla fija.
En el caso de la señal de vídeo, las “Unidades de Acceso” comprimidas, como hemos comprobado, son de 3 tipos, correspondiendo a otros tantos tipos de imágenes MPEG:
- Imágenes tipo I (Intra): Se codifican sin ninguna referencia a otras imágenes, es decir: contienen todos los elementos necesarios para su reconstrucción. Tamaño: 100 kbytes(*)
- Imágenes tipo P (Previstas): Se codifican con respecto a la imagen de tipo I o de otra P anterior, gracias a las técnicas de predicción con compensación de movimiento. Su tasa de compresión es claramente mayor que la de las imágenes I: Tamaño 33 kbytes (*).
- Imágenes tipo B (Bidireccionales): Se codifican por interpolación entre las dos imágenes de tipo I o P precedente y siguiente que las enmarcan. Ofrecen la tasa de compresión más alta: Tamaño 12 kbytes (*).
(*) El tamaño real depende del objetivo de velocidad binaria buscado y de la complejidad de la imagen. Los valores citados corresponden a un flujo comprimido de 5 Mbps.
Hay muchas estructuras posibles pero una común es la de 15 marcos de largo, y tiene la secuencia I_BB_P_BB_P_BB_P_BB_P_BB_. La relación de cuadros I, P y B en “la estructura GOP” es determinado por la naturaleza del flujo de video y el ancho de banda que constriñe el flujo. Además el tiempo de codificación puede ser un asunto importante. Esto es particularmente cierto en las transmisiones en directo. Un flujo que contenga varios cuadros B puede tardar tres veces más tiempo para codificar que un archivo que sólo contenga cuadros I (sin codificación temporal).
En el caso de la señal de audio, las “Unidades de Acceso” típicamente contienen unas pocas decenas de milisegundos de audio comprimido.
Sistema o multiplexado
Empaquetado P.E.S.
Ya en la “Capa de Sistema” se encuentran los “Empaquetadores P.E.S.”, que constituyen el siguiente paso en la generación tanto del múltiplex de programa como del múltiplex de transporte MPEG-2.
Se trata de convertir cada “Elementary Stream (E.S.)” compuesto exclusivamente por “Access Units”, en un “Packetised Elementary Stream (P.E.S.)”. Un P.E.S. está compuesto íntegramente por “PES-Packets”, como se muestra en la figura:
Un “PES-Packet” se compone de una “Cabecera” o “Header” y de una “Carga Util” o “Payload”. El “Payload” consiste simplemente en bytes de datos tomados secuencialmente desde el “Elementary Stream (E.S.)” original. No hay ningún requerimiento para alinear el comienzo de una “Access Unit” y el comienzo de un “PES-Packet Payload”. Así, una nueva “Access Unit” puede comenzar en cualquier punto del “Payload” de un “PES - Packet”, y también es posible que varias pequeñas “Access Unit” estén contenidas en un simple “PES -Packet”.
Esta flexibilidad en la longitud de los paquetes PES puede ser explotada por los diseñadores de diferentes maneras: pueden usarse paquetes de longitud fija si interesa, o por ejemplo pueden ser de longitud variable de forma que siempre coincida el inicio de una unidad de acceso con el comienzo de la carga útil de cada paquete PES.
MPEG-2 Transport Stream o Flujo de transporte
El múltiplex tipo “Transport Stream” está compuesto íntegramente por “paquetes de transporte” o “transport packets” que tienen siempre una longitud fija de 188 bytes. Cada “paquete de transporte” incluye una “Cabecera” o “Header” (4bytes) seguida a veces de un “Campo de Adaptación” o “Adaptation Field” (usado eventualmente para rellenar el exceso de espacio disponible) y en cualquier caso, de una “Carga Útil” o “Payload”.
Los paquetes de transporte se forman a partir de los “PES-Packets” correspondientes a cada “Flujo Elemental” de señal (vídeo, audio, datos, etc.), según se muestra en la figura:
El proceso de formación de los paquetes de transporte está sujeto al cumplimiento de las dos condiciones fundamentales siguientes:
- El primer byte de cada PES-Packet debe ser el primer byte del “payload” de un transport packet.
- Un transport packet solamente puede contener datos tomados de un PES-Packet.
Los paquetes de transporte resultantes del proceso anterior, aplicado a cada uno de los flujos elementales de señal (vídeo, audio, datos, etc.) pertenecientes a su vez a varios programas audiovisuales, se disponen secuencialmente para configurar el “Flujo de Transporte MPEG-2" o “MPEG-2 Transport Stream” (TS).
No existen condiciones en cuanto al orden en que los paquetes de transporte deben aparecer en el múltiplex tipo TS; tan sólo debe respetarse el orden cronológico de los paquetes de transporte pertenecientes a un mismo flujo elemental.
Es importante destacar que en el TS, además de los paquetes de transporte asociados a los flujos elementales de señal, es necesario incorporar paquetes de transporte que contienen información sobre el servicio, así como paquetes de transporte “nulos” que se emplean para absorber eventuales reservas de capacidad del múltiplex.
La siguiente figura ilustra de forma simplificada el proceso de conformación del múltiplex “MPEG-2 Transport Stream”:
Información Específica de los Programas (PSI)
El Múltiplex MPEG-2 Transport Stream puede contener varios programas audiovisuales, cada uno de los cuales está compuesto por uno o varios flujos elementales PES distribuidos en “transport packets”. Estos paquetes a su vez están marcados con un PID que identifica a qué flujo elemental pertenecen.
Sin embargo, para que el decodificador pueda recuperar completamente un programa a través de los valores de los PID de los paquetes correspondientes, es necesario incluir información adicional dentro del flujo de transporte que relacione estos PID con los programas a que pertenecen. Tal información se denomina “Información Específica de los Programas” o “Program Specific Information” (PSI).
Esta “Información Específica de los Programas (PSI)”, definida por MPEG-2 para la Capa de Sistema (ISO/IEC 13818-1), comprende la inclusión dentro del flujo de transporte, de 4 tipos de tablas:
La “Información del Servicio” o “Service Information” (SI), en sistemas DVB (ETS 300 468) incluye, además, otros 4 tipos de tablas de inserción obligatoria dentro del Transport Stream y 3 tipos de tablas opcionales:
Obligatorias:
- Network Information Table (NIT)
- Service Description Table (SDT)
- Event Information Table (EIT)
- Time & Date Table (TDT)
Opcionales:
- Bouquet Association Table (BAT)
- Running Status Table (RST)
- Time Offset Table (TOT)
- Stuffing Tables (ST)
Cada tabla está constituida, según su importancia, por una o varias secciones (256 como máximo, con una longitud máxima de 1.024 bytes excepto para tablas tipo “Private” y “EIT” que pueden alcanzar los 4.096 bytes). Dichas secciones están distribuidas a lo largo de una serie de paquetes de transporte identificados con un PID común.
Standard MPEG-2
A continuación veremos los distintos estándares MPEG-2, teniendo en cuenta que MPEG solamente normaliza el formato del flujo binario y el descodificador:
ISO/IEC 13818-1 (2007) Sistema - describe sincronización y multiplexado de video y audio.
ISO/IEC 13818-2 (2000) Video – Códec (codificador/decodificador) compresor para señales de video entrelazado y no entrelazado.
ISO/IEC 13818-3 (1998) Audio – Códec (codificador/decodificador) compresor de señales de audio. Una extensión habilitada multicanal de MPEG-1 audio (MP3).
ISO/IEC 13818-4(2004) Describe maniobras de prueba de cumplimiento (del estándar).
ISO/IEC 13818-5 (2005) Describe sistemas para simulación por Software.
ISO/IEC 13818-6 (1998) Describe extensiones para DSM-CC (Comando Digital de herramientas de almacenamiento y control).
ISO/IEC 13818-7 (2006) Codificación avanzada de audio. (AAC)
ISO/IEC 13818-9 (1996) Extensión para interfaces en tiempo real.
ISO/IEC 13818-10 (1999) Conformidad con extensiones para DSM-CC.
ISO/IEC 13818-11 (2004) IPMP (Intellectual Property Management and Protection) en sistemas MPEG-2
Artículos relacionados
| Universidad | Universitat d'Alacant |
| Facult/Asign | Sistemas y Servicios de Telecomunicación |
| Profesor | Albadalejo Blazquez, Adolfo |
| Autor | Torres Muñoz,Rubén |
| Tipo de trabajo | PFC |
| Fecha de evaluación | Junio 09 |
| Editable por terceros | No |
| Categorías propuestas | Portal Tecnología, Transporte y multiplexado, Redes y técnicas de difusión |
| Comentarios | |
Vea la página Colaboraciones universitarias
| Media |
|---|
| Elaborando |
| Global |

