AMD lanza un acelerador basado en ASIC de 5nm para la era de la transmisión interactiva


Antes del evento NAB Show 2023 de la próxima semana, AMD anunció hoy su tarjeta aceleradora de medios Alveo MA35D basada en dos unidades de procesamiento de video (VPU) de 5 nm basadas en ASIC. El show de la NAB (Asociación Nacional de Locutores) se llevará a cabo del 15 al 19 de abril en Las Vegas NV.

El Alveo MA35D es compatible con el estándar de compresión AV1 y está diseñado para satisfacer las necesidades de una nueva era de servicios interactivos de transmisión en vivo a gran escala, según AMD.

La tarjeta aceleradora de medios Alveo MA35D incorpora dos unidades de procesamiento de video (VPU) basadas en ASIC de 5 nm que admiten compresión AV1.

La tarjeta aceleradora de medios Alveo MA35D incorpora dos unidades de procesamiento de video (VPU) basadas en ASIC de 5 nm que admiten compresión AV1.

En este artículo, describimos el problema que el nuevo acelerador basado en ASIC está diseñado para resolver, examinamos las características clave del dispositivo y compartimos las opiniones de Girish Malipeddi, director de administración de productos y marketing de AMD, y Sean Gardner, responsable de estrategia de video de AMD. y desarrollo.

El paso a la transmisión de video en vivo interactiva

La naturaleza de la transmisión de video en vivo está cambiando y los recursos informáticos de aceleración deben seguir el ritmo de este cambio. Solía ​​​​estar dominado por la transmisión de transmisión, un modelo de uno a un millón.

Un ejemplo tradicional de transmisión en vivo es un partido de fútbol. Aquí se utiliza un retraso de 5 segundos. “Este tipo de demora le permite aprovechar su implementación de estilo CDN basada en TCP existente”, dice Gardner. «Eso puede no parecer mucho, pero el video en tiempo real toma 16 ms, por lo que para cualquier interactividad, 5 segundos es toda una vida».

La transmisión tradicional de video en vivo solía ser un modelo de uno a un millón, como la transmisión de un partido de fútbol.  Una latencia de 5 segundos es aceptable en esta situación.

La transmisión tradicional de video en vivo solía ser un modelo de uno a un millón, como la transmisión de un partido de fútbol. Una latencia de 5 segundos es aceptable en esta situación.

El problema para la infraestructura de transmisión de video en vivo actual y de próxima generación es que un modelo interactivo está tomando el control. Con aplicaciones tan diversas como los juegos en la nube, las fiestas de vigilancia, la telesalud y la transmisión social, el modelo de uno a un millón está cambiando hacia el dominio de un modelo interactivo de un millón a un millón para la transmisión de video en vivo.

En un modelo interactivo de transmisión de video en vivo, cualquiera puede ser un transmisor y hay muchos puntos de entrada y salida para el video.  La infraestructura debe evolucionar para satisfacer estas nuevas necesidades.

En un modelo interactivo de transmisión de video en vivo, cualquiera puede ser un transmisor y hay muchos puntos de entrada y salida para el video. La infraestructura debe evolucionar para satisfacer estas nuevas necesidades.

En este nuevo modelo interactivo, Malipeddi dice que la latencia se vuelve cada vez más crítica.

«En este nuevo modelo, todo el mundo se convierte en streamer porque se trata de aplicaciones de streaming bidireccional interactivas».

Esto requiere un cambio fundamental en la forma de gestionar estos flujos. Y luego la infraestructura también requiere ajustes para hacer frente a este problema, dice Malipeddi.

“El tráfico en general aumenta drásticamente porque todo el mundo se convierte en un locutor en cierto sentido”, dice Malipeddi. “Hay muchos más flujos de entrada y salida ahora, y en lugares se puede ver que la red y el procesamiento pueden volverse limitados rápidamente”.

Acelerador de medios basado en VPU basadas en ASIC

Con todo esto en mente, los ingenieros de AMD han desarrollado la nueva tarjeta de aceleración multimedia Alveo MA35D, basada en dos VPU de 5 nm basadas en ASIC. La tarjeta ofrece una alta densidad de canales, con hasta 32 transmisiones de 1080p60 por tarjeta. Esto es 4 veces la densidad de canales del acelerador de medios Alveo U30 anterior de AMD.

Basado en un proceso de 5nm, los ASIC en el Alveo MA34D son lo que Malipeddi llama VPU especialmente diseñadas. Si bien este producto proviene del lado de Xilinx FPGA del negocio de AMD, se decidió que aquí se necesitaba un enfoque ASIC.

Un aspecto importante de acelerar la transmisión en vivo interactiva es la capacidad de administrar su tamaño. “Estamos tratando de administrar cientos y cientos y miles de canales de video”, dice Malipeddi. Lograr esto significa maximizar la cantidad de canales por servidor mientras se minimiza la potencia y el ancho de banda por transmisión, dice.

Alveo M34D acelera todo el canal de video utilizando técnicas basadas en IA para mejorar la calidad del video y reducir la tasa de bits.

Alveo M34D acelera todo el canal de video utilizando técnicas basadas en IA para mejorar la calidad del video y reducir la tasa de bits.

El Alveo M34D mantiene el ritmo al ofrecer hasta 32 transmisiones de 1080p60 por tarjeta a 1 W por transmisión. Malipeddi dice que permite que un servidor en rack de 1U equipado con 8 tarjetas proporcione hasta 256 canales de video.

Para operar en estas situaciones a escala, se debe considerar toda la tubería. “Se trata realmente de acelerar todo el proceso”, dice Malipeddi.

“No queremos tener que mover nada a la CPU host para ralentizar las cosas. Así que todo tiene que hacerse en los VPU ASIC”.

VPU con procesador AI y motores de calidad de video

Dado que todo el procesamiento de video funciona en la VPU, se minimiza el movimiento de datos entre la CPU y el acelerador. Esto reduce la latencia general y maximiza la densidad del canal hasta 32x 1080p60, 8x 4Kp60 o 4x 8Kp30 transmisiones por tarjeta, dice Malipeddi.

La tarjeta proporciona soporte de baja latencia para los códecs convencionales H.264 y H.265. Sus motores de transcodificación AV1 ofrecen hasta un 52 % de reducción en la tasa de bits para ahorrar ancho de banda en comparación con una implementación de software equivalente.

Los ASIC Alveo MA34D tienen más recursos para procesar video, incluido un procesador AL que funciona con motores de calidad de video en chip (VQ QoE Engines).

Los ASIC Alveo MA34D tienen más recursos para procesar video, incluido un procesador AL que funciona con motores de calidad de video en chip (VQ QoE Engines).

La inteligencia artificial (IA) también se emplea en los ASIC, con un procesador de IA dedicado en el chip. Este procesador funciona junto con los motores de calidad de video en chip VQ (motores QoE). Como explica Gardner, el procesador de IA evalúa el contenido, cuadro por cuadro, y ajusta dinámicamente la configuración del codificador. Esto mejora la calidad visual percibida mientras minimiza la tasa de bits.

Las técnicas de optimización utilizadas por el ASIC incluyen codificación de región de interés (ROI) para resolución de texto y rostro, detección de artefactos para corregir escenas con altos niveles de movimiento y complejidad, y codificación consciente del contenido para obtener información predictiva para la optimización de la tasa de bits, según el compañía.

Todas las imágenes utilizadas son cortesía de AMD