La semana pasada, Arm lanzó Arm Total Compute Solutions (TCS23), una suite de propiedad intelectual (IP) de Arm basada en la última arquitectura ARMv9. Este paquete ofrece a los diseñadores un enfoque combinado para las aplicaciones informáticas móviles a través de una cartera de IP de CPU, GPU, sistema y software.
El ecosistema TCS23. Imagen utilizada cortesía de Arm
Una de las características más destacadas del TCS22 del año pasado fue la introducción del trazado de rayos por hardware en la GPU Immortalis Arm. El anuncio de este año impulsa las ofertas de CPU y GPU, principalmente a través de mejoras de potencia y eficiencia con un rendimiento similar o mejorado.
Clúster de CPU para informática móvil
En el TCS22 se incluyen tres nuevas líneas de CPU Arm Cortex enfocadas en la informática para dispositivos móviles como teléfonos inteligentes, tabletas y computadoras portátiles. En particular, los procesadores Cortex están diseñados para permitir aplicaciones con uso intensivo de gráficos, como juegos, realidad virtual/aumentada, aprendizaje automático y seguridad en el dispositivo.
Corteza-X4
El Cortex-X4 es un núcleo de CPU de alto rendimiento de cuarta generación en la línea de la serie X de Arm. Basado en la última arquitectura ARMv9.2, el dispositivo cuenta con una velocidad de reloj de 3,4 GHz, caché L1 (65 KB), caché L2 (0,5–2 MB) y caché L3 (32 MB). Además, el ancho de banda de instrucciones se ha incrementado a 10 instrucciones por ciclo. Según se informa, estas actualizaciones dan como resultado un aumento del rendimiento del 15% con respecto a la CPU Cortex de última generación.
El aumento de rendimiento de 10x del Cortex-X4 y el aumento de rendimiento de 4x de Cortex-A720 lo convierten en un poderoso competidor en el panorama de las computadoras portátiles de alto rendimiento basadas en Arm. Imagen utilizada cortesía de Arm
Cortex-A720
El nuevo Cortex-A720 de 64 bits se enfoca en la eficiencia energética, particularmente en aplicaciones que necesitan equilibrar el rendimiento y la duración de la batería en una configuración de computación grande, PEQUEÑA y heterogénea. Cuenta con caché L1 I y caché D (32 KB o 64 KB), caché L2 (128 KB/256 KB/512 KB) y caché L3 opcional (256 KB a 32 MB). Con este dispositivo, Arm informa una mejora del 20 % en la eficiencia energética y una mejora del rendimiento del 4,5 % con respecto a la generación anterior.
Cortex-A520
Finalmente, el Cortex-A520 de 64 bits es otra CPU actualizada, enfocada en la eficiencia para cargas de tareas ligeras en segundo plano en una configuración grande.PEQUEÑA. La CPU cuenta con L1 I-cache y D-cache (32 KB o 64 KB), caché L2 opcional (128 KB/192 KB/256 KB/384 KB/512 KB) y caché L3 opcional (256 KB a 32 MB). En comparación con la última generación, Arm afirma una mejora en la eficiencia energética del 22 % y una mejora en el rendimiento del 8 %.
La unidad compartida DynamIQ 120 (DSU-120) admite hasta 14 núcleos de CPU de arquitectura clase A en un clúster. Proporciona un sistema de memoria L3 compartida, funciones de seguridad, lógica de control e interfaz SoC. Arm ha presentado varias configuraciones básicas que pueden admitir aplicaciones que van desde dispositivos portátiles hasta computadoras portátiles de alto rendimiento, que admiten el enfoque de «mezclar y combinar».
Esquema de la unidad compartida DynamIQ 120. Imagen utilizada por cortesía de Arm
Nuevas GPU para diversas necesidades de gráficos y energía
TCS23 también incluye tres arquitecturas de GPU de quinta generación. Sus configuraciones técnicas básicas son casi idénticas, con algunas diferencias clave en la cantidad de núcleos admitidos. En algunos casos, también están disponibles funciones de trazado de rayos opcionales. Estas son GPU móviles destinadas a admitir juegos móviles AAA, como Genshin Impact o Fortnite.
El primero es el Immortalis-G720 dirigido a los teléfonos inteligentes emblemáticos para juegos y aprendizaje automático. Cuenta con sombreado de vértices diferido, antialiasing de muestreo múltiple 2x/4x/8x/16x, trazado de rayos y compatibilidad con API para OpenGL ES 1.1/2.0/3.2, Vulkan 1.3 y OpenCL 1.2/2.1/3.0 Full Profile. La GPU es escalable a 10 o más núcleos y también proporciona capacidades de trazado de rayos de hardware, lo que la convierte en la de mejor rendimiento de las tres ofertas de GPU. Se dice que Immortalis-G720 tiene un aumento del rendimiento del 15 % y utiliza un 40 % menos de ancho de banda de memoria que la última generación de arquitecturas Arm GPU.
El Mali-G720 comparte las mismas especificaciones que el Immortalis-G720, aunque solo es escalable de seis a nueve núcleos y tiene capacidades opcionales de trazado de rayos de hardware. Por último, pero no menos importante, está el Mali-G620, que nuevamente comparte la misma configuración básica pero solo se escala de uno a cinco núcleos, lo que brinda la opción de GPU más liviana.
Aprendizaje automático y beneficios de seguridad de TCS23
Arm dice que el TCS23 mejora las capacidades de aprendizaje automático a través de una combinación de hardware y software.
Para las aplicaciones de aprendizaje automático basadas en CPU, como la inferencia INT8 para la detección/clasificación de objetos, el reconocimiento en tiempo real y el seguimiento de la posición del cuerpo, la empresa informó una mejora del 12 % para Cortex-X4, una mejora del 9 % para Cortex-A720 y un Mejora del 13 % para el Cortex-A520 con respecto a sus predecesores. En cuanto a la GPU, las optimizaciones en Arm NN y Arm Compute Library proporcionaron una mejora de 4x en las tareas de aprendizaje automático.
TSC23 también proporciona algunas mejoras de seguridad. La plataforma es compatible con el marco de virtualización de Android para dispositivos basados en Arm 64, la autenticación de puntero (PAC) y la identificación de destino de rama (BTI) para eliminar los ataques de programación orientada a retorno (ROP) y programación orientada a saltos (JOP).