Por qué los M1 Pro y M1 Max son los primeros SoC profesionales de Apple
Análisis

Por qué los M1 Pro y M1 Max son los primeros SoC profesionales de Apple

En junio de 2020, Apple anunció el salto a sus propios chips llamados Apple Silicon. Unos chips que no son ni más ni menos que aquellos que llevaban diseñando desde 2010 con la salida de aquel primer A4, el primer SoC (system-on-a-chip o sistema en un chip), que era el cerebro de los primeros iPad y luego lo fue del siempre laureado iPhone 4. Pero en aquel momento, sobre una puesta de largo con varios vídeos de la WWDC 2020 que explicaban los pormenores técnicos de la transición y cómo Apple se había preparado para ella, no éramos conscientes de hasta dónde podrían llegar estos nuevos SoC.

Llegó el mes de noviembre de 2020 y en tan solo 49 minutos de presentación, Apple cambió el mundo de la informática de consumo (otra vez) para siempre. Apple presentaba el M1: su primer SoC de diseño propio, destinado exclusivamente (eso se decía en ese momento) a los ordenadores Mac. Un SoC, un chip, capaz de dar un golpe en la mesa y demostrar que las cosas podían hacerse de otra forma mucho más eficiente.

M1

De la mano: los MacBook Air y MacBook Pro, así como el Mac mini. Todos con M1 pero reciclando diseños ya existentes, reservando los rediseños para esta segunda fase que estamos viviendo ahora.

De los M1, solo ha habido buenas palabras desde la prensa especializada. No hay nadie que no haya reconocido su potencial y cómo ha sido una disrupción que nadie esperaba a ese nivel. Y casi un año después Apple nos presenta el siguiente paso: la versión profesional de los M1. Pero, ¿de qué estamos hablando? ¿qué diferencia a estos SoC de los anteriores? ¿Por qué todos se llaman M1 y no M2 (por ejemplo) indicando que son una nueva generación? Analicémoslo.

Por qué lo llaman procesador cuando quieren decir SoC

Estamos acostumbrados a decir que el procesador de un equipo es tal o cual (o incluso usamos las siglas CPU, de Central Processing Unit o unidad central de proceso). El Mac de 16 pulgadas con procesador Intel i9, la Surface Laptop con procesador Ryzen 5 de AMD… incluso nos referimos a ellos así cuando hablamos del iPhone: el nuevo iPhone 13 con procesador A15. Estamos cometiendo un error de concepto muy importante.

Un SoC es un conjunto de componentes, no solo el procesador que es solo una parte del mismo. Por eso, en el caso de los Apple Silicon, no podemos decir "procesador M1" porque es una terminología incorrecta.

Mientras en el caso de Intel o AMD nuestra definición es correcta y hablamos de un procesador, si hablamos del A15 o del M1, no hablamos de un procesador. Hablamos de un SoC, system-on-a-chip o sistema en un chip. El procesador, la CPU, es uno de los muchos componentes que tendrá dentro, pero no el único. En un SoC hay una CPU, pero a su alrededor hay más cosas, en el caso de los Apple Silicon incluso la memoria RAM. Componentes vitales para el funcionamiento del equipo.

Vamos a jugar a un Lego y construir nuestro propio chip como haría Apple: ¿por dónde empezamos? Por una base. Tenemos una base con muchos puntitos donde podemos acoplar piececitas y con ello montar nuestra estación de bomberos, o de policía o nuestro colegio. En nuestro caso, nuestro chip.

Base de LEGO
Vamos a construir nuestro chip en una base vacía donde poner componentes.

¿De qué tamaño son los “pinchitos” donde puedes poner piezas y encajarlas? Depende. Si tenemos una base con pinchos más pequeños cabrán más piezas (más pequeñas) en una base del mismo tamaño. Si los pinchos son más grandes (tipo Duplo) cabrán menos piezas en la misma superficie, ¿no? Eso va a ser nuestra arquitectura de fabricación. La que usan los M1 es de 5nm. ¿Son realmente 5nm? No. Primer gran error. 5nm es una denominación más cercana a un concepto comercial que a uno real.

5nm no es una denominación real al tamaño de los transistores. Se acerca más a una definición comercial que distinga cada proceso pues la forma de medir el resultado de estos 5nm varía entre cada fabricante e incluso entre cada iteración del proceso de fabricación del mismo. No hay un consenso común a todos ellos.

Por no entrar en demasiado detalle técnico, 5nm es "el nombre" que el fabricante X decide poner a la medición de depende qué factores según les parezca a ellos para que parezca que el cambio que están incorporando es mejor. Pero, insisto, no es un dato real porque la forma en que se mide esa distancia cambia de criterio a cada nueva mejora en los procesos de fabricación. Cada uno lo mide como quiere. Aquí el dato relevante es otro: la densidad de transistores lógicos por milímetro cuadrado.

M1 Pro
El M1 Pro

En el caso del A14 y el M1 (que están construidos en el mismo proceso de fabricación) este dato es de 134.09 millones de transistores por milímetro cuadrado lo que en el caso del A14 suma un total de 11.800 millones de transistores en el espacio que este ocupa. El A13 tenía 89.97 millones de transistores por milímetro cuadrado. El M1 Max tope de gama con 32 núcleos de GPU llega a los 57.000 millones.

Cuantos más transistores quepan en el mismo espacio, mejor es el proceso de fabricación, más cabe en el mismo espacio y eso mejora la eficiencia energética (el consumo) y el diseño termal del chip.

El diseño termal es el consumo en vatios que nos dice el calor que se genera, el rango al que se puede calentar por su funcionamiento sin sufrir problemas en su funcionamiento o daño físico y cómo hay que refrigerarlo para mantenerlo en unos niveles aceptables de funcionamiento.

Volvamos a la base de Lego y empecemos a poner piezas, esta vez por colores. Sabes que nuestros pinchos nos permiten poner 134.09 millones de piezas por cada milímetro de la base de Lego, así que comenzamos a colocar piezas encima, configurando los transistores para que cumplan una función determinada según su programación física. Usamos unos colores para poner la CPU, otros para la GPU y vamos montando los distintos componentes de nuestro sistema en un chip.

Componentes del SoC del M1

En un análisis que ya hice aquí del M1 os contamos para qué servía cada uno de los 18 componentes que tenía este sistema en un chip. 18 sin contar los distintos tipos de núcleos de la CPU y la propia GPU. Desde un chip para procesamiento de vídeo (que codifica y decodifica distintos formatos de vídeo), al controlador de PCI de cuarta generación, el motor neural, el controlador de rendimiento qué decide que tipo de núcleo (de alto rendimiento o de eficiencia energética) realizará cada tarea…

Ahí radica uno de los secretos del éxito de los M1: que mientras un procesador Intel o AMD, la mayor parte de la carga de trabajo es del procesador, en un M1 la CPU tiene casi más un trabajo de coordinación de otros componentes que de fuerza bruta realizando tareas. Si hablamos de una tarea genérica de proceso, es obvio que la hará la CPU, pero si la tarea abarca cualquiera de los componentes del chip (como codificar vídeo), no lo hará la CPU y esta solo coordinará la tarea. Nada más.

Johny Srouji, vicepresidente senior de tecnologías de hardware en Apple
Johny Srouji, vicepresidente senior de tecnologías de hardware en Apple

Ahora que ya hemos entendido la parábola de la base de Lego y la construcción de chips, demos el siguiente paso: ¿qué es el M1 Pro y el M1 Max?

M1 Pro y M1 Max, las CPUs y GPUs del M1 pero con mejor memoria y bus de comunicación

Los M1 Pro y M1 Max se llaman M1 y no M2 porque su base de construcción es la del M1. La base de construcción de 5nm con una densidad de 134.09 millones de transistores por milímetro cuadrado. Y sobre esa base han montado la misma exacta CPU y GPU que tienen los M1 actuales que tienen los Mac mini, MacBook Air o MacBook Pro de 13” y que vienen vendiéndose desde noviembre de 2020 (también los iPad Pro de última generación).

Los M1 Pro y M1 Max tienen la misma exacta CPU y GPU que los M1. Nanómetro a nanómetro.

¿Dónde está la novedad? En dos puntos:

  • El número de núcleos que se colocan para crear esa CPU y esa GPU.
  • Los componentes que pongo a su alrededor.

Recordad: tengo una base de Lego donde puedo poner las piezas que yo quiera, así que Apple ha vuelto a un tablero vacío y ha puesto los mismos núcleos de CPU que tiene el M1, pero en vez de poner 4 de eficiencia energética a 1,8Ghz y 4 de alto rendimiento a 3,06Ghz, ha puesto 6 de alto rendimiento y solo 2 de eficiencia en el modelo base de 8 núcleos y 8 de alto rendimiento y 2 de eficiencia energética en la configuración de 10 núcleos de CPU que tiene el resto de la gama.

M1 Pro de 10 núcleos
M1 Pro de 10 núcleos

Pasamos de 4 a 3,06Ghz a 6 u 8 y reducimos los núcleos a 1,8Ghz de 4 a 2. Esto, ¿qué consigue? Una lógica mejora de la velocidad porque ahora tenemos más núcleos más rápidos.

¿Es lo único que mejora la velocidad? No. Hay otro factor importante: el bus de datos de la memoria. En el A14, Apple usa un bus de datos de 64 bits mientras que en el M1 lo aumentaba a 128 bits usando memoria LPDDR4X a 4.266Mhz. Eso le proporcionaba una velocidad de transmisión de hasta 68,25GB/s. Significa que podemos llegar hasta esa velocidad, pero no significa que siempre llegue a esta. Por ejemplo, un núcleo Firestorm de los M1 (núcleos de alto rendimiento a 3,06Ghz) es capaz de leer la memoria a través de su bus de comunicación a una media 58GB/s en velocidad sostenida y escribe a unos 35GB/s.

M1 Pro, con memoria en interfaz de 256 bits LPDDR5
M1 Pro con hasta 32GB de memoria unificada en interfaz de 256 bits de tipo LPDDR5.

El M1 Pro y Max usan un tipo de memoria más eficiente: LPDDR5. Esta memoria aumenta su velocidad de reloj de 4.266 Mhz. a 6.400 (6.4Ghz). Por lo tanto tenemos una memoria más rápida. A esto le unimos que el canal de comunicación en memoria de los M1 Pro pasa de 128 bits que tenían los M1 a 256 bits en los M1 Pro. Entre la duplicación en la capacidad del ancho de memoria y el aumento de la velocidad en la frecuencia de reloj de la memoria, pasamos de los 68,25GB/s de pico de transmisión en el bus de datos a 200GB/s como máximo.

El nuevo bus de datos de memoria permite que ganemos más velocidad que si solo tuviéramos el aumento del número de núcleos en número y tipo de los mismos.

Pero no acaba ahí la cosa: los M1 Max son una base aún más grande que los M1 Pro. Usando la misma CPU de 10 núcleos (8 Firestorm de alto rendimiento y 2 Icestorm de eficiencia energética) que el M1 Pro, aumentan el bus de datos a 512 bits en LPDDR5, lo que duplica la velocidad consiguiendo picos de hasta 400GB/s en su comunicación. Así que la misma exacta CPU de 10 núcleos en el M1 Pro y el M1 Max con la misma exacta velocidad, conseguirá en conjunto más velocidad en un M1 Max que en un M1 Pro debido a este importante cambio en la velocidad del bus de comunicación de la memoria.

M1 Max con hasta 64GB de memoria unificada en un bus a 512 bits de hasta 400GB/s LPDDR5.
M1 Max con hasta 64GB de memoria unificada en un bus a 512 bits de hasta 400GB/s LPDDR5.

Luego hablamos de la GPU: en los M1 teníamos una GPU de 8 núcleos que en total conseguía una potencia de cálculo de 2.6 Teraflops por segundo en 32 bits de cálculo de coma flotante. Los M1 Pro lo que hacen es poner más núcleos de esta misma exacta GPU, con lo que tenemos una proporción directa de rendimiento: 16 núcleos de GPU alcanzan 5.2 Teraflops en el M1 Pro y con 32 núcleos llegan 10.4 Teraflops. Si hacemos una sencilla regla de tres obtendremos que la GPU de 14 núcleos del M1 Pro modelo base se quedaría en 4.55 Teraflops y el modelo intermedio del M1 Max con 24 núcleos llegaría a los 7.8 Teraflops.

GPU de 16 núcleos del M1 Pro
GPU de 16 núcleos del M1 Pro

Si comparamos única y exclusivamente dicha potencia bruta, estaríamos hablando que el M1 Max de 32 núcleos estaría por encima del cálculo del procesador gráfico de una Playstation 5 y en un rendimiento similar a una RTX 3080 de NVIDIA en su gama para portátiles (la gama de escritorio queda aún muy lejos con sus más de 30 Teraflops de potencia de cálculo).

GPU del M1 Max con 32 núcleos y 10.4 teraflops de cálculo
GPU del M1 Max con 32 núcleos y 10.4 teraflops de cálculo

Sin duda todo un hito para Apple, no ya por la potencia en sí que es alcanzada por muchos más chips gráficos del mercado: aquí lo importante es que lo consigue con un consumo de casi 100 vatios menos. Ese es el verdadero hito: no la potencia, conseguirla con un consumo de energía y, por lo tanto, una generación de calor muy por debajo de los estándares normales de la industria para conseguir dicha potencia.

La GPU del M1 Max consigue la misma potencia que una RTX 3080 de portátil con un consumo 100W por debajo.
La GPU del M1 Max consigue la misma potencia que una RTX 3080 de portátil con un consumo 100W por debajo.

Obviamente, comparar el M1 Max con un Playstation 5 más allá de dicho dato empírico de potencia bruta no tiene sentido alguno, porque hay infinidad de factores como la arquitectura o los distintos componentes del SoC de la PS5 (sí, también es un SoC), así como sus capacidades gráficas más allá de la potencia, que nos hacen ver que son absolutamente incomparables. Pero no deja de ser un punto de referencia que nos indica hasta dónde ha conseguido llegar Apple y hasta donde puede llegar en el futuro con GPUs con más núcleos o incluso con GPUs dedicadas (porque terminará por sacarlas por obvias razones térmicas si quiere seguir aumentando la potencia).

Los componentes del M1 Pro y el M1 Max

Volvemos a recordar: estamos montando un SoC con la misma CPU y GPU que los M1, pero poniendo más núcleos. Pero cuando hablamos del resto de componentes que teníamos en el M1, casi una veintena, no tenemos por qué usar los mismos y podemos actualizarlos y/o mejorarlos. Es lo que ha hecho Apple con algunos de ellos.

Motor de medios del M1 Pro y sus capacidades
Motor de medios del M1 Pro y sus capacidades

El más destacado es el nuevo procesador de vídeo (o motor de medios) que permite trabajar en codificación y decodificación por hardware. Con los codecs H.264, HEVC (o H.265) y también en los formatos profesionales ProRes y ProRes Raw. Esto le permite trabajar en un proyecto en Final Cut Pro, DaVinci Resolve o Adobe Premiere (las tres apps están adaptadas para sacar el rendimiento apropiado de este nuevo procesador) de hasta 20 líneas de tiempo (o streams) en 4K en ProRes, llegando a 30 en el M1 Max. Y hasta 7 líneas en 8K en los M1 Max.

Media Engine del M1 Max con doble codificador
Media Engine del M1 Max con doble codificador

¿Por qué más en el M1 Max? Porque Apple ha puesto un doble codificador de vídeo H.264 y HEVC, unido a un doble codificador y decodificador de ProRes y ProRes RAW. De nuevo, volvemos al mismo paradigma: pongo la misma CPU y GPU con más núcleos, aprovecho el aumento de velocidad en la memoria y pongo mejores componentes dentro del SoC y más profesionales.

Es de común conocimiento entre los profesionales del sector, que el M1 no tiene un buen chip de codificación de vídeo en H.264 y HEVC. Para un uso no profesional es más que suficiente y hace un buen trabajo a buena velocidad, pero para un uso profesional la calidad de cómo codifica determinadas partes de cada frame (sobre todo las curvas creando extrañas aberraciones) indicaba claramente que estábamos ante un chip de vídeo para el sector consumo (lógico, el M1 es un chip del sector consumo).

El nuevo motor de medios de los M1 Pro y M1 Max mejora y usa matrices de compresión profesionales, de mucha más calidad que las que tienen los M1 que son para el sector consumo, menos exigentes en la calidad de la codificación.

Apple, obviamente ha hecho sus deberes para este M1 Pro y ha creado un nuevo chip que sí usa unas matrices de compresión de calidad profesional. Y ojo, porque es probable que cuando comiencen a aparecer las primeras comparaciones con los M1 veamos que los M1 Pro pueden ser levemente más lentos en codificar el mismo exacto vídeo (ya está pasando en los A15). ¿Por qué? Porque al codificar a más calidad, tarda un poco más. Es lógico. Aunque tal vez la diferencia en el bus de memoria colabore a compensarlo y finalmente sí sea algo más rápido. Habrá que probarlo.

Algunos componentes del M1 Pro

¿Y el motor neural, por citar un ejemplo? Pues es el mismo que el M1. El mismo exacto componente. ¿Qué diferencia hay entonces? Que al estar en un nuevo SoC con un ancho de banda superior y memoria más rápida, su rendimiento mejorará porque podrá leer y escribir la memoria más rápidamente.

¿Qué otros componentes ha renovado Apple? Hasta donde sabemos con la información en nuestra mano, el chip Secure Enclave que se encarga de la seguridad del equipo y de la comprobación de firma de los distintos componentes, ejecutables, sistema y código, es uno mejor, más seguro y más eficiente. Una nueva versión. También el ISP sería nuevo y mejorado, probablemente el mismo que tienen los SoC A15. Y por supuesto, ha mejorado la caché de todo el conjunto para que sea más eficiente.

Memoría unificada

Un dato importante que tenemos que entender es que la memoria unificada colabora significativamente en el mejor funcionamiento de toda la gama M1 porque en otras arquitecturas, la CPU y GPU tienen memorias dedicadas y tienen que copiar información de la una a la otra haciendo que los procesos sean menos eficientes.

¿Cuánta memoria gráfica tenemos entonces si es compartida y unificada? Hasta el 50% de lo que tenga nuestro equipo. Es el límite de la arquitectura. ¿Y por qué hasta el 50%? Imaginad que la GPU hace un proceso y usa 2GB de memoria para procesar y guardar los resultados. En el momento que la GPU termina, el controlador de procesos informa a la CPU y esta recoge el resultado de la misma exacta memoria que usó la GPU. De esta forma, los 2GB que usaba la GPU ahora son de la CPU. Así de eficiente es este sistema y por eso no hay una memoria fija solo para la GPU o para la CPU.

Conclusiones y futuro de la gama

El futuro de la gama es mejorar los procesos de fabricación, mejorar la densidad de transistores y permitir que el mismo chip puede ser más pequeño en tamaño y más eficiente energéticamente. El problema es que los actuales chips A15, que mejoran el proceso de construcción a uno denominado 5nm+, solo han aumentado de 134,09 millones de transistores por milímetro cuadrado hasta 135,14.

El SoC M1 Pro
El SoC M1 Pro

Los núcleos de la CPU de un A15 son casi iguales en rendimiento al de un M1. Aunque obviamente sean menos. Pero no hay que olvidar que los chips de móvil tienen un bus de memoria de 64 bits, por lo que sería algo menor su rendimiento general. Pero la GPU del A15 sí es nueva y pertenece a la generación Apple Family 8 de GPU con un conjunto de instrucciones gráficas más eficientes y con más capacidad.

El paso de 5nm a 5nm+ unido a otras mejoras en el proceso de fabricación, han permitido que el A15 pueda tener algo más de velocidad de reloj, de 2,6Ghz a 3,0Ghz e igualar con el mismo TDP al M1 en velocidad.

Según mis estudios, este proceso 5nm+ no es suficiente para crear una nueva generación, por lo que Apple estaría esperando a pasar al ya anunciado proceso de 3nm (insistimos nuevamente que lo de los nanómetros no es un dato real a tener en cuenta). Pero sí es cierto que esta mejora es un cambio en el proceso de fabricación mucho más notorio, que disparará el dato de transistores por milímetro cuadrado y el resto de elementos que permiten obtener los valores de consumo, rendimiento y tamaño a más componentes.

El SoC M1 Max
El SoC M1 Max

Supongo y entiendo que el próximo A16 que vendrá en la próxima generación de iPhones será la base de construcción en proceso de 3nm de TSMC y de esa misma base Apple creará el nuevo M2 con componentes más actualizados que tendrá nuevos núcleos de CPU y GPU más rápidos y eficientes.

Por lo que tal vez tendremos que esperar al año que viene para ese siguiente paso en la transición de Apple hacia la segunda generación de chips de consumo, los M2, de chips profesionales de portátil, M2 Pro y M2 Max y las versiones ¿Ultra? para equipos de escritorio como el futuro iMac de mayor tamaño o el rumoreado Mac Pro con forma de cubo como el clásico G4 Cube. El tiempo dirá.

Temas
Inicio