¿Sabías que la amenaza de huelga de Samsung podría afectar el suministro de memoria?

Mike McCrosky 16 mayo 2026 Memoria flash y hardware

La amenaza de huelga de Samsung podría afectar el suministro de memoria, imagen de una fábrica

Por qué un conflicto laboral dentro de la división de semiconductores de Samsung de pronto tiene atenta a la industria global de memoria

La mayoría de las personas escucha “Samsung” y piensa de inmediato en teléfonos inteligentes o televisores. Pero detrás de escena, Samsung también es una de las compañías de semiconductores más importantes del mundo, especialmente cuando se trata de producción de memoria.

Por eso la posible huelga laboral de la empresa en Corea del Sur está recibiendo tanta atención dentro de la industria tecnológica.

El conflicto actual involucra a empleados de Samsung Electronics ligados a las operaciones de semiconductores, incluidos trabajadores de fabricación de chips, ingenieros, personal técnico y equipos de soporte. Según los reportes, el sindicato amenaza con una huelga de 18 días si fracasan las negociaciones sobre salarios y estructuras de bonos.

A primera vista, quizá no parezca algo que le importe al consumidor promedio. Pero aquí está el punto: Samsung es uno de los mayores productores de memoria flash NAND y DRAM del mundo. Esos componentes impulsan todo, desde SSDs y laptops hasta servidores de IA e infraestructura en la nube.

En otras palabras, esto no es solamente una historia laboral local.

Por qué la industria de memoria está prestando atención

La fabricación de semiconductores es muy distinta al trabajo tradicional de fábrica. Las fábricas modernas de chips funcionan de manera continua con equipos altamente especializados, sistemas robóticos de manejo, salas limpias y calendarios de producción estrictamente controlados.

Aunque las instalaciones están muy automatizadas, todavía dependen de ingenieros con experiencia y trabajadores técnicos para mantener la producción avanzando de forma eficiente.

Si una acción laboral a gran escala ralentiza la producción, el impacto puede extenderse más allá de las fechas de la huelga. La fabricación de semiconductores tiene ciclos de producción largos, lo que significa que los inicios de obleas perdidos o los calendarios interrumpidos pueden seguir afectando la producción incluso después de que los trabajadores regresen.

Esa es una de las razones por las que los analistas están observando la situación de cerca.

Una interrupción que involucre a Samsung podría afectar potencialmente:

el suministro de memoria flash NAND
los calendarios de producción de SSDs
los sistemas de almacenamiento empresarial
la infraestructura de servidores de IA
los precios de la memoria

El momento también importa porque la demanda de hardware para IA sigue creciendo rápidamente. La memoria se ha convertido en uno de los cuellos de botella críticos en la infraestructura moderna de IA.

La situación laboral de Samsung ha cambiado

Históricamente, Samsung no era conocida por huelgas laborales. De hecho, durante décadas la compañía tuvo fama de ser firmemente antisindical.

Eso empezó a cambiar en 2024, cuando trabajadores de Samsung realizaron varias acciones laborales, incluidas salidas de trabajo y huelgas de corto plazo relacionadas con compensación y bonos.

La situación actual se siente más significativa porque el propio mercado de semiconductores se ha vuelto más importante a nivel global. Samsung compite agresivamente en tecnologías avanzadas de memoria, incluidos productos utilizados en servidores de IA y sistemas de cómputo de alto rendimiento.

Los trabajadores parecen creer que deberían participar de manera más directa en las ganancias creadas por el auge de la IA.

El problema más grande que la mayoría de los consumidores nunca ve

Una parte interesante de esta historia es lo invisible que suele ser la industria de semiconductores para los consumidores comunes.

La gente nota cuando un teléfono inteligente se lanza tarde o cuando las tarjetas gráficas se vuelven caras. Pero rara vez piensa en la cadena de suministro de memoria que está debajo de esos productos.

La realidad es que la tecnología moderna depende en gran medida de que compañías como Samsung, SK Hynix, Micron y Kioxia sigan fabricando memoria a una escala enorme.

Incluso una interrupción temporal puede crear efectos en cadena en toda la industria del almacenamiento.

Para los lectores interesados en el lado más profundo de fabricación y mercado NAND de esta historia, el análisis completo está disponible en GFM aquí:

Samsung Strike Threat Explained: What It Means for Memory Chips and NAND Supply

La conversación más amplia sobre el mercado de memoria también se conecta con la creciente importancia del almacenamiento para infraestructura de IA, especialmente mientras los discos duros tradicionales y la memoria flash NAND siguen trabajando juntos dentro de enormes centros de datos. Recientemente cubrimos ese tema en nuestro artículo sobre por qué los servidores de IA ahora dependen de algo más que solo flash.

En resumen: la mayoría de los consumidores quizá nunca escuche sobre la situación de la huelga en Samsung, pero dentro del mundo de los semiconductores la gente está prestando mucha atención.

Por qué los discos duros siguen siendo críticos para la infraestructura de IA

Mike McCrosky 15 mayo 2026 Memoria flash y hardware

Cuando la mayoría de la gente escucha hablar de infraestructura de IA, la conversación normalmente gira alrededor de las GPU, la High Bandwidth Memory (HBM) o el almacenamiento de estado sólido ultrarrápido. La suposición es que la inteligencia artificial funciona por completo sobre hardware de última generación, donde todo se mide en nanosegundos y terabytes por segundo.

Esa suposición no está equivocada, pero está incompleta.

Por qué los discos duros siguen siendo críticos para la infraestructura de IA

La realidad es que los sistemas modernos de IA todavía dependen en gran medida de una de las tecnologías más antiguas del centro de datos: el disco duro mecánico.

Eso puede sonar extraño si consideramos que ya hablamos de cómo los servidores de IA se están moviendo más allá de la memoria flash tradicional en nuestro artículo: NAND no va a desaparecer, pero los servidores de IA ahora dependen de algo más que solo flash. También exploramos por qué tecnologías como la High Bandwidth Memory (HBM) se están volviendo esenciales para mantener los sistemas de IA alimentados con datos lo bastante rápido como para evitar cuellos de botella en las GPU.

Pero hay otro lado de esta historia que no recibe casi tanta atención: la escala pura.

La IA no solo necesita almacenamiento rápido. La IA necesita una cantidad de almacenamiento casi inimaginable.

Y los discos duros siguen siendo la única tecnología capaz de entregar esa capacidad a un costo que la industria puede sostener de manera realista.

Entendiendo la jerarquía de almacenamiento de la IA

La forma más sencilla de entender la infraestructura moderna de IA es dejar de pensar en una sola computadora y empezar a pensar en toda una operación logística.

La HBM actúa como el muelle de carga donde los datos se mueven a una velocidad increíble. La DRAM funciona como el espacio de trabajo activo donde la información se manipula constantemente. La NAND flash se comporta más como estanterías cercanas, donde el acceso rápido sigue importando, pero la persistencia a largo plazo también empieza a ser importante.

Los discos duros, sin embargo, son el almacén.

No la parte más vistosa de la operación. Tampoco la más rápida. Pero sin duda la más grande.

Tecnología	Capacidad típica	Fortaleza principal	Papel principal en IA
HBM	80GB–192GB	Ancho de banda extremo	Cálculo activo en GPU
DRAM	Cientos de GB	Baja latencia	Memoria de trabajo
SSD NAND	Múltiples TB	Almacenamiento persistente rápido	Preparación de datasets y caché
Discos duros	Petabytes a exabytes	Eficiencia de capacidad	Almacenamiento masivo y archivos

Esa distinción importa porque los sistemas de entrenamiento de IA consumen datos a una escala que la mayoría de las personas nunca encuentra en la computación normal.

Una laptop de consumo puede almacenar algunos terabytes de datos. Incluso una estación de trabajo de gama alta quizá solo almacene decenas de terabytes. La infraestructura de IA opera varios órdenes de magnitud por encima de eso.

Mientras una laptop de consumo piensa en terabytes, los clústeres de IA piensan en exabytes.

Un solo exabyte equivale a un millón de terabytes.

Si un disco duro empresarial moderno almacena 30TB, aun así se necesitarían más de 33.000 discos duros para construir un solo exabyte de capacidad de almacenamiento sin procesar.

Los grandes operadores de IA no construyen un exabyte. Construyen múltiples exabytes entre regiones, capas de redundancia, entornos de entrenamiento, sistemas de respaldo y almacenamiento de archivo.

El problema del exabyte

Entrenar un modelo de lenguaje grande puede involucrar petabytes de texto, imágenes, video, telemetría, checkpoints y estados de entrenamiento archivados. Una vez que esos datasets se recopilan, rara vez se eliminan. Siguen creciendo a medida que los modelos se vuelven a entrenar, se refinan y se expanden.

Durante el entrenamiento de IA, los sistemas crean checkpoints continuamente, que básicamente son enormes estados guardados del modelo mientras aprende. Si un clúster falla a mitad de un ciclo de entrenamiento de varias semanas, esos checkpoints pueden ser lo único que evita perder millones de dólares en tiempo de cómputo.

Eso significa que la infraestructura de almacenamiento deja de tratarse solo de velocidad y pasa a tratarse de mantener gigantescos grupos de datos accesibles.

Aquí es donde los discos duros siguen dominando silenciosamente.

En 2010, un disco duro de 2TB se sentía enorme. Los entornos empresariales comúnmente usaban discos SAS de 300GB o 600GB, y cualquier cosa por encima de unos cuantos terabytes se consideraba capacidad premium.

Hoy, los discos duros empresariales de 24TB y 30TB se están convirtiendo en implementaciones estándar dentro de los grandes centros de datos. Los fabricantes ya están probando discos de más de 40TB usando tecnologías como HAMR (Heat-Assisted Magnetic Recording), que aumenta la densidad areal sin aumentar el tamaño físico del disco.

Para poner ese crecimiento en perspectiva, un solo rack de almacenamiento moderno ahora puede contener más datos que todo un centro de datos empresarial mediano de 2010.

Así de drásticamente ha cambiado la demanda de almacenamiento.

Y la IA es una de las principales razones.

La IA funciona con algo más que velocidad

La discusión pública sobre IA tiende a enfocarse en las GPU porque las GPU hacen el trabajo visible. Generan las respuestas, crean las imágenes y procesan los tokens.

El almacenamiento hace el trabajo invisible de preservar la propia tubería de inteligencia.

Las GPU solo son útiles si pueden acceder continuamente a enormes cantidades de datos de entrenamiento.

Esos datos tienen que vivir en algún lugar.

No dentro de la HBM. No dentro de la DRAM. Y desde luego no completamente dentro de costosas capas de almacenamiento NAND.

Viven principalmente en una infraestructura masiva de discos duros.

Un centro de datos moderno de IA puede contener cientos de petabytes de datos almacenados. Algunos entornos hyperscale probablemente van mucho más allá, hacia arquitecturas en escala de exabytes. Intentar almacenar todo eso completamente en NAND flash sería financieramente irrealista, incluso para los proveedores de nube más grandes.

Esta es la parte que mucha gente pasa por alto cuando habla de hardware para IA.

El rendimiento importa, pero la economía también importa.

A la industria le encanta promocionar IOPS y números de benchmark, pero las grandes implementaciones de IA al final están limitadas por el costo total de propiedad.

Los discos duros siguen ofreciendo el costo por terabyte más bajo en implementaciones a gran escala. También siguen siendo extremadamente eficientes para almacenar datos fríos, datasets archivados, snapshots de respaldo, checkpoints de modelos e información masiva de entrenamiento que no necesita tiempos de acceso de nanosegundos.

Por qué los discos duros todavía funcionan para la IA

También hay otro malentendido que vale la pena aclarar: muchas personas asumen que los discos duros son demasiado lentos para ser útiles en entornos de IA.

Eso no es del todo cierto.

Un solo disco duro es lento comparado con DRAM o NAND flash, sí. Pero los centros de datos de IA no operan con discos individuales. Operan con enormes arreglos de almacenamiento con acceso paralelo a través de miles de discos al mismo tiempo.

Más importante aún, muchas cargas de trabajo de IA implican streaming secuencial de grandes datasets en lugar de pequeñas transacciones aleatorias. Las cargas secuenciales resultan ser una de las áreas donde los arreglos modernos de discos duros empresariales todavía rinden sorprendentemente bien.

En otras palabras, la infraestructura de IA no siempre está preguntando: “¿Cuál es el almacenamiento más rápido posible?”

A veces está preguntando:

¿Cuál es la forma práctica más rápida de almacenar 500 petabytes sin llevar a la empresa a la quiebra?

Ese es un problema de ingeniería muy diferente.

La infraestructura de IA se está convirtiendo en un ecosistema de memoria por capas

Esto también explica por qué las tecnologías más nuevas se están incorporando en capas dentro de los sistemas de IA, en lugar de reemplazar por completo a las tecnologías más antiguas.

En nuestro artículo sobre Storage Class Memory: la capa que falta entre DRAM y NAND, exploramos cómo la industria sigue creando capas intermedias para equilibrar velocidad, persistencia y economía.

También analizamos cómo NAND intenta acercarse al rendimiento de nivel memoria en: High Bandwidth Flash: ¿por fin la NAND puede comportarse como memoria?.

La infraestructura de IA se está convirtiendo exactamente en eso: un ecosistema de memoria por capas.

La HBM maneja el cálculo inmediato. La DRAM gestiona las cargas de trabajo activas. La NAND flash absorbe tareas rápidas de almacenamiento persistente. Las tecnologías storage-class intentan cerrar las brechas de latencia. Los discos duros proporcionan la enorme base de capacidad debajo de todo lo demás.

El futuro del almacenamiento para IA no es una tecnología reemplazando a otra.

Son múltiples tecnologías apilándose juntas porque ningún tipo de memoria resuelve bien todos los problemas.

Ese probablemente sea el mayor malentendido alrededor de la infraestructura de IA hoy. La gente asume que la tecnología más nueva automáticamente elimina a la anterior.

Pero la historia rara vez funciona así en la computación.

Los discos duros sobrevivieron a los SSD porque el mundo siguió produciendo más datos más rápido de lo que los precios de la flash podían bajar. Ahora la IA está acelerando todavía más esa tendencia. La cantidad de información que se genera, conserva, copia y vuelve a entrenar está explotando tan rápido que la capacidad misma se ha convertido en un recurso estratégico.

Irónicamente, mientras más avanzada se vuelve la IA, más importante se vuelve también la infraestructura de almacenamiento a gran escala.

Lo que significa que una de las tecnologías más antiguas del centro de datos puede seguir desempeñando un papel crítico en la IA durante mucho más tiempo de lo que la mayoría esperaba.

Nota editorial: Este artículo forma parte de la serie continua sobre infraestructura de IA y arquitectura de memoria publicada por GetUSB.info. El artículo fue investigado y escrito con apoyo editorial asistido por IA para estructura y legibilidad, y después fue revisado y refinado por el equipo editorial de GetUSB para precisión técnica, continuidad y claridad.

La imagen que acompaña este artículo es una fotografía original capturada por el equipo de GetUSB.info y no es fotografía de stock.

Los chips NAND contienen casi nada de petróleo – pero los precios del petróleo siguen importando

Mike McCrosky 6 mayo 2026 Memoria flash y hardware

A primera vista, un chip de memoria NAND y un barril de petróleo crudo parecen cosas completamente desconectadas.

Infografía que muestra cómo la memoria NAND se construye capa por capa usando gases especializados dentro de una cámara de fabricación de semiconductores

Uno pertenece a un mundo de obleas de silicio, salas limpias, láseres microscópicos y química avanzada. El otro viene de plataformas de perforación, oleoductos, buques petroleros y refinerías.

Pero cuando suben los precios del petróleo, la industria NAND lo siente sorprendentemente rápido.

La parte confusa es esta: los chips NAND en sí contienen casi nada de petróleo.

Eso suena contradictorio hasta que entiendes cómo funciona realmente la fabricación moderna de semiconductores. El chip puede ser diminuto, pero el mundo industrial necesario para crearlo es enorme.

La NAND comienza con arena, no con petróleo

La memoria NAND se construye a partir de silicio, que en última instancia proviene de cuarzo y arena altamente refinados.

El proceso de fabricación es difícil de imaginar porque ocurre a escalas demasiado pequeñas para que el ojo humano las entienda de manera natural. Una de las formas más sencillas de pensarlo es como pintar con aerosol a escala microscópica.

Dentro de una fábrica de semiconductores, una delgada oblea de silicio se coloca en una cámara de vacío mientras se introducen gases especializados bajo condiciones de calor y plasma cuidadosamente controladas. Esos gases reaccionan y dejan sobre la superficie de la oblea capas de material del grosor de unos pocos átomos.

Imagina pintar una superficie con aerosol, una capa microscópica a la vez, excepto que la pintura tiene que caer con una precisión casi perfecta sobre toda una oblea. Luego imagina repetir ese proceso cientos de veces.

La NAND 3D moderna es, básicamente, un rascacielos vertical de celdas de memoria apiladas capa sobre capa. De ahí vienen términos de la industria como “NAND de 200 capas” o “NAND de 300 capas”.

Entonces, ¿por qué importa el petróleo?

El petróleo no se convierte directamente en el chip de memoria.

En cambio, el petróleo alimenta el gigantesco ecosistema industrial que permite que el chip exista en primer lugar.

Una fábrica moderna de semiconductores se parece menos a una fábrica tradicional de electrónica y más a una estación espacial en la Tierra. El ambiente interior tiene que mantenerse extraordinariamente controlado cada segundo de cada día.

El aire dentro de una fab se filtra y recircula constantemente porque incluso partículas microscópicas de polvo pueden destruir la producción. Las temperaturas se controlan con mucha precisión porque pequeñas fluctuaciones pueden afectar el rendimiento. Enormes sistemas de vacío mueven gases por las cámaras de proceso sin parar. Los sistemas de purificación de agua producen agua ultrapura, más limpia de lo que la mayoría de la gente podría imaginar beber.

Aunque el chip de memoria final casi no pesa nada, la infraestructura que sostiene su creación se extiende por edificios gigantescos, plantas de gases industriales, redes eléctricas, proveedores químicos, flotas de transporte y sistemas logísticos globales.

Ahí es donde entra el petróleo en la historia.

El petróleo afecta los costos de transporte, los químicos industriales, los plásticos, las resinas epoxi, los precios de carga, la generación eléctrica y un sinfín de sistemas de apoyo alrededor de la producción de semiconductores. Incluso la cubierta protectora negra alrededor de muchos paquetes NAND se remonta, de una forma u otra, a materiales petroquímicos.

La infraestructura invisible detrás de un chip diminuto

La mayoría de la gente mira una memoria USB o un SSD y ve un pequeño producto electrónico.

Lo que no ve es la infraestructura invisible detrás de él. Los artículos que muestran cómo funciona la memoria flash suelen sorprender a la gente porque el entorno de fabricación se parece más a un laboratorio científico que a una línea tradicional de ensamblaje electrónico.

No ven las salas limpias moviendo y filtrando enormes volúmenes de aire cada minuto. No ven los sistemas de refinación química produciendo gases especializados ultrapuros. No ven la demanda constante de energía necesaria para mantener estables estas fábricas durante todo el día y toda la noche.

Y definitivamente no ven la red global de transporte que mueve materias primas, obleas, controladores, sustratos, chips terminados y productos empaquetados entre países antes de que el dispositivo final llegue siquiera al estante de una tienda.

La cantidad física de petróleo relacionada con un solo chip NAND en realidad es muy pequeña. Un galón de petróleo no “hace” un chip de memoria.

En realidad, ese mismo galón puede apoyar indirectamente sistemas de transporte, procesamiento químico, generación eléctrica, fabricación de plásticos y operaciones industriales que, en conjunto, ayudan a producir miles de dispositivos NAND.

Eso es lo que hace que los semiconductores sean tan fascinantes. El valor no está en la materia prima en sí. El valor viene de la precisión, la ingeniería, la química y la infraestructura impresionantes que se necesitan para fabricar memoria confiable a escalas microscópicas.

Por qué los precios de la NAND pueden reaccionar tan rápido

La NAND también se comporta de forma distinta a muchos otros productos tecnológicos.

Un smartphone o una cámara premium pueden mantener precios relativamente estables durante meses. La memoria NAND no siempre funciona así. Los precios de la memoria pueden moverse rápido porque el mercado se comporta más como un mercado de materias primas que como un mercado de electrónica de lujo.

Cuando los precios del petróleo suben bruscamente, el envío se vuelve más caro. Los costos químicos aumentan. Los gastos operativos de las fábricas suben. Los costos de carga aumentan casi de inmediato, especialmente en el transporte aéreo.

Incluso la incertidumbre por sí sola puede crear presión en el mercado, porque los proveedores y distribuidores se vuelven más cautelosos con el inventario y los costos futuros.

La relación entre el petróleo y la NAND es indirecta, pero es absolutamente real.

La realidad más amplia

Durante años, los semiconductores se discutieron principalmente como una historia puramente tecnológica. Transistores más pequeños. Chips más rápidos. Más capacidad de almacenamiento.

Pero la fabricación moderna de semiconductores también es una historia de energía, una historia de química y una historia de logística.

La memoria NAND está hecha de silicio, pero sobrevive gracias a un sistema industrial global impulsado por electricidad, transporte, refinación e infraestructura de fabricación avanzada.

El petróleo no se convierte en NAND.

El petróleo alimenta el mundo que hace posible la NAND.

Nota EEAT: Este artículo fue creado con estructura y edición asistidas por IA, con la dirección final, revisión técnica y desarrollo del tema guiados por el autor. El objetivo es explicar relaciones complejas entre semiconductores e infraestructura industrial de una manera práctica y fácil de entender para el lector.

Por qué la DRAM sola ya no puede seguirle el ritmo a la IA

Mike McCrosky 21 abril 2026 Memoria flash y hardware

fast compute slow data idle gpu wasted cost ai doesnt wait

En cuanto empiezas a fijarte en cómo están construidos realmente los sistemas de IA, hay una conclusión muy natural a la que la gente suele llegar y, para ser justos, al principio suena perfectamente razonable.

Si NAND es demasiado lento para ciertas partes de la carga de trabajo, e incluso las arquitecturas flash avanzadas siguen introduciendo suficiente retraso como para importar, entonces la respuesta obvia parecería ser agregar más DRAM. Después de todo, la DRAM siempre ha sido la capa rápida. Es donde viven los datos activos, responde con rapidez y, durante décadas, ha sido la parte del sistema en la que te apoyas cuando no quieres que el procesador se quede inactivo esperando a que algo llegue.

Así que la suposición es fácil de hacer: si el problema es la velocidad, entonces amplía lo más rápido que ya tienes.

Esa lógica se sostiene bastante bien hasta que entra la IA en escena y empieza a empujar a la DRAM hacia un papel para el que nunca fue realmente diseñada. El problema no es que la DRAM se haya vuelto de repente lenta, obsoleta o de algún modo menos útil que antes. El problema es que las cargas de trabajo de IA le están pidiendo mucho más que simplemente actuar como una capa rápida de trabajo entre compute y almacenamiento.

Para entender mejor el marco general detrás de este cambio, este artículo se conecta directamente con la pieza principal de esta serie: NAND no va a desaparecer, pero los servidores de IA ahora dependen de algo más que solo flash.

La DRAM fue construida para la velocidad, no para cargar con todo el sistema

Lo primero que hay que entender es que la DRAM siempre ha estado optimizada para la velocidad y la capacidad de respuesta, no para almacenar cantidades enormes de datos a gran escala. En la computación tradicional, esa diferencia rara vez era un problema porque la mayoría de las cargas de trabajo tenían una separación bastante clara entre los datos activos y los datos almacenados. El sistema mantenía en memoria lo que necesitaba de inmediato, traía el resto desde el almacenamiento cuando hacía falta y esa transferencia normalmente era lo bastante buena como para que nadie pensara demasiado en ello.

La IA cambia ese equilibrio de forma bastante drástica. En lugar de trabajar con pequeños bloques de datos activos y seguir adelante, los modelos de IA tienden a volver una y otra vez sobre grandes conjuntos de datos, mover información en paralelo y mantener una parte mucho más grande del working set al alcance de la capa de compute durante períodos mucho más largos. Eso significa que ya no se le pide a la DRAM simplemente que conserve la tarea actual. Ahora se le pide ayudar a sostener una enorme masa de datos, en constante cambio, que el sistema quiere tener cerca prácticamente todo el tiempo.

Ese es un trabajo muy distinto.

Y esa es también la razón por la que las tecnologías por encima y alrededor de la DRAM se han vuelto más importantes. En el artículo anterior sobre qué es la High Bandwidth Memory y por qué la IA depende de ella, el enfoque estaba en mover una cantidad más pequeña de datos críticos extremadamente cerca del procesador para que la GPU siga alimentada. Ese artículo deja claro que la proximidad importa, pero también revela silenciosamente el siguiente problema, porque una vez que el working set crece más allá de esa capa inmediata, el sistema todavía tiene que decidir dónde va a vivir todo lo demás.

La primera pared es el costo, y aparece muy rápido

Una de las razones por las que a la gente le gusta la idea de “simplemente agregar más DRAM” es que suena limpia y directa. En la práctica, se vuelve costosa muy rápido. La DRAM simplemente no tiene el mismo precio que NAND y, en cuanto empiezas a escalar sistemas al terreno de la IA, ya no estás hablando de agregar un poco más de memoria a un servidor. Estás hablando de cientos de gigabytes, a veces mucho más, repartidos entre muchos nodos, racks y clústeres.

En ese punto, la DRAM deja de sentirse como una mejora de rendimiento y empieza a parecer una carga de infraestructura. La curva de costos no sube suavemente. Sube con suficiente rapidez como para que la idea de usar DRAM para resolver todos los problemas de localidad de datos empiece a desmoronarse bajo su propia economía.

Esa es una de las razones por las que la pila de memoria se está volviendo más profunda en lugar de más simple. La industria no se está alejando de la DRAM porque haya dejado de ser valiosa. Se está alejando de la suposición de que la DRAM sola puede ser la respuesta a todos los problemas sensibles a la latencia a escala de IA.

La segunda pared es la energía, y ese problema nunca duerme

Incluso si el costo fuera más fácil de justificar, la DRAM todavía tropieza con otro problema que se vuelve imposible de ignorar una vez que los sistemas alcanzan cierto tamaño, y ese problema es la energía. La DRAM debe mantenerse constantemente alimentada para conservar su estado. Eso es simplemente parte de la tecnología. Así que, cuanto más agregas, más energía consume el sistema solo para mantener esos datos ahí, listos para usarse.

En entornos pequeños, esa sobrecarga puede parecer aceptable. En sistemas de IA densos que funcionan de manera continua, empieza a convertirse en un problema operativo importante. Más DRAM significa más consumo eléctrico, más calor, más refrigeración y más presión de diseño sobre toda la plataforma. De pronto, la decisión ya no trata solo de capacidad de memoria. Trata de límites térmicos, eficiencia del centro de datos y de si la infraestructura de soporte puede absorber el costo de mantener viva tanta memoria activa las veinticuatro horas del día.

Aquí es también donde el papel de las capas intermedias empieza a tener más sentido. En la entrega anterior sobre Storage Class Memory, la capa que falta entre DRAM y NAND, la idea no era reemplazar la DRAM, sino aliviar parte de la presión sobre ella introduciendo una capa que mantenga más datos cerca del compute sin obligar a que todo termine en el nivel más costoso y más hambriento de energía.

Luego está la realidad física de la proximidad

Hay otra razón por la que la DRAM no escala infinitamente bien en los sistemas de IA, y tiene menos que ver con el presupuesto y más con la física. La DRAM aporta valor en parte porque se encuentra relativamente cerca del procesador. Cuanto más cerca está la memoria del compute, menor suele ser la latencia y más ágil se siente el sistema en general. Pero la proximidad no es algo que puedas expandir para siempre sin consecuencias.

Existen límites físicos a la cantidad de memoria que puede colocarse cerca de una CPU o GPU antes de que la complejidad del diseño, la longitud de las trazas, la integridad de la señal y las restricciones de encapsulado empiecen a jugar en tu contra. Esa es exactamente la razón por la que apareció el empaquetado avanzado de memoria en primer lugar. La HBM existe porque la colocación tradicional de la DRAM solo puede llegar hasta cierto punto, y una vez que el lado de compute se vuelve lo bastante rápido, esas distancias y esos recorridos empiezan a importar más de lo que importaban antes.

Pero la HBM tampoco es una respuesta completa en términos de capacidad. Ofrece un ancho de banda increíble, pero no un volumen ilimitado. Así que el sistema termina viviendo en un equilibrio constante entre lo que puede colocarse muy cerca y lo que tiene que permanecer más lejos. Las cargas de trabajo de IA tensan ese equilibrio mucho más de lo que jamás lo hicieron los sistemas convencionales.

La IA hace que los pequeños retrasos salgan caros

Una de las cosas más interesantes de la infraestructura de IA es que expone ineficiencias que las cargas de trabajo más antiguas podían ocultar casi por completo. En un sistema más tradicional, un pequeño retraso en el acceso a los datos quizá no signifique gran cosa. El procesador espera un poco, la tarea termina un poco más tarde y el usuario ni se entera. Los sistemas de IA son mucho menos tolerantes porque operan con muchísimo paralelismo y con una enorme cantidad de dinero atada a la capa de compute.

Si una GPU no recibe los datos cuando los necesita, eso no es solo una molestia técnica. Es tiempo muerto costoso. Multiplica eso por muchos aceleradores funcionando en paralelo y hasta retrasos muy pequeños empiezan a aparecer como pérdidas reales de utilización.

Eso cambia el objetivo. El objetivo no es simplemente tener memoria rápida. El objetivo es mantener una entrega de datos lo bastante consistente, a una escala lo bastante grande, como para mantener ocupadas todo el tiempo las partes más caras del sistema. Ese es un requisito mucho más duro, y es exactamente por eso que la DRAM sola empieza a parecer insuficiente una vez que la infraestructura de IA crece más allá de cierto punto.

ai warehouse analogy data flow memory hierarchy dram bottleneck loading dock

La analogía del almacén sigue funcionando, solo que ahora es más grande

Si seguimos usando la misma analogía del almacén de los artículos anteriores, la DRAM sigue siendo el muelle de carga. Es donde ocurre el trabajo activo, donde los elementos se abren, se clasifican y se mueven hacia el uso inmediato. Durante años, ese modelo funcionó bien porque la cantidad de actividad en el muelle era manejable y el sistema no exigía que todo estuviera preparado ahí al mismo tiempo.

La IA cambia la escala de toda la operación. Ahora se espera que el muelle soporte un flujo casi constante de material, con mucha más actividad ocurriendo en paralelo y con mucha menos tolerancia al retraso. En algún punto, incluso el mejor muelle de carga no puede seguir creciendo sin más. Solo hay cierto espacio, solo cierto número de movimientos paralelos que pueden ocurrir con eficiencia y solo cierta cantidad de inventario que puedes mantener directamente en el punto de uso antes de que el propio diseño se convierta en parte del problema.

Así que la respuesta no es hacer el muelle infinitamente más grande. La respuesta es rediseñar el flujo de trabajo alrededor de él.

Ahí es donde el resto de la jerarquía de memoria empieza a ganarse su lugar. La HBM mantiene los datos más sensibles al tiempo justo al lado del procesador. La Storage Class Memory ayuda a suavizar la transición entre la memoria activa y el almacenamiento más lento. Y en el artículo más reciente sobre por qué los sistemas modernos de inteligencia artificial consumen tanta memoria, el enfoque se desplazó hacia cómo también se está rediseñando el lado del almacenamiento para que pueda participar de forma más inteligente en alimentar al sistema.

Ninguna de esas capas existe porque la DRAM haya fallado. Existen porque la IA ya superó la idea de que una sola capa rápida pudiera cargar por sí sola con toda la carga de trabajo.

Lo que esto realmente significa para la pila de memoria de la IA

La verdadera conclusión aquí no es que la DRAM vaya a desaparecer, porque claramente no es así. La DRAM sigue siendo una de las partes más importantes de toda la pila. Lo que está cambiando es su papel. En vez de ser el lugar donde se supone que vive todo lo activo, la DRAM se está convirtiendo en el lugar donde viven los datos más urgentes y más sensibles al tiempo, mientras otras capas se encargan de la creciente carga de escala, costo y capacidad.

Ese es un cambio sutil, pero importante. Significa que la infraestructura de IA se está alejando de la vieja idea de un modelo simple de dos capas – memoria aquí, almacenamiento allá – y se está moviendo hacia algo mucho más matizado, donde a cada tecnología se le pide manejar la parte de la carga de trabajo para la que está mejor adaptada.

Dicho de forma simple, la DRAM sigue siendo esencial, pero por sí sola ya no basta. La IA ha cambiado el tamaño del working set, la velocidad del compute, el costo del retraso y la economía de mantenerlo todo cerca. Cuando todo eso cambia al mismo tiempo, la jerarquía de memoria también tiene que cambiar con ello.

Hacia dónde lleva esto después

Una vez que aceptas que la DRAM no puede estirarse lo suficiente como para contener todo lo que la IA quiere cerca del compute, la siguiente pregunta se vuelve bastante obvia. ¿Dónde vive realmente el resto de esos datos, especialmente cuando la cantidad de información involucrada es demasiado grande como para justificar mantenerla en memoria?

Ahí es donde la conversación vuelve a girar, y una tecnología que mucha gente supone que ya quedó relegada empieza a importar de una manera sorprendentemente importante. Porque, mientras la DRAM lucha con la escala y el flash sigue arrastrando sus propias compensaciones de costo y latencia, los discos duros siguen ofreciendo algo que el resto de la pila no puede reemplazar fácilmente: capacidad práctica a volumen masivo.

Y exactamente por eso la próxima parte de esta serie tendrá que examinar por qué los discos duros siguen siendo críticos para la infraestructura de IA.

Sobre el autor
Este artículo fue desarrollado bajo la dirección de Greg Morris, colaborador de larga trayectoria en GetUSB.info con más de dos décadas de experiencia en tecnología USB, comportamiento de la memoria flash y sistemas de almacenamiento de datos. La perspectiva presentada aquí refleja conocimiento práctico de la industria y un análisis continuo de cómo se comportan los sistemas reales bajo cargas de trabajo en evolución, incluida la infraestructura de IA.

Cómo se creó este artículo
Los conceptos, la estructura y la dirección técnica de este artículo fueron elaborados y revisados por un experto humano en la materia. Se utilizaron herramientas de IA para ayudar con el ritmo, la fluidez y la legibilidad, organizando ideas complejas en una narrativa más natural sin alterar la precisión técnica subyacente ni la intención original.

Sobre las imágenes
Las imágenes utilizadas en este artículo fueron creadas específicamente para ilustrar conceptos que son difíciles de capturar con fotografía de stock tradicional, como cuellos de botella en el flujo de datos, comportamiento de la jerarquía de memoria e ineficiencias a nivel de sistema. Las imágenes están diseñadas para reforzar las explicaciones técnicas y mejorar la claridad para los lectores.

Por qué es tan difícil creer que una memoria USB pueda escribir a 400MB/sec – y aun así seguir siendo precisa

Mike McCrosky 16 abril 2026 Memoria flash y hardware

Celdas diminutas, velocidad enorme y aun así precisión. No es magia, es ingeniería.

por qué es tan difícil creer que una memoria usb pueda escribir a 400 mb por segundo

En algún momento ves una memoria USB con una velocidad anunciada de 400MB por segundo y piensas… no hay forma de que eso sea real. O al menos, no hay forma de que lo esté haciendo con precisión.

Se siente demasiado rápido. Demasiado limpio. Demasiado perfecto. Como si algo tuviera que ceder.

Ese instinto no está mal – solo está basado en cómo entendemos la velocidad en el mundo real. Cuando las personas se mueven más rápido, ocurren errores. Cuando los sistemas se apresuran, las cosas se vuelven descuidadas. Así que cuando escuchas “400MB por segundo”, tu cerebro lo traduce en silencio como “seguramente se están saltando algo”.

Pero la memoria flash no funciona como creemos que funciona.

Lo primero que hay que entender es esto: una memoria USB no está escribiendo una sola corriente de datos realmente, realmente rápido. Está escribiendo muchos bloques más pequeños de datos al mismo tiempo, a través de múltiples áreas de memoria, todas trabajando en paralelo.

Así que, en lugar de un solo proceso moviéndose a velocidad extrema, tienes docenas de procesos más pequeños moviéndose a un ritmo muy controlado y muy manejable. El resultado se ve rápido desde afuera, pero por dentro es organizado, distribuido y deliberado.

Piénsalo como un almacén.

Si una sola persona tuviera que cargar 400 cajas en un camión cada segundo, sería un caos. Las cajas se caerían, se etiquetarían mal o simplemente se perderían por completo. Esa es la imagen mental que la mayoría de la gente tiene cuando escucha “400MB por segundo”.

Pero eso no es lo que está pasando.

En su lugar, imagina 40 cintas transportadoras, cada una con trabajadores colocando una caja a la vez. Cada caja se escanea, se verifica y se coloca correctamente antes de seguir adelante. Nadie está corriendo. Nadie está sobrepasado. Y aun así, la producción total es enorme porque todo está ocurriendo al mismo tiempo.

Así es como la memoria flash logra velocidad sin sacrificar precisión.

Dentro de la memoria USB, un controlador actúa como un administrador del tráfico. Divide los datos entrantes en piezas más pequeñas y distribuye esas piezas a través de múltiples chips de memoria flash NAND. Cada chip escribe su parte de forma independiente, muchas veces en paralelo con los demás. El sistema está diseñado para escalar el rendimiento multiplicando el esfuerzo, no empujando una sola ruta más allá de sus límites.

Y aquí es donde se vuelve todavía más interesante.

La memoria flash no es perfecta – se está corrigiendo constantemente a sí misma

Lo que es fácil pasar por alto es lo constante que realmente es este proceso. Cada pequeño bloque de datos que se escribe en la flash se revisa de inmediato y, si hace falta, se corrige antes de que el sistema continúe. Esto no es una red de seguridad que se usa una sola vez – está ocurriendo continuamente en todas las áreas de memoria, al mismo tiempo, mientras todavía se siguen escribiendo datos nuevos. El sistema siempre está escribiendo, verificando y ajustando en paralelo.

Esta es la parte que la mayoría de la gente no se da cuenta, y es lo que hace que todo el sistema funcione.

La memoria flash NAND no es inherentemente perfecta. A nivel físico, almacenar datos significa colocar carga eléctrica dentro de celdas diminutas. Esas cargas pueden desviarse un poco. Las escrituras pueden quedar apenas fuera de lugar. Los pequeños errores no solo son posibles – son esperados.

Por eso el sistema está construido alrededor de esa realidad.

Cada vez que se escriben datos, el controlador revisa el resultado. Si algo no quedó del todo bien, ajusta y vuelve a escribir los datos. Junto con los datos reales, también se almacena información adicional específicamente para la corrección de errores. Cuando los datos se leen de nuevo, el controlador utiliza esa información extra para detectar y corregir cualquier inconsistencia al instante.

A nivel físico, escribir en NAND no es una sola acción – es una secuencia rápida. El controlador aplica un voltaje preciso para almacenar carga en una celda, verifica de inmediato si esa carga cayó donde debía caer y, si no fue así, ajusta e intenta de nuevo. Esto ocurre en microsegundos, y sucede una y otra vez hasta que los datos quedan escritos correctamente.

Esto sucede tan rápido que nunca lo ves. Pero está ocurriendo todo el tiempo.

En otras palabras, la precisión no viene de la perfección. Viene de la verificación y corrección constante a velocidad de máquina.

Por eso una memoria USB puede mover datos a cientos de megabytes por segundo y aun así mantener la integridad de los datos. No está escribiendo a ciegas y esperando lo mejor. Está escribiendo, comprobando, corrigiendo y confirmando cada paso del proceso.

Así que la próxima vez que veas una especificación como 400MB/sec, ayuda replantear lo que realmente significa ese número.

No es una sola cosa moviéndose a una velocidad imposible. Es un sistema coordinado de muchas operaciones más pequeñas, todas trabajando juntas, todas siendo revisadas y todas diseñadas con la expectativa de que habrá errores – y de que serán corregidos de inmediato.

La flash no es rápida porque se apresura. Es rápida porque multiplica.

Cómo se creó este artículo

Este artículo fue desarrollado a partir de experiencia real trabajando con memoria flash USB, arquitectura NAND y comportamiento de controladores a nivel bajo. El objetivo fue explicar un concepto que a menudo se malinterpreta – no añadiendo complejidad, sino simplificando cómo funciona realmente el sistema.

La ilustración de laboratorio con estilo caricatura usada en esta publicación fue creada intencionalmente para visualizar la idea de que la memoria flash opera mediante procesos paralelos y verificación constante, no mediante una sola acción apresurada. Aunque la imagen es estilizada, refleja un principio de ingeniería muy real: muchas operaciones pequeñas y controladas ocurriendo a la vez, cada una validada antes de completarse.

En la práctica, así es exactamente como los sistemas flash modernos logran tanto alta velocidad como precisión en los datos. La imagen busca hacer que ese concepto sea más fácil de captar de un vistazo – especialmente para los lectores que entienden mejor los sistemas cuando pueden imaginarlos visualmente.

Todas las explicaciones técnicas han sido revisadas para asegurar que representen con precisión cómo se comporta la memoria flash NAND en aplicaciones del mundo real.

Autor: Mike McCrosky – Especialista en sistemas de almacenamiento USB y duplicación

High Bandwidth Flash: ¿por fin la NAND puede comportarse como memoria?

Mike McCrosky 14 abril 2026 Memoria flash y hardware

high bandwidth flash can nand finally act like memory

La infraestructura de IA tiene una forma muy particular de dejar al descubierto límites que la mayoría de los sistemas nunca llegan a encontrar.

En los artículos anteriores vimos cómo la high bandwidth memory para cargas de trabajo de IA mantiene los datos lo más cerca posible de la GPU, y cómo la storage class memory entre DRAM y NAND ayuda a suavizar la brecha entre la memoria activa y el almacenamiento flash tradicional. Ambas capas existen porque el sistema no puede darse el lujo de esperar, ni siquiera por períodos cortos de tiempo, sin perder eficiencia.

Pero hay otra dirección hacia la que se está moviendo la industria, y no implica introducir un tipo de memoria completamente nuevo.

Más bien, se trata de tomar algo que ya existe, la memoria flash NAND, y empujarla hacia un papel para el que originalmente no fue diseñada.

Ahí es donde la idea de High Bandwidth Flash empieza a entrar en la conversación.

El problema que la NAND nunca estuvo pensada para resolver

La memoria flash NAND siempre se ha construido alrededor de una idea sencilla: almacenar una gran cantidad de datos de forma eficiente y recuperarlos cuando sea necesario.

Para la mayoría de las cargas de trabajo, ese modelo funciona perfectamente bien. Los datos permanecen en el almacenamiento, el sistema los solicita y el SSD los entrega con suficiente rapidez como para que casi nadie note realmente la demora.

Las cargas de trabajo de IA cambian esa dinámica.

En lugar de lecturas y escrituras ocasionales, estos sistemas están extrayendo datos en paralelo de forma constante, a menudo a través de miles de hilos, con muy poca tolerancia a cualquier inconsistencia en la entrega. No se trata solo de velocidad de manera aislada, sino de mantener un flujo constante de datos que mantenga el lado de cómputo totalmente aprovechado.

Ahí es donde el comportamiento tradicional de la NAND empieza a mostrar sus límites.

Incluso las unidades NVMe de alto rendimiento, con colas profundas y cifras sólidas de rendimiento, siguen operando dentro de un modelo de almacenamiento que asume ráfagas de actividad, no un flujo continuo de acceso parecido a la memoria.

Así que la pregunta pasa a ser esta: ¿qué sucede si dejas de tratar la NAND como almacenamiento y empiezas a tratarla más como parte del sistema de memoria?

Qué significa realmente “High Bandwidth Flash”

High Bandwidth Flash no es un estándar formal ni una sola categoría de producto.

Se entiende mejor como una dirección arquitectónica, y ahí es donde empieza a separarse de lo que cubrimos en High Bandwidth Memory.

La High Bandwidth Memory sigue siendo memoria. Es DRAM, construida y ubicada para ofrecer un acceso extremadamente rápido al estar físicamente cerca del procesador. Todo el sentido de HBM es la proximidad y la reducción de la latencia, llevar los datos lo más cerca posible del cómputo para que puedan ser accedidos casi al instante.

High Bandwidth Flash está resolviendo un problema diferente. Acepta que la NAND está más lejos dentro del sistema y que arrastra una latencia más alta, y en cambio se enfoca en cómo mover cantidades mucho mayores de datos en paralelo para que esa distancia importe menos.

En términos simples, HBM consiste en hacer que la memoria sea más rápida acercándola. High Bandwidth Flash consiste en hacer que el almacenamiento se comporte más rápido cambiando la manera en que se accede a él.

Esa distinción importa, porque el objetivo aquí no es convertir la NAND en DRAM. Es hacer que la NAND sea útil en situaciones donde el almacenamiento tradicional, de otro modo, ralentizaría el sistema.

El cambio ocurre a nivel de sistema, no solo a nivel del medio.

En lugar de un solo SSD atendiendo solicitudes de la forma tradicional, empiezas a ver muchos canales NAND operando en paralelo, controladores diseñados para concurrencia más que solo para capacidad, rutas de datos más amplias a través de interfaces PCIe Gen5 y Gen6, y capas de software que anticipan y preparan los datos antes de que se soliciten.

Tomados en conjunto, estos cambios no eliminan la latencia inherente de la NAND, pero sí reducen la frecuencia con la que esa latencia se convierte en el factor limitante dentro del sistema.

Una forma distinta de pensar en el ancho de banda

Cuando la gente escucha “alto ancho de banda”, normalmente asume que se trata de velocidad bruta.

Pero en este contexto, el ancho de banda en realidad tiene más que ver con cuántos datos se pueden mover al mismo tiempo y con qué consistencia puede mantenerse ese movimiento.

Las cargas de trabajo de IA no solo necesitan acceso rápido, necesitan acceso predecible a escala.

Si un clúster de GPU está extrayendo datos de forma desigual, incluso pequeñas variaciones pueden hacer que partes del sistema se detengan. Multiplica eso por cientos o miles de nodos, y esas ineficiencias empiezan a aparecer de maneras que se vuelven difíciles de ignorar.

High Bandwidth Flash es un intento de suavizar todo eso, no eliminando las características de la NAND, sino rodeándola con suficiente paralelismo e inteligencia para que esas características pesen menos en el sistema en su conjunto.

Extendiendo la analogía del almacén

Si seguimos usando el mismo modelo de almacén de los artículos anteriores, la NAND siempre ha sido el piso principal de almacenamiento.

Es donde vive todo, organizado en filas y estantes, optimizado para densidad y eficiencia más que para velocidad de acceso.

La DRAM es el muelle de carga, donde ocurre el trabajo activo. La SCM es el área de preparación justo detrás.

High Bandwidth Flash cambia la forma en que opera el almacén.

En lugar de un solo trabajador entrando en los pasillos para recoger artículos uno por uno, ahora tienes varios muelles de carga abiertos al mismo tiempo, varios montacargas moviéndose en paralelo, y artículos preposicionados según lo que el sistema espera necesitar después.

El almacén no ha cambiado en lo fundamental, pero sí ha cambiado la manera en que se accede a él.

No estás convirtiendo el almacén en el muelle de carga, estás haciendo que el almacén se comporte como si estuviera mucho más cerca de él.

Cómo se está construyendo esto en la práctica

La mayor parte de lo que permite High Bandwidth Flash no proviene de la propia NAND, sino de las capas que la rodean.

Los controladores ahora desempeñan un papel más importante en la forma en que se distribuyen los datos, centrándose en operaciones paralelas a través de múltiples dies y canales NAND en lugar de simplemente gestionar capacidad y desgaste. Al mismo tiempo, el ancho de banda de las interfaces sigue expandiéndose, dando a estos sistemas más margen para mover datos sin quedar limitados por el bus.

Lo que marca la mayor diferencia, sin embargo, es cómo interactúa el software con el hardware.

Los datos ya no se recuperan solo cuando se solicitan. Se predicen, se preparan, se almacenan en caché y se organizan de maneras que encajan con la forma en que se comportan las cargas de trabajo de IA. Eso significa anticipar patrones de acceso, mantener los datos usados con más frecuencia más cerca de la parte superior del stack y minimizar cuántas veces el sistema tiene que volver a rutas más lentas.

Nada de esto convierte a la NAND en memoria verdadera, pero sí le permite participar en el sistema de memoria de una forma más activa que antes.

Lo que todavía no es

Con todo este avance, es importante mantener las expectativas bien aterrizadas.

High Bandwidth Flash no hace que la NAND sea equivalente a la DRAM. Sigue estando basada en bloques, sigue teniendo una latencia mayor que cualquier forma de memoria real y sigue dependiendo en gran medida de controladores y software para rendir bien en entornos exigentes.

Esas limitaciones no desaparecen, simplemente se gestionan de forma más eficaz mediante el diseño del sistema.

Dónde encaja esto en la infraestructura de IA

En despliegues del mundo real, High Bandwidth Flash está apareciendo en sistemas que necesitan manejar conjuntos de datos extremadamente grandes sin empujar todo hacia niveles de memoria costosos.

Lo que esto realmente se ve en la práctica es un sistema que se apoya en la NAND de forma más activa que antes, no solo como un lugar donde se almacenan los datos, sino como parte de la ruta de datos de trabajo que alimenta los recursos de cómputo de una manera más continua.

En entornos de inferencia a gran escala, por ejemplo, los modelos y los datos de contexto a menudo superan lo que de forma realista cabe dentro de la DRAM. En lugar de forzarlo todo a la memoria, el sistema depende del acceso de alto rendimiento a la NAND, permitiendo que los datos fluyan lo suficientemente rápido como para comportarse más como una extensión de la memoria que como almacenamiento tradicional.

En entornos de entrenamiento, donde los conjuntos de datos se revisitan y procesan constantemente en paralelo, el objetivo cambia hacia mantener un flujo estable en lugar de manejar ráfagas aisladas. High Bandwidth Flash respalda eso manteniendo múltiples rutas de datos activas al mismo tiempo, reduciendo la posibilidad de que una sola solicitud se convierta en un cuello de botella.

Incluso en sistemas distribuidos con NVMe fabric, la idea sigue siendo la misma. Los datos están repartidos entre muchos dispositivos y nodos, pero se accede a ellos de forma coordinada, enfatizando el rendimiento sostenido y la disponibilidad por encima de la simple capacidad de almacenamiento. La NAND sigue haciendo el mismo trabajo fundamental, pero la forma en que el sistema interactúa con ella es mucho más dinámica de lo que solía ser.

El resultado final es que la NAND deja de comportarse como una capa distante en la parte inferior del stack y empieza a sentirse como parte del sistema activo, aunque nunca llegue por completo a las características de rendimiento de la memoria.

Por qué importa esta dirección

Si das un paso atrás y observas lo que está ocurriendo a lo largo de estos tres artículos, empieza a aparecer un patrón.

HBM acerca la memoria al cómputo. SCM reduce la brecha entre memoria y almacenamiento. High Bandwidth Flash empuja el almacenamiento más cerca de la memoria.

Todo está convergiendo hacia el mismo objetivo: reducir qué tan lejos tienen que viajar los datos y cuánto tiempo tiene que esperar el sistema por ellos.

Volviendo al panorama general

La NAND no va a desaparecer.

Si acaso, se está volviendo más importante, porque la cantidad total de datos que estos sistemas necesitan sigue creciendo.

Lo que está cambiando es cómo se está usando la NAND.

Ya no es solo una capa pasiva en la parte inferior del stack. Está siendo arrastrada hacia arriba, integrada más estrechamente y obligada a comportarse de maneras que se parecen cada vez más a la memoria, aunque nunca llegue a convertirse completamente en ella.

Ese cambio es exactamente lo que señalamos en la pieza original: la industria no reemplazó la NAND, construyó a su alrededor.

Qué viene después

A partir de aquí, el stack sigue evolucionando en ambas direcciones.

Arriba, la memoria se vuelve más rápida y más especializada. Abajo, el almacenamiento se vuelve más inteligente y más integrado. Y en algún punto en medio, la línea entre ambos sigue haciéndose cada vez más difícil de definir.

En la próxima entrega veremos cómo los sistemas de IA manejan los datos de trabajo en tiempo real y por qué conceptos como contexto y KV cache están empezando a influir en la forma en que memoria y almacenamiento se diseñan juntos.

Nota editorial

La perspectiva, la dirección y el enfoque técnico de este artículo fueron guiados por el autor, a partir de los temas específicos explorados a lo largo de la pieza y de la conversación más amplia sobre cómo la NAND está siendo empujada más cerca de la capa de memoria en la infraestructura de IA.

La IA se utilizó como asistente de redacción para ayudar con el ritmo, el flujo de las oraciones y la organización estructural, pero la dirección del tema, las comparaciones y la intención editorial final fueron determinadas por el autor.

La imagen que acompaña el artículo también fue creada con IA, no como una imagen genérica de stock, sino como una ilustración diseñada específicamente para reflejar conceptos propios del artículo que son difíciles de comunicar con imágenes convencionales, en particular la idea de que la memoria flash NAND se comporta más como una capa activa y adyacente a la memoria dentro de una arquitectura moderna de datos.

Todo el contenido fue revisado, refinado y aprobado por el autor antes de su publicación.

No puedes desfragmentar ni usar TRIM en una memoria USB – Aquí está la razón

Mike McCrosky 7 abril 2026 Memoria flash y hardware

why-defrag-and-trim-dont-apply-to-usb-flash-drives

Si llegaste aquí intentando desfragmentar una memoria USB o usar TRIM en una unidad flash USB, la razón por la que terminaste en un callejón sin salida es simple: esas herramientas no se aplican a las memorias USB de la misma manera que sí se aplican a los discos duros y a los SSD.

Encontraste este artículo porque estás intentando desfragmentar una memoria USB o usar TRIM en una unidad flash USB, y probablemente ya notaste algo frustrante – no existe ninguna opción para hacer ninguna de las dos cosas. No hay ajuste, no hay herramienta, no hay nada que funcione como sí ocurre con un disco duro o un SSD. Eso no es un error, ni es algo escondido en algún menú. Simplemente no puedes desfragmentar ni usar TRIM de forma confiable en una memoria USB, y una vez que entiendes cómo funcionan estos dispositivos, la razón se vuelve bastante clara.

Storage Class Memory explicada: la capa que falta entre DRAM y NAND

Mike McCrosky 4 abril 2026 Memoria flash y hardware

040426a storage class memory explained between dram and nand

En cuanto empiezas a fijarte en cómo los sistemas de IA están moviendo realmente los datos, te das cuenta bastante rápido de que el problema no es solo tener procesadores más rápidos o más almacenamiento, sino qué ocurre entre esas capas y cuántas veces el sistema se ve obligado a esperar.

En el artículo anterior sobre High Bandwidth Memory, el enfoque estaba en mantener los datos lo más cerca posible del procesador para que la GPU no se quede parada. Esa es la parte superior de la pila y es fundamental, pero solo resuelve una parte del problema, porque no todo puede vivir ahí.

En cuanto el conjunto de trabajo crece más allá de lo que cabe en ese nivel inmediato, vuelves a mover datos entre DRAM y NAND, y es ahí donde todo empieza a sentirse desequilibrado. La DRAM es rápida y responde bien, pero es cara y no se puede escalar sin límite. El NAND es mucho más práctico en términos de capacidad, pero incluso un buen flash introduce suficiente latencia como para que se note cuando el sistema está bajo carga constante.

Ese espacio intermedio es donde Storage Class Memory empieza a tener sentido. No como algo nuevo que sustituya a uno de los dos lados, sino como una forma de suavizar el paso de uno a otro para que el sistema no esté saltando continuamente entre muy rápido y claramente más lento.

Si quieres ver el contexto completo de por qué están apareciendo estas capas, esto conecta directamente con el artículo principal aquí: NAND no va a desaparecer, pero los servidores de IA ahora dependen de algo más que solo flash.

Qué es la High Bandwidth Memory (HBM) y por qué la IA depende de ella

Mike McCrosky 2 abril 2026 Memoria flash y hardware

qué es la high bandwidth memory hbm y por qué la inteligencia artificial depende de ella

Los sistemas de inteligencia artificial no suelen ralentizarse por limitaciones de cálculo, sino porque el sistema no puede mover los datos lo suficientemente rápido como para mantener al procesador constantemente alimentado de información.

En otras palabras, el cuello de botella no está en la capacidad de procesar datos, sino en la capacidad de entregar esos datos a la velocidad que requieren las cargas de trabajo modernas de IA.

Aquí es donde la High Bandwidth Memory (HBM) se convierte en una parte importante de la arquitectura.

Para una visión más amplia de cómo la memoria está evolucionando más allá del flash y por qué los sistemas de IA ahora dependen de múltiples niveles, consulta nuestro análisis principal: NAND no va a desaparecer, pero los servidores de IA ahora dependen de algo más que solo flash.

NAND no va a desaparecer, pero los servidores de IA ahora dependen de algo más que solo flash

Mike McCrosky 30 marzo 2026 Memoria flash y hardware

NAND no va a desaparecer, pero los servidores de IA ahora dependen de algo más que solo flash

Durante más de dos décadas, GetUSB ha estado analizando cómo se mueve realmente la información, no solo cómo se presenta en marketing. En ese tiempo, hemos visto cómo el almacenamiento ha evolucionado a través de varios ciclos, desde la caída de los discos mecánicos hasta el auge del flash, y más recientemente hacia sistemas donde el almacenamiento ya no es solo un componente pasivo, sino parte activa de la infraestructura.

Lo que está ocurriendo ahora con la infraestructura de IA se siente como otro de esos puntos de transición, pero impulsado por un tipo de presión diferente.

La memoria NAND no va a desaparecer, y realmente no hay discusión sobre eso. Sigue siendo la base del almacenamiento moderno, y hace ese trabajo extremadamente bien. Al mismo tiempo, la demanda de NAND ha ido aumentando rápidamente, en gran parte debido a las cargas de trabajo de IA que requieren conjuntos de datos enormes y acceso constante a ellos. Esa demanda está empezando a chocar con la oferta de formas que cada vez son más difíciles de ignorar, ya sea en forma de presión en precios, asignaciones más ajustadas o simplemente tiempos de entrega más largos para grandes implementaciones.

Cuando este tipo de desequilibrio empieza a aparecer, la industria no se queda quieta esperando a que todo se normalice. Empieza a buscar otras formas de resolver el problema, y ahí es donde las cosas comienzan a cambiar.

Por qué un conflicto laboral dentro de la división de semiconductores de Samsung de pronto tiene atenta a la industria global de memoria

Por qué la industria de memoria está prestando atención

La situación laboral de Samsung ha cambiado

El problema más grande que la mayoría de los consumidores nunca ve

Entendiendo la jerarquía de almacenamiento de la IA

El problema del exabyte

La IA funciona con algo más que velocidad

Por qué los discos duros todavía funcionan para la IA

La infraestructura de IA se está convirtiendo en un ecosistema de memoria por capas

A primera vista, un chip de memoria NAND y un barril de petróleo crudo parecen cosas completamente desconectadas.

La NAND comienza con arena, no con petróleo

Entonces, ¿por qué importa el petróleo?

La infraestructura invisible detrás de un chip diminuto

Por qué los precios de la NAND pueden reaccionar tan rápido

La realidad más amplia

La DRAM fue construida para la velocidad, no para cargar con todo el sistema

La primera pared es el costo, y aparece muy rápido

La segunda pared es la energía, y ese problema nunca duerme

Luego está la realidad física de la proximidad

La IA hace que los pequeños retrasos salgan caros

La analogía del almacén sigue funcionando, solo que ahora es más grande

Lo que esto realmente significa para la pila de memoria de la IA

Hacia dónde lleva esto después

Celdas diminutas, velocidad enorme y aun así precisión. No es magia, es ingeniería.

La memoria flash no es perfecta – se está corrigiendo constantemente a sí misma

Cómo se creó este artículo

El problema que la NAND nunca estuvo pensada para resolver

Qué significa realmente “High Bandwidth Flash”

Una forma distinta de pensar en el ancho de banda

Extendiendo la analogía del almacén

Cómo se está construyendo esto en la práctica

Lo que todavía no es

Dónde encaja esto en la infraestructura de IA

Por qué importa esta dirección

Volviendo al panorama general

Qué viene después

Nota editorial

Si llegaste aquí intentando desfragmentar una memoria USB o usar TRIM en una unidad flash USB, la razón por la que terminaste en un callejón sin salida es simple: esas herramientas no se aplican a las memorias USB de la misma manera que sí se aplican a los discos duros y a los SSD.

Copyright