Celeron: cómo un chip recortado se convirtió en una leyenda de actualización

noviembre 18, 2025 • febrero 3, 2026 • Lectura: 30 min • Views: 0

¿Te fue útil?

No compras una CPU. Compras un conjunto de restricciones. En producción, esas restricciones aparecen como profundidad de cola, latencias de cola, objetivos de nivel de servicio incumplidos, desarrolladores enfadados y un gráfico de almacenamiento que parece un flatline mientras los usuarios juran que la app “está lenta”.

Celeron es el capítulo extraño en la historia de Intel donde un chip “menor” repetidamente rindió por encima de su categoría, a veces legítimamente, otras veces porque colectivamente entendimos mal qué importaba. Si alguna vez has tenido que justificar una actualización con presupuesto, montar un laboratorio doméstico que no suene como un soplador de hojas, o explicar por qué una CPU barata sirve hasta que ya no sirve—esto es para ti.

Qué se suponía que fuera Celeron

Celeron nació como la línea económica de Intel: una forma de alcanzar puntos de precio más bajos sin canibalizar la marca Pentium insignia. En la práctica, fue un conjunto rotativo de compromisos—habitualmente menos caché, a veces un front-side bus más lento, a veces características ausentes, a veces frecuencias menores, a menudo todo lo anterior.

Eso suena a una historia de segmentación de producto aburrida. No lo fue. Porque el silicio subyacente con frecuencia no era “económico” en esencia; a menudo era la misma arquitectura de núcleo que las piezas de gama alta, solo configurada de forma diferente. Si eres SRE, sabes cómo va esto: misma plataforma, perillas distintas. Y a veces esas perillas no importan como dice el marketing.

La razón por la que Celeron se convirtió en una “leyenda de actualización” no es que fuera secretamente mágico. Es que la curva de rendimiento de cargas reales es irregular. Algunas cargas dependen de caché. Otras dependen de reloj. Otras dependen de la latencia de memoria. Otras están limitadas por E/S y no merecen la CPU cara que estás a punto de comprar para calmar tu ansiedad.

Celeron vivió justo en ese espacio desordenado, donde un chip recortado aún podía sentirse rápido—especialmente si tu punto de partida era una máquina de hace unos años, o si tu carga no le importaban las partes que faltaban.

Cómo se formó la leyenda de la actualización

Hay dos tipos de leyendas en computación: las que son ampliamente verdad, y las que son verdad en una configuración estrecha y luego recontadas por personas que nunca hicieron el experimento. Celeron ganó ambas.

La historia canónica es la era del Celeron 300A: un chip barato que, con la placa base y la refrigeración adecuadas, podía funcionar a una velocidad de bus mayor y ofrecer un rendimiento competitivo con piezas mucho más caras. Fue una tormenta perfecta de arquitectura, binning y la cultura de bricolaje de PCs de finales de los 90.

Pero la razón más profunda por la que la leyenda persistió en generaciones posteriores es más mundana: para muchos usuarios, el cuello de botella no era el núcleo de la CPU. Era el disco, la cantidad de RAM, la GPU, o simplemente la hinchazón del software. Instala una CPU “suficiente” y el sistema se siente “arreglado”. Los humanos luego acreditan la CPU porque es la actualización más visible. Mientras tanto la pila de almacenamiento está en la esquina, silenciosamente haciendo 400 IOPS aleatorios y arruinando el día de todos.

Broma #1 (corta y dolorosamente precisa): Mejorar la CPU para arreglar un portátil lento es como comprar neumáticos de carreras para un coche con el freno de mano puesto. Se siente proactivo, hasta que hueles quemado.

En el terreno de servidores, la leyenda de Celeron tomó otra forma: bajo consumo, baja temperatura, “suficiente” para servicios pequeños. A veces eso es verdad. También es como acabas ejecutando un proxy inverso TLS intensivo en una pieza que parece bien en promedio de CPU pero colapsa en picos de handshakes.

Datos rápidos y contexto histórico

Esto no es trivia por trivia; explican por qué ciertos Celeron fueron adorados y otros terminaron en vertederos.

Celeron se lanzó en 1998 como respuesta de Intel a la presión del mercado de valor, especialmente frente a los chips agresivamente precio de AMD.
Los primeros Celeron “Covington” se enviaron sin caché L2 (sí, ninguna), lo que los hacía rendir mal a pesar de tener frecuencias decentes para la época.
Los Celeron Mendocino añadieron caché L2 en chip, un gran salto en rendimiento real porque la latencia de caché bajó drásticamente.
El Celeron 300A (1998) se hizo famoso por el overclock al ejecutar el chip FSB 66 MHz a 100 MHz, si tu placa y RAM aguantaban.
Intel usó palancas de segmentación como velocidad de FSB y tamaño de caché para separar Celeron de Pentium, frecuentemente usando el mismo diseño de núcleo.
Más tarde Celeron se introdujo en roles móviles y embebidos de bajo consumo, incluidos muchos chips de doble núcleo dirigidos a netbooks y pequeños escritorios.
Algunos componentes modernos con la marca “Celeron” están basados en núcleos derivados de Atom en lugar de los grandes núcleos de escritorio, lo cual cambia el comportamiento de rendimiento (especialmente en single-thread).
El soporte de virtualización varía según la generación; algunos Celeron carecen de VT-x o tienen características limitadas respecto a los SKUs vecinos.
La marca sobrevivió múltiples eras arquitectónicas (P6, NetBurst, Core y familias Atom), por eso las afirmaciones generales sobre “rendimiento Celeron” suelen ser erróneas.

El trato técnico: caché, bus, relojes y recortes

Caché: el recorte que más importó (hasta que dejó de hacerlo)

La segmentación de Celeron se centró mayormente en la caché. No es arbitrario; la caché es costosa en área de die y energía, y es crítica para el rendimiento cuando tu conjunto de trabajo cabe en ella. Reducir caché te obliga a más viajes a memoria principal, donde la latencia eclipsa el tiempo de ejecución del núcleo.

En términos de producción: menos caché aumenta la probabilidad de que tus rutas de código caliente y datos calientes no se mantengan calientes. Lo ves como más ciclos por instrucción (CPI), más ciclos de backend estancados y una CPU que parece “ocupada” pero no realiza trabajo útil.

Aquí es donde el mito se divide:

Si tu carga cabe en caché (o es secuencial y predecible), un chip con caché reducida todavía puede lucir genial.
Si tu carga realiza punteros encadenados (bases de datos, algunas key-value stores, ciertos patrones de compresión, algunos runtimes de lenguajes), los recortes de caché dañan desproporcionadamente.

Front-side bus y subsistema de memoria: el limitador invisible

Los Celeron antiguos a menudo venían con velocidades de front-side bus más lentas. Eso importa cuando estás limitado por memoria o cuando el chipset + RAM ya es marginal. Puedes tener una CPU lista para correr y un subsistema de memoria que no lo esté.

Las plataformas modernas se alejaron del modelo clásico FSB, pero el principio sigue: el subsistema de memoria (frecuencia, canales, latencia, calidad del controlador) frecuentemente es la verdadera envolvente de rendimiento.

Recortes de características: virtualización, instrucciones y “arranca pero está triste”

Algunos SKUs de Celeron omiten características como VT-x, ciertas funciones de seguridad o extensiones vectoriales avanzadas. Aquí es donde las actualizaciones baratas se convierten en deuda operativa. Puedes ejecutar contenedores en casi cualquier cosa, pero si esperas ejecutar hipervisores, virtualización anidada o ciertas aceleraciones criptográficas, necesitas revisar el SKU exacto.

En otras palabras: “Celeron” no es una especificación. Es una etiqueta de advertencia para leer la letra pequeña.

Térmicas y consumo: la razón silenciosa por la que tenían sentido

En recintos pequeños, PCs de oficina baratos y cajas sin ventilador, el margen térmico es la verdadera moneda. Las piezas de menor TDP se comportan mejor: menos eventos de throttling, menos ruido de ventilador, menos raros bajones de tensión cuando todo arranca.

Y para laboratorios domésticos: una CPU que consume poco puede valer más que una que gana un benchmark, porque el benchmark no paga tu factura de electricidad.

Dónde gana Celeron (y por qué)

Seamos prácticos. El chip es “bueno” cuando sus restricciones coinciden con tu carga. Los mejores momentos de Celeron son cuando la plataforma es estable, la carga es ligera a moderada y el cuello de botella está en otra parte.

1) Servicios simples con concurrencia predecible

Resolutores DNS, pequeños proxies inversos Nginx (sin gran churn de TLS), dashboards internos, colectores de métricas, enviadores de logs—estos a menudo funcionan bien en CPUs modestas si tienes suficiente RAM y almacenamiento decente. La frase clave es “concurrencia predecible”.

2) Roles de NAS y servidores domésticos donde el almacenamiento domina

Compartir archivos, backups y streaming de medios suelen estar limitados por el rendimiento del disco, la red o la sobrecarga del protocolo. Si estás saturando 1 GbE, la CPU podría no ser tu problema. Añade cifrado, compresión, deduplicación o checksumming intensivo y eso cambia—rápidamente.

3) Mejoras de respuesta en escritorios desde máquinas antiguas

Una CPU económica combinada con un SSD y RAM suficiente puede sentirse como una mejora milagrosa comparada con un sistema antiguo con disco duro. Pero el milagro suele ser el SSD y la RAM, no la CPU. No confundas la asignación de crédito; así se gastan mal los presupuestos de mejora.

4) Entornos limitados por energía y ruido

A veces la máquina “más rápida” es la que no hace throttling. Una parte modesta corriendo a frecuencia estable todo el día puede vencer a un chip más caliente atascado en gestión térmica. Los SKUs de bajo consumo de Celeron los hicieron atractivos en quioscos, pequeñas oficinas y appliances de red.

Dónde falla Celeron (y cómo falla)

1) Cualquier cosa con sensibilidad seria a la latencia por núcleo

Cuando la latencia en cola importa, el rendimiento por hilo importa. No siempre, pero a menudo. Muchos Celeron tienen menos núcleos, relojes más bajos, caché más pequeña y a veces microarquitecturas más débiles (especialmente líneas derivadas de Atom). El modo de fallo es sutil: el tiempo medio de respuesta parece aceptable; p99 y p999 se ponen feos bajo carga.

2) Cargas intensivas en cifrado

Si terminas TLS a escala, ejecutas cifrado de disco o comprimes y cifras backups, quieres el soporte de conjunto de instrucciones apropiado y suficiente rendimiento por núcleo. La falta de aceleración o simplemente la ausencia de margen se manifiesta como CPU a tope durante handshakes, mayor latencia en picos y reintentos en cascada que parecen “inestabilidad de red”.

3) Virtualización y sueños de “pequeña nube”

La gente ama la idea de un pequeño servidor doméstico ejecutando varias VMs. Realidad: comprueba soporte VT-x, capacidad de memoria y E/S. Un Celeron puede ejecutar un hipervisor, pero también puede atraparte en rutas de emulación lentas o memoria apretada que hace que cada invitado sea miserable.

4) Pilas de almacenamiento que hacen trabajo serio

ZFS con compresión, deduplicación (no lo hagas), checksums, scrubs y snapshots puede cargar la CPU. También lo puede hacer RAID por software, codificación por erasure y sistemas de archivos modernos que realizan trabajo de integridad. El modo de fallo es que la utilización del disco se ve baja pero el rendimiento se estanca; la CPU es el factor limitante, no los discos.

Broma #2 (corta): La deduplicación en una CPU diminuta es como organizar un buffet en una cabina telefónica. Técnicamente posible; social y térmicamente desastroso.

Una cita, porque sigue siendo verdad

Idea parafraseada de Gene Kim: “Mejorar el flujo y la retroalimentación vence a las hazañas; haz el trabajo visible, reduce el tamaño del batch y los problemas son más fáciles de arreglar.”

Traduce eso al hardware: haz visibles los cuellos de botella antes de gastar dinero. No actualices por corazonadas.

Guía de diagnóstico rápido: qué comprobar primero/segundo/tercero

Este es el playbook que uso cuando alguien dice “el servidor está lento” y la conversación de presupuesto está a punto de volverse cara.

Primero: decide si es saturación de CPU o espera de CPU

Comprueba la media de carga frente al uso de CPU. Alta carga con bajo uso de CPU a menudo significa espera de E/S o contención de locks.
Mira la cola de ejecución y el iowait. Si iowait es alto, no compres una CPU todavía.
Comprueba el throttling. Una CPU “lenta” puede estar caliente.

Segundo: identifica el dominio del cuello de botella (CPU / memoria / disco / red)

Disco: await alto, throughput bajo, cola de dispositivo saturada → cuello de botella de almacenamiento o latencia mala.
Memoria: swapping, fallos mayores altos, poca memoria libre, reclaim alto → cuello de botella de memoria.
Red: retransmisiones, pérdidas, NIC saturada → cuello de botella de red.
CPU: alto tiempo user/system, hilos ejecutables altos, bajo iowait → cuello de botella de CPU.

Tercero: encuentra el limitador específico

Si CPU: ¿un solo hilo saturado? ¿locks? ¿crypto? ¿recolección de basura? ¿tiempo de kernel?
Si disco: ¿E/S aleatoria? ¿tormentas de fsync? ¿escrituras pequeñas? ¿amplificación de escritura? ¿RAID degradado?
Si memoria: ¿fuga? ¿caches sobredimensionados? ¿JVM mal dimensionada? ¿límites de contenedor?
Si red: ¿MTU incorrecta? ¿pérdidas por buffers de anillo? ¿offloads mal?

El objetivo no es encontrar “una métrica que se ve alta.” El objetivo es encontrar lo que fija el techo de throughput o el suelo de latencia. La leyenda de Celeron existe porque la gente actualizó lo equivocado y aun así obtuvo una mejora, por lo general por accidente.

Tareas prácticas: comandos, salidas, qué significan y qué decides

Abajo hay tareas reales que puedes ejecutar en Linux para evaluar si un Celeron (o cualquier CPU modesta) es “suficiente”, y para diagnosticar cuando no lo es. Cada tarea incluye: comando, salida de ejemplo, qué significa y la decisión que tomas.

Tarea 1: Identificar el modelo exacto de CPU y sus capacidades

cr0x@server:~$ lscpu
Architecture:             x86_64
CPU op-mode(s):           32-bit, 64-bit
Vendor ID:                GenuineIntel
Model name:               Intel(R) Celeron(R) CPU J4125 @ 2.00GHz
CPU(s):                   4
Thread(s) per core:       1
Core(s) per socket:       4
Socket(s):                1
Flags:                    fpu vme de pse tsc msr pae mce cx8 apic sep mtrr ... aes ... vmx

Significado: Ahora conoces el SKU, el conteo de núcleos y si características como aes (AES-NI) y vmx (VT-x) existen.

Decisión: Si vmx falta, deja de prometer “un montón de VMs”. Si aes falta, sé cauteloso con terminación TLS y cargas intensivas en cifrado.

Tarea 2: Confirmar soporte de virtualización (preparado para KVM)

cr0x@server:~$ egrep -o 'vmx|svm' /proc/cpuinfo | head
vmx
vmx
vmx
vmx

Significado: vmx indica Intel VT-x. Si esto no imprime nada, la virtualización por hardware no está disponible.

Decisión: Si está vacío, planifica solo contenedores o acepta virtualización por software más lenta (por lo general inaceptable para algo serio).

Tarea 3: Comprobar si la CPU está haciendo throttling (térmico o de potencia)

cr0x@server:~$ sudo dmesg | egrep -i 'thrott|thermal|powercap' | tail -n 5
[ 8921.113421] thermal thermal_zone0: critical temperature reached, shutting down
[ 9120.221044] CPU0: Core temperature above threshold, cpu clock throttled

Significado: El kernel te está diciendo que la CPU alcanzó límites térmicos. Los problemas de rendimiento aquí no son “CPU débil”, son “mala refrigeración o chasis”.

Decisión: Arregla refrigeración, polvo, flujo de aire, pasta térmica, curvas de ventilador, límites de potencia en BIOS. Actualizar la CPU sin arreglar termal es sabotaje propio.

Tarea 4: Ver frecuencias actuales para detectar downclock sostenido

cr0x@server:~$ grep -H . /sys/devices/system/cpu/cpu*/cpufreq/scaling_cur_freq | head
/sys/devices/system/cpu/cpu0/cpufreq/scaling_cur_freq:800000
/sys/devices/system/cpu/cpu1/cpufreq/scaling_cur_freq:800000
/sys/devices/system/cpu/cpu2/cpufreq/scaling_cur_freq:800000
/sys/devices/system/cpu/cpu3/cpufreq/scaling_cur_freq:800000

Significado: La CPU está a 800 MHz. Eso podría ser idle (bien) o estar atascada por política de potencia (no bien).

Decisión: Si las quejas de rendimiento ocurren mientras las frecuencias permanecen bajas, inspecciona ajustes de governor y límites de potencia; considera el governor “performance” para servidores que necesitan latencia estable.

Tarea 5: Instantánea de alto nivel de CPU e iowait

cr0x@server:~$ mpstat -P ALL 1 3
Linux 6.1.0 (server)  01/09/2026  _x86_64_  (4 CPU)

12:01:10 PM  CPU   %usr %nice %sys %iowait %irq %soft %steal %idle
12:01:11 PM  all   12.00  0.00  4.00   0.00 0.00  1.00   0.00 83.00
12:01:12 PM  all   10.75  0.00  3.50  18.25 0.00  0.50   0.00 67.00
12:01:13 PM  all   11.50  0.00  3.25  22.75 0.00  0.75   0.00 61.75

Significado: La CPU no está saturada, pero iowait está subiendo. Tu “servidor lento” probablemente espera disco.

Decisión: No compres una CPU más rápida. Ve a mirar latencia de almacenamiento, encolamiento y comportamiento del sistema de archivos.

Tarea 6: Comprobación de carga media y realidad de la cola de ejecución

cr0x@server:~$ uptime
 12:02:01 up 34 days,  4:20,  2 users,  load average: 6.21, 5.88, 5.43

Significado: En una CPU de 4 núcleos, una load average sostenida alrededor de 6 sugiere cola. Pero podría ser tareas ejecutables o espera de E/S ininterrumpible.

Decisión: Empareja inmediatamente con vmstat para distinguir cola de ejecución CPU de iowait.

Tarea 7: Distinguir presión de CPU de iowait y swapping

cr0x@server:~$ vmstat 1 5
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 6  0      0 412000  21000 512000    0    0    12   150  320  780 12  4 82  2  0
 7  0      0 410800  21000 512500    0    0     8  1200  340  820 14  5 70 11  0
 5  1      0 410500  21000 512100    0    0     0  2400  360  900 10  4 55 31  0
 3  2      0 409900  21000 511900    0    0     0  1800  310  860  8  3 50 39  0
 4  1      0 410200  21000 512200    0    0     0   900  300  830  9  3 62 26  0

Significado: r es ejecutable, b está bloqueado. Aquí, los procesos bloqueados aumentan y wa salta: la E/S es el dolor.

Decisión: Enfócate en almacenamiento: qué dispositivo, qué proceso y qué patrón de acceso. La actualización de CPU no es tu primer movimiento.

Tarea 8: Encontrar los consumidores de CPU principales y si es un hilo caliente

cr0x@server:~$ top -b -n 1 | head -n 15
top - 12:03:10 up 34 days,  4:21,  1 user,  load average: 5.92, 5.80, 5.41
Tasks: 212 total,   3 running, 209 sleeping,   0 stopped,   0 zombie
%Cpu(s): 28.1 us,  6.3 sy,  0.0 ni, 40.0 id, 25.6 wa,  0.0 hi,  0.0 si,  0.0 st
MiB Mem :   7865.2 total,   612.4 free,  1021.8 used,  6231.0 buff/cache
PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND
2113 postgres  20   0 1894328 412560  17892 R  98.7   5.3  12:08.33 postgres
1452 root      20   0  612280  38400  12300 D  35.2   0.5   2:12.04 rsync

Significado: Un proceso postgres está prácticamente consumiendo un núcleo completo; además iowait es alto y rsync está en sueño ininterrumpible (D).

Decisión: Si tu SLA depende de la latencia de Postgres, una CPU pequeña puede estar justa—pero arregla primero la espera de almacenamiento, o perseguirás fantasmas.

Tarea 9: Comprobar latencia por disco y encolamiento

cr0x@server:~$ iostat -x 1 3
Linux 6.1.0 (server)  01/09/2026  _x86_64_  (4 CPU)

Device            r/s     w/s   rkB/s   wkB/s  await  svctm  %util
sda              1.20   60.30    80.1  4200.7  45.20   1.90  98.30
nvme0n1         10.00    5.00  1200.0   300.0   1.10   0.20   2.00

Significado: sda está al 98% de utilización con await alto. Ese es tu cuello de botella, no la CPU.

Decisión: Mueve la carga caliente a NVMe/SSD, arregla el layout RAID, reduce escrituras sincrónicas o cambia patrones de acceso. La elección de CPU es secundaria hasta que la latencia de disco baje.

Tarea 10: Verificar sistema de archivos y opciones de montaje (sync puede afectar)

cr0x@server:~$ findmnt -no TARGET,SOURCE,FSTYPE,OPTIONS /var/lib/postgresql
/var/lib/postgresql /dev/sda2 ext4 rw,relatime,errors=remount-ro,data=ordered

Significado: Ves el sistema de archivos y opciones de montaje. Esto no es “malo”, pero ayuda a validar suposiciones (por ejemplo, ¿estamos accidentalmente en disco giratorio? ¿usamos opciones raras?).

Decisión: Si esperabas SSD/NVMe y estás en /dev/sda2, acabas de encontrar un error de migración.

Tarea 11: Comprobar presión de memoria y swapping

cr0x@server:~$ free -h
               total        used        free      shared  buff/cache   available
Mem:           7.7Gi       1.0Gi       620Mi       120Mi       6.1Gi       6.3Gi
Swap:          2.0Gi         0B       2.0Gi

Significado: Mucha memoria disponible; el swapping no es el problema ahora mismo.

Decisión: No añadas RAM “porque sí”. Si el rendimiento sigue mal, mira latencia de E/S o contención de CPU.

Tarea 12: Identificar latencia de memoria o sospecha de fallos de caché (proxy rápido vía perf)

cr0x@server:~$ sudo perf stat -p 2113 -a -- sleep 5
 Performance counter stats for 'system wide':

        6,210.45 msec task-clock                #    1.242 CPUs utilized
       12,112,040      context-switches          #    1.952 M/sec
          102,400      cpu-migrations            #   16.489 K/sec
     18,220,000,000      cycles                  #    2.936 GHz
     10,440,000,000      instructions            #    0.57  insn per cycle
        1,220,000,000      cache-misses          #   30.1% of all cache refs

       5.000812445 seconds time elapsed

Significado: IPC es bajo y los fallos de caché son altos. Eso suele apuntar a comportamiento limitado por memoria—exactamente donde la caché reducida y subsistemas de memoria débiles hacen daño.

Decisión: Considera una CPU con más caché / núcleos más fuertes, o rehacer la consulta/índice/carga. Si estás en un Celeron de baja caché, esta es tu señal de “deja de fingir”.

Tarea 13: Comprobar pérdidas de red y retransmisiones (no culpes a la CPU por pérdida de paquetes)

cr0x@server:~$ ip -s link show dev eth0
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc fq_codel state UP mode DEFAULT group default qlen 1000
    link/ether 52:54:00:12:34:56 brd ff:ff:ff:ff:ff:ff
    RX:  bytes packets errors dropped  missed   mcast
      987654321  1234567      0     184       0      12
    TX:  bytes packets errors dropped carrier collsns
      876543210  1122334      0      96       0       0

Significado: Hay pérdidas. No necesariamente catastróficas, pero suficientes para crear “lentitud aleatoria” bajo carga.

Decisión: Investiga buffers de anillo de NIC, driver, puerto de switch, cable, MTU y sobrecarga del host. No ofrendes una CPU como ritual de mejora.

Tarea 14: Verificar disponibilidad de aceleración criptográfica (realismo TLS y cifrado)

cr0x@server:~$ grep -m1 -o 'aes' /proc/cpuinfo
aes

Significado: AES-NI está disponible. Eso es bueno para cifrados TLS comunes y sobrecarga de cifrado de disco.

Decisión: Si falta, planifica mayor utilización de CPU bajo cifrado; puede que necesites un nivel de CPU distinto o estrategia de offload.

Tarea 15: Medir latencia de almacenamiento desde la perspectiva de la aplicación (fsync-intensivo)

cr0x@server:~$ sudo fio --name=fsync-test --directory=/var/lib/postgresql --rw=write --bs=4k --size=256m --fsync=1 --numjobs=1 --iodepth=1 --runtime=20 --time_based --direct=1
fsync-test: (g=0): rw=write, bs=4K-4K/4K-4K/4K-4K, ioengine=psync, iodepth=1
fio-3.33
fsync-test: (groupid=0, jobs=1): err= 0: pid=3312: Thu Jan  9 12:04:10 2026
  write: IOPS=210, BW=840KiB/s (860kB/s)(16.4MiB/20001msec); 0 zone resets
    clat (usec): min=900, max=250000, avg=4600.12, stdev=12000.55

Significado: Escrituras síncronas 4k a ~210 IOPS con picos de latencia de ms a cientos de ms. Eso asesinará la latencia de cola de base de datos sin importar la CPU.

Decisión: Arregla almacenamiento primero (SSD/NVMe, caching adecuado, controlador, protección contra pérdida de energía). Las actualizaciones de CPU no devolverán la latencia de fsync.

Tarea 16: Determinar si tu CPU es el limitador bajo carga real (estrés rápido)

cr0x@server:~$ stress-ng --cpu 4 --timeout 15s --metrics-brief
stress-ng: info:  [4102] setting to a 15 second run per stressor
stress-ng: info:  [4102] dispatching hogs: 4 cpu
stress-ng: metrc: [4102] stressor       bogo ops real time  usr time  sys time   bogo ops/s
stress-ng: metrc: [4102] cpu              4200     15.01     59.80      0.02       279.8

Significado: Esto te da una línea base grosera de throughput de CPU y ayuda a detectar throttling térmico durante carga sostenida cuando se combina con comprobaciones de frecuencia.

Decisión: Si el rendimiento colapsa o la frecuencia cae mucho durante esta ejecución, tu problema es térmico/potencia. Si es estable, la CPU puede sostener trabajo a su rating.

Tres microhistorias corporativas desde la trinchera

Microhistoria 1: El incidente causado por una suposición errónea (la “mejora de CPU” que no lo era)

Un equipo SaaS mediano heredó un servicio de generación de informes que generaba PDFs bajo demanda. El servicio vivía en una caja pequeña que, siendo justos, estaba subdimensionada: CPU de gama baja, RAM modesta y un SSD SATA único. Durante fin de mes, los tiempos de respuesta se dispararon. Llegaron tickets de soporte. La narrativa obvia se formó rápido: “Necesitamos una CPU más rápida”.

Mejoraron a una CPU de mayor nivel—más núcleos, relojes más altos, caché mayor. Los gráficos se vieron mejor exactamente una semana. Luego volvió a ocurrir el fin de mes y la latencia p99 volvió a dispararse. La gente culpó a la herramienta de monitorización porque “no lo predijo”.

La suposición errónea fue que la carga estaba limitada por CPU. No lo estaba. La tubería de generación de PDFs escribía muchos archivos pequeños, sincronizaba con frecuencia y luego comprimía y subía artefactos. El dispositivo de almacenamiento, aunque SSD, se saturaba por amplificación de escritura y latencia de fsync con trabajos concurrentes. El uso de CPU se mantenía cómodamente bajo 50% mientras iowait subía y la cola de ejecución se veía ocupada.

Cuando ejecutaron un simple iostat -x y una prueba fio enfocada en fsync, la historia cambió. Movieron el directorio scratch a un NVMe más rápido y redujeron la frecuencia de escrituras sincrónicas donde la corrección lo permitía. También limitaron la concurrencia durante fin de mes. El “incidente de CPU” desapareció sin tocar la CPU de nuevo.

Conclusión: la leyenda de Celeron vive en la brecha entre lo que es fácil de actualizar y lo que realmente está lento. No seas quien cambia silicio porque el gráfico de disco es aburrido.

Microhistoria 2: La optimización que salió mal (ahorrar CPU gastándola)

Otro equipo gestionaba un repositorio interno de artefactos. No era enorme, pero era sensible a latencia para desarrolladores. Alguien tuvo la idea brillante de activar compresión agresiva para reducir costos de almacenamiento y acelerar transferencias de red. En principio, razonable—hasta que lo pones en una CPU pequeña con caché limitada y desempeño single-thread modesto.

El primer síntoma no fue saturación obvia de CPU. Fue lentitud intermitente. Descargas a veces tardaban más que antes. Subidas ocasionalmente expiraban. El sistema de almacenamiento mostró menor throughput bruto pero mayor tiempo de CPU en modo sistema. Se culpó a redes. Luego al almacenamiento. Finalmente, al desarrollador que activó la compresión.

El revés fue clásico: la compresión ahorró bytes pero aumentó el trabajo de CPU y volvió la latencia esporádica, especialmente cuando varios clientes golpearon el servicio a la vez. La limitación de caché de la CPU y el débil rendimiento por núcleo convirtieron la compresión en un punto de contención. Además, la “optimización” desplazó el cuello de botella del disco a la CPU, pero solo durante ráfagas—así que los gráficos promedio parecían bien y la discusión se volvió acalorada.

La solución no fue “comprar una CPU más grande” de inmediato. Primero midieron: qué tipos de contenido se beneficiaban de compresión, cuál era el coste CPU y dónde venía el dolor p99. Desactivaron compresión para formatos ya comprimidos, establecieron límites razonables de concurrencia y solo entonces consideraron una mejora de CPU para cabeza futura.

Conclusión: en CPUs pequeñas—incluyendo muchos Celeron—las “optimizaciones inteligentes” pueden convertirse en generadores de latencia de cola. Mide impacto bajo concurrencia, no en pruebas de un solo cliente.

Microhistoria 3: La práctica aburrida pero correcta que salvó el día (notas de capacidad y comprobaciones de realidad)

Un equipo que ejecutaba servicios on-prem modestos (runners CI, Git interno, pila de métricas) estandarizó en hardware modesto para mantener costos bajos. Algunas cajas eran clase Celeron, elegidas por eficiencia energética y disponibilidad. El ambiente funcionó porque lo trataron como producción, no como hobby.

La práctica aburrida: cada servicio tenía una nota de “capacidad y restricciones” de una página. Listaba QPS esperado, eventos pico esperados, características CPU requeridas (AES-NI, virtualización), objetivo de latencia de almacenamiento y una lista “no” firme (no dedup, no VMs sorpresa, no compresión pesada en los nodos más débiles). También registraban mediciones base tras el aprovisionamiento: latencia fio, throughput iperf y una simple corrida de estrés de CPU para comprobar throttling.

Un día, una actualización de kernel coincidió con una nueva carga CI. Los builds se ralentizaron. Todos asumieron que la nueva carga era simplemente más pesada. Pero el runbook los obligó a re-comprobar la línea base: la frecuencia de CPU estaba atascada baja por un cambio de governor de potencia. La narrativa de “hardware lento” nunca tuvo oportunidad porque tenían números conocidos buenos para comparar.

Revirtieron la política de governor, confirmaron termales y el sistema volvió a la normalidad. Nadie pidió hardware nuevo. Nadie pasó dos semanas discutiendo en Slack sobre qué código “se había vuelto más lento”.

Conclusión: la diferencia entre “hardware económico que funciona” y “hardware económico que duele” es higiene operativa. Celeron puede ser adecuado si tratas las restricciones como algo de primera clase.

Errores comunes: síntomas → causa raíz → solución

Esta sección es intencionalmente específica. Si reconoces un patrón de síntomas, normalmente puedes evitar una mejora tonta o un incidente tonto.

1) Síntoma: load average alto, CPU no está al límite

Causa raíz: tareas atascadas en espera de E/S ininterrumpible (latencia de disco, stalls NFS, RAID degradado) o contención de locks.

Solución: comprueba vmstat (b y wa), luego iostat -x por await y %util. Si es NFS, inspecciona latencia del servidor y pérdidas de red. No compres CPU todavía.

2) Síntoma: p99 se dispara durante backups o scrubs

Causa raíz: I/O background saturando la cola del disco; una CPU pequeña no puede ocultar la latencia de almacenamiento; contención del scheduler.

Solución: limitar backups/scrubs, usar ionice, programar en horas valle, mover datos calientes a almacenamiento más rápido. Si la CPU también está al límite por compresión/cifrado, ajusta esas opciones.

3) Síntoma: terminación TLS se ralentiza “aleatoriamente” en picos

Causa raíz: CPU por núcleo insuficiente para ráfagas de handshakes, falta de aceleración o demasiados workers provocando cambios de contexto.

Solución: verifica la bandera aes, ajusta conteos de workers, habilita reutilización de sesiones, considera una CPU más potente si la tasa de handshakes está limitada por núcleo.

4) Síntoma: la base de datos va bien hasta que sube la concurrencia, luego colapsa

Causa raíz: fallos de caché y latencia de memoria amplificados por caché de CPU reducida; latencia de fsync; contención de locks.

Solución: mide tasa de fallos de caché (perf), inspecciona planes de consulta/índices, comprueba latencia de fsync. Si perf muestra IPC bajo y fallos de caché altos en una CPU de baja caché, una CPU con más caché puede ser la solución adecuada.

5) Síntoma: “mejora de CPU” rinde poco

Causa raíz: el cuello de botella es almacenamiento, memoria o red; la CPU no era el limitante.

Solución: realiza una línea base antes de cambios. Tras el cambio, compara iowait, disk await, retransmisiones y comportamiento de swap. Deja de tratar CPUs como desodorante de rendimiento.

6) Síntoma: rendimiento de VM terrible aunque el host parece idle

Causa raíz: falta de VT-x, mala virtualización de I/O o RAM insuficiente causando thrash en caché del host.

Solución: confirma vmx; comprueba módulos KVM cargados; asegura RAM suficiente; prefiere contenedores en chips de gama baja si las características VM son limitadas.

7) Síntoma: ventiladores a tope, rendimiento inconsistente

Causa raíz: throttling térmico en chasis pequeño, polvo, ventilador fallando o configuraciones BIOS conservadoras de potencia.

Solución: comprueba dmesg por throttling; inspecciona frecuencias; arregla flujo de aire. Una CPU modesta que funciona fría suele vencer a una “mejor” CPU que funciona caliente.

8) Síntoma: throughput de almacenamiento menor al esperado en discos “rápidos”

Causa raíz: la CPU es el limitador para checksumming/compresión/paridad; o la carga es I/O aleatorio muy pequeño.

Solución: ejecuta fio para clasificar I/O; inspecciona uso de CPU e iowait; reconsidera compresión, modo RAID y alineación de recordsize/volblocksize. Mejora la CPU solo si el tiempo de CPU es el límite tras ajustar.

Listas de verificación / plan paso a paso

Paso a paso: decidir si un Celeron es “suficiente” para un rol

Nombra la carga de trabajo. “NAS” no es una carga. “Servidor SMB, 10 usuarios, copias de archivos grandes ocasionales” sí lo es.
Escribe el objetivo de rendimiento. ¿Throughput? ¿Latencia? ¿p99? ¿Tiempo de build? ¿Ventana de backup?
Enumera requisitos firmes. ¿Se necesita VT-x? ¿AES-NI? ¿Máxima RAM? ¿Líneas PCIe para NVMe?
Mide una línea base. Estabilidad de estrés de CPU, latencia fio en el filesystem objetivo, throughput de red y un benchmark simple a nivel de aplicación.
Clasifica cuellos de botella. Usa la guía de diagnóstico rápido: CPU vs memoria vs disco vs red.
Decide perillas antes de comprar hardware. Límites de concurrencia, estrategia de caching, política de compresión/cifrado.
Solo entonces elige el nivel de CPU. Si estás limitado por latencia de memoria, más caché y núcleos fuertes importan. Si estás limitado por almacenamiento, gasta en almacenamiento primero.
Documenta las restricciones. Escribe “no compresión pesada en este nodo”. El tú futuro lo olvidará.

Lista de verificación: ruta de actualización segura para sistemas económicos

Actualiza almacenamiento primero si ves altos await o picos de latencia fsync.
Añade RAM si ves swapping o fallos mayores bajo carga normal.
Arregla termales antes de cambiar silicio.
Confirma banderas de características (vmx, aes) antes de comprometer un caso de uso.
Benchmarks bajo concurrencia, no solo pruebas de un usuario.
Mantén un plan de rollback: ajustes BIOS, versiones de kernel, políticas de governor.

Lista de verificación: cuándo evitar CPUs clase Celeron

Puntos finales TLS con alta tasa de handshakes o tuberías de cifrado pesadas sin margen claro.
Nodos primarios de base de datos donde la latencia p99 importa y los working sets exceden la caché.
Anfitriones multi-VM donde necesitas rendimiento consistente por núcleo y características de virtualización completas.
Nodos de almacenamiento que hacen paridad/erasure coding/compresión a altos objetivos de throughput.
Cualquier cosa donde no puedas limitar trabajo de background y necesites latencia estable.

Preguntas frecuentes

1) ¿Celeron era “simplemente un Pentium peor”?

A veces. Pero a menudo era el mismo núcleo subyacente con menos caché o velocidades de bus más bajas. La diferencia entre “peor” y “suficiente” depende totalmente de la carga y el comportamiento de memoria.

2) ¿Por qué se hizo famoso el Celeron 300A?

Porque a menudo podía correr a una velocidad de bus mayor que su rating oficial en las placas adecuadas, entregando rendimiento cercano a piezas más caras. Fue una intersección rara de arquitectura y cultura de overclocking.

3) ¿Puedo ejecutar un NAS con un Celeron?

Sí, si tu carga es principalmente servir archivos y tu objetivo de throughput no es extremo. Pero características como cifrado, compresión e integridad pueden llevarte de “bien” a “limitado por CPU”. Mide latencia de fsync y margen de CPU.

4) ¿Por qué la gente dice “la caché importa” tanto para Celeron?

Porque los recortes de Celeron a menudo apuntaban a la caché, y la caché es la diferencia entre acceso local rápido y viajes lentos a memoria principal. Muchas cargas de servidor son sensibles a latencia de memoria incluso cuando la utilización de CPU parece moderada.

5) ¿Cómo digo si debo actualizar CPU o almacenamiento primero?

Si iowait es alto y await de disco está elevado, almacenamiento primero. Si la CPU está saturada en tiempo user/system con bajo iowait y cola de ejecución alta, CPU primero. Si ambos están mal, arregla latencia de almacenamiento primero para que las mediciones de CPU sean significativas.

6) ¿Todos los Celeron soportan virtualización (VT-x)?

No. Varía por generación y SKU. Comprueba las banderas de lscpu para vmx. Si falta, no asumas que KVM dará rendimiento aceptable para VMs.

7) ¿Los Celeron modernos siempre usan núcleos Atom de bajo consumo?

No siempre, pero muchos derivan de diseños de bajo consumo. Eso cambia el perfil de rendimiento: a menudo bien para servicios ligeros, no tan bueno para latencia por hilo o cómputo pesado.

8) ¿Tiene relevancia el overclocking en la leyenda Celeron hoy?

Como estrategia general, no. La leyenda permanece como memoria cultural, pero las plataformas modernas bloquean cosas y las térmicas son más ajustadas. Para sistemas de producción, el overclock es un hobby, no un plan operativo.

9) ¿Cuál es el mayor riesgo operativo con CPUs de gama baja?

Subestimar la latencia de cola bajo carga en ráfagas, especialmente cuando faltan características de CPU o cuando tareas de fondo compiten por núcleos limitados. El modo de fallo es “bien la mayor parte del tiempo”, que es cómo nacen los incidentes.

10) Si ya tengo una caja Celeron, ¿cómo hago que se comporte?

Mantén baja la latencia de almacenamiento, evita características de fondo caras (dedup, compresión pesada), limita la concurrencia y vigila termales. Escribe las restricciones para que el próximo “cambio rápido” no lo convierta en un calefactor con opiniones.

Conclusión: próximos pasos prácticos

Celeron se convirtió en una leyenda de actualización porque explotó una verdad que seguimos reaprendiendo: el rendimiento es sobre el sistema, no sobre el componente con el mayor presupuesto de marketing. A veces un chip recortado es exactamente lo que necesitas. Otras veces es una trampa con una etiqueta de precio amigable.

Próximos pasos que puedes hacer esta semana:

Establece la línea base de tu sistema actual con los comandos arriba: banderas de CPU, señales de throttling, iowait, await de disco y una prueba fio dirigida.
Escribe una nota de una página de restricciones para cada caja: qué puede ejecutar, qué nunca debe ejecutar y cómo se ven las métricas “normales”.
Gasta dinero donde está el cuello de botella: latencia de almacenamiento primero para bases de datos y cargas con sync; caché/núcleos de CPU para servicios limitados por memoria; RAM para cualquier cosa que esté swappeando; arreglos de red para pérdidas y retransmisiones.
Si compras una mejora de CPU, cómprala con evidencia: contadores perf, números de latencia y un benchmark antes/después bajo concurrencia.

La leyenda no es que Celeron fuera secretamente premium. La leyenda es que gente inteligente aprendió—a veces por accidente—que la solución más barata es la que coincide con el cuello de botella real.