Metodología de compresión de PDF
La mayoría de las guías de «cómo comprimir un PDF» solo te dicen qué botón pulsar y se saltan lo que más importa: cuánto puede reducirse un archivo lo decide su contenido, no la herramienta. Esta metodología parte de dónde sale de verdad el tamaño de un PDF, desglosa cuánto ahorra cada técnica (bajar resolución, cuantización JPEG, escala de grises, eliminar duplicados) y luego te da un árbol de decisión para elegir un camino según el archivo que tengas delante. Al terminar dejarás de adivinar ajustes y empezarás a juzgar primero, sabiendo qué archivos se comprimen de una pasada y cuáles nunca llegarán a tu objetivo. Todo se ejecuta en local, en tu navegador; los archivos nunca se suben.

¿De dónde sale de verdad el tamaño de un PDF?
Para comprimir algo, primero hay que saber qué estás comprimiendo. El tamaño de un PDF se desglosa en unas cuatro partes: imágenes de página (los datos de mapa de bits de escaneos, fotos e ilustraciones), vectores y texto (glifos, trazados, líneas de tabla), fuentes incrustadas (archivos de fuente completos o reducidos) y sobrecarga estructural (metadatos, marcadores, anotaciones, miniaturas en caché, objetos duplicados). En casi cualquier archivo «demasiado grande para subir», la primera parte —las imágenes de página— supera el 80 % del tamaño.
Por eso las mismas 10 páginas pueden ser 300KB como exportación de Word y 30MB como un contrato fotografiado con el móvil: lo primero es texto vectorial, lo segundo son diez fotos en color de varios megapíxeles. El primer paso para juzgar cuánto puede reducirse un archivo es siempre la misma pregunta: ¿su tamaño es sobre todo imágenes o sobre todo texto?
| Fuente de tamaño | Proporción típica | Margen | Técnica |
|---|---|---|---|
| Imágenes de página (escaneos / fotos) | ~80–98 % de los PDF de imágenes | Muy grande | Bajar resolución + JPEG + escala de grises |
| Vectores y texto | El grueso de un PDF de texto | Mínimo | Reducir fuentes, eliminar duplicados |
| Fuentes incrustadas | De decenas de KB a unos pocos MB | Medio (reducible) | Reducir / quitar glifos sin usar |
| Sobrecarga estructural | Normalmente < 5 % | Pequeño (sin pérdida) | Quitar objetos redundantes |
Las cuatro técnicas: ¿cuánto ahorra cada una?
«Comprimir un PDF» es en realidad una mezcla de técnicas independientes. Entender el coste y el beneficio de cada una es lo que explica por qué unos archivos se reducen al instante y otros no se mueven.
Las tres primeras son con pérdida: cambian calidad por tamaño, con un beneficio enorme; la última es sin pérdida: solo quita redundancia, así que la calidad queda intacta pero el ahorro es modesto. Cumplir un objetivo estricto como «exactamente 200KB» casi siempre implica usar alguna combinación de las tres primeras.
- Bajar la resolución de la imagen (menos DPI): pasar un escaneo de 600DPI a 150DPI recorta el número de píxeles a ~1/16, el mayor ahorro de todos. El coste es algo de borrosidad al ampliar, pero 150–200DPI sobra para leer en pantalla y para la mayoría de revisiones.
- Cuantización JPEG (mayor tasa): una calidad JPEG más agresiva en las imágenes de página reduce el tamaño rápido. El coste es un leve ruido de «mosquito» alrededor de los bordes del texto, visible por debajo de una calidad de unos 50.
- Escala de grises / blanco y negro: un escaneo de texto en blanco y negro no necesita color; quitar los canales de color suele ahorrar otro 30–60 %. El coste es perder el color (sin pérdida para texto plano).
- Eliminación de duplicados sin pérdida: quita objetos duplicados, fuentes sin usar, miniaturas en caché y metadatos. La calidad queda intacta, pero normalmente solo ahorra entre el 5 y el 25 %; no basta por sí sola para cumplir un objetivo estricto.
¿Cuánto puede reducirse cada contenido? Una tabla de referencia
Esta es la tabla que merece la pena guardar. No es una promesa: es un rango basado en la experiencia por tipo de contenido. El mismo «objetivo de 200KB» es trivial para un escaneo de texto y casi imposible para un folleto en color de 50 páginas. Empareja primero tu archivo con una fila y podrás predecir el resultado.
| Tipo de contenido | Tamaño típico antes | Se comprime a | ¿≤200KB? |
|---|---|---|---|
| Escaneo de texto B/N (200–300DPI) | 0,5–2 MB / página | 20–80 KB / página | Normalmente sí |
| Escaneo de documento en color (300DPI) | 1–4 MB / página | 80–300 KB / página | Una página a menudo; varias, difícil |
| Foto de móvil → PDF | 2–6 MB / página | 100–400 KB / página | Necesita menos DPI + escala de grises |
| PDF de texto (exportación de Word) | Ya es pequeño | Casi sin margen | Ya cumple; no hace falta |
| Folleto / portafolio con muchas imágenes | 5–20 MB+ | 1–5 MB | Prácticamente imposible |
El árbol de decisión: ¿qué camino para el archivo que tienes en las manos?
Aquí tienes la metodología destilada en un juicio ejecutable. Empieza por «qué tipo de archivo es esto», sigue la rama y llegarás a la estrategia con menos esfuerzo y menos borrosidad.
- Solo texto (exportación de Word/Docs, sin imágenes escaneadas)Normalmente ya es < 1MB; no hace falta comprimir. Si debes hacerlo, conserva el PDF original en lugar de rasterizar para que el texto siga siendo seleccionable.
- Escaneo de texto en blanco y negroEscala de grises + bajar la resolución a 150–200DPI, usa el ajuste de 200KB; normalmente una pasada basta.
- Escaneo / foto en color, una o pocas páginasFija el objetivo (según el límite de subida) e intenta conservar el color primero; si no llega, pasa a escala de grises o baja un escalón de DPI.
- Decenas de páginas, debe ser de unos pocos cientos de KBRecorta páginas primero con Eliminar páginas / Dividir PDF y luego comprime; el número de páginas es un suelo físico que no puedes comprimir más allá.
- Folleto / portafolio con muchas imágenesComprime las imágenes de origen y luego reconstruye el PDF, o asume un objetivo mayor (p. ej. ≤10MB); comprimir de más destroza el material.
Por qué un archivo a veces «no se comprime»
«No baja más» casi nunca es una herramienta rota: es un suelo físico: el archivo está cerca de su límite de densidad de información, y exprimir más solo cambia nitidez por tamaño a un cambio pésimo. El valor de la metodología es reconocer esto pronto en lugar de pulsar el botón una y otra vez.
- Las imágenes ya están muy comprimidas: un JPEG de origen de baja calidad no tiene redundancia que quitar, así que solo pierdes calidad. Afloja el objetivo.
- Páginas × suelo por página > objetivo: 100 páginas escaneadas no caben en 200KB si cada una necesita al menos 20KB. Reduce páginas primero.
- El objetivo es demasiado agresivo: machacar un escaneo en color nítido hasta 30KB lo deja inservible. Prueba 200KB y luego aprieta por pasos.
- En realidad es un PDF de texto: ya es pequeño y casi sin margen; «no baja» es normal, porque nunca necesitó compresión.
Preguntas frecuentes
¿Por qué un escaneo es decenas de veces mayor que una exportación de Word con el mismo número de páginas?
Porque un escaneo es un mapa de bits de alta resolución por página (datos de imagen), mientras que una exportación de Word es texto vectorial que apenas suma tamaño. Toda la diferencia viene de «imágenes vs. texto», que es también por lo que el escaneo se comprime muchísimo y el PDF de texto casi no tiene margen.
¿Qué importa más para el tamaño: menos DPI o más tasa JPEG?
Normalmente menos DPI: reducir el DPI a la mitad recorta el número de píxeles a un cuarto, una caída casi al cuadrado en tamaño, mientras que la calidad JPEG es un cambio más lineal sobre una rejilla de píxeles fija. En la práctica usas ambos, y el «comprimir a un tamaño objetivo» de CompressCat los equilibra por ti.
¿Puede la compresión sin pérdida llevarme a 200KB?
Casi nunca. La compresión sin pérdida solo quita redundancia (metadatos, objetos duplicados) y normalmente ahorra entre el 5 y el 25 %, ni de lejos lo suficiente para llevar un escaneo de varios megas a 200KB. Cumplir un objetivo estricto necesita compresión con pérdida (bajar resolución / JPEG / escala de grises).
¿Cómo sé si mi archivo puede llegar al objetivo?
Usa la tabla de referencia: un escaneo de texto B/N a 200KB suele ir bien, un escaneo en color de varias páginas es más difícil, un portafolio con muchas imágenes es prácticamente imposible. Comprueba primero el tipo de contenido para decidir si tu objetivo es realista; ahorra muchos intentos en vano.
Actualizado · Equipo de CompressCat