OCR: convierte escaneos en un PDF con texto reconocible
Tienes un PDF escaneado, quieres buscar una palabra clave o copiar una línea, y nada se selecciona, porque para el ordenador es solo una imagen. El OCR (reconocimiento óptico de caracteres) lee el texto dentro de esa imagen y pone una capa de texto invisible sobre el escaneo original: se ve exactamente igual, pero ahora es buscable, seleccionable y copiable. CompressCat reconoce chino e inglés con un motor WASM local —no se sube nada y el reconocimiento se ejecuta por completo en tu dispositivo—. La precisión depende de la calidad del escaneo: la letra impresa nítida es lo mejor; los diseños complejos, las tablas, la letra manuscrita y los escaneos borrosos de baja calidad son donde le cuesta.
Tienes un PDF escaneado, quieres buscar una palabra clave o copiar una línea, y nada se selecciona, porque para el ordenador es solo una imagen.
El paquete de idioma se descarga la primera vez que lo usas (~20MB para el chino, tu navegador lo guarda en caché). El reconocimiento se ejecuta por completo en tu dispositivo: no se sube nada. Cuantas más páginas tenga el escaneo, más tardará; ten paciencia.
¿Cómo ocr (pdf con texto reconocible)?
- 1Selecciona un archivo PDF escaneado.
- 2Elige el idioma de reconocimiento (chino + inglés, o solo inglés para más velocidad).
- 3Pulsa «Crear PDF con texto reconocible» y espera al reconocimiento página a página (los datos de idioma se descargan en el primer uso).
- 4Descarga el resultado: el nuevo PDF te permite buscar y copiar su texto.
¿Por qué usar CompressCat para ocr (pdf con texto reconocible)?
- Añade una capa de texto invisible y deja la imagen original intacta: la página se ve idéntica al escaneo, pero Ctrl+F encuentra palabras y puedes copiar pasajes enteros; no reorganiza tu página en un documento nuevo.
- Todo el reconocimiento se ejecuta en tu navegador con el motor tesseract, así que los historiales médicos, los carnés y los contratos nunca pasan por un servidor.
- Lee chino simplificado e inglés, cubriendo la mayoría de los escaneos de oficina; cambia a «Solo inglés» para documentos solo en inglés y va más rápido.
Preguntas frecuentes
La letra impresa nítida (escaneada o fotografiada) da la mejor precisión. Los diseños complejos a varias columnas, las tablas, la letra manuscrita y los escaneos borrosos, torcidos o demasiado oscuros la bajan notablemente: ese es el límite del OCR en el navegador, así que revisa el resultado.
La primera vez descarga los datos de idioma (~20MB para el chino), que tu navegador luego guarda en caché, así que las siguientes son rápidas. La velocidad total también depende del número de páginas y de tu dispositivo.
Sí. Por defecto usa chino simplificado + inglés; si el documento es solo en inglés, cambia a «Solo inglés» para más velocidad.
Sí. El OCR produce un PDF con texto reconocible y capa de texto, que luego puedes pasar por PDF a Word de CompressCat para obtener un .docx editable.
Conviértelo en un flujo automático
¿Necesitas procesar archivos por lotes o encadenar varios pasos? Usa el creador de flujos para combinar comprimir, unir, rotar y marca de agua en una canalización reutilizable.
Actualizado · Equipo de CompressCat
Sources, review and limits
Last verified
2026-06-17
Author
PDFFlow editorial desk
Reviewer
PDF processing review
Primary sources
- Procesamiento local de PDF al estilo de PDF.js y pdf-lib donde se utiliza
- APIs de archivos y de descarga del navegador
- Los archivos PDF que tú aportas se procesan de forma local salvo que una página indique lo contrario de forma explícita
Las herramientas de PDF son una ayuda de productividad, no asesoramiento legal, de cumplimiento ni de conservación de documentos. Revisa los documentos exportados antes de firmarlos, presentarlos o compartirlos.