PDF 压缩完全指南
PDF 压缩是通过对页面图像重新编码、降低采样分辨率、剔除冗余数据来减小 PDF 文件体积的处理。最常见的用途是把超标的扫描件、证件照、报名表压到上传系统允许的体积(如 100KB、200KB、500KB、1MB),同时尽量保住清晰度。这篇指南会讲清压缩的原理、有损与无损的区别、什么场景需要压缩、如何用压缩猫精确压到目标大小,以及压不下来时的排查思路。压缩猫全程在你的浏览器本地完成,文件不上传服务器。
什么是 PDF 压缩?
PDF 压缩就是在尽量不破坏可读性的前提下,把一个 PDF 文件变小。PDF 的体积绝大部分来自页面里的图像数据——扫描件、证件照、手机拍的文档照片都是位图,分辨率越高、颜色越丰富,文件就越大。压缩的核心就是对这些图像重新编码:降低分辨率(DPI)、提高 JPEG 压缩率、把不必要的色彩信息丢掉。
对纯文字型 PDF(由 Word、WPS、LaTeX 直接导出的文档)来说,文字本身占的体积很小,能压缩的空间有限;真正能大幅瘦身的,是以图像为主的扫描件和照片型 PDF。理解这一点,是判断「这个文件到底能压多小」的前提。
有损压缩和无损压缩有什么区别?
无损压缩在不丢失任何像素信息的前提下,靠去除文件里的冗余数据(重复对象、未使用的字体、元数据、缩略图缓存)来减小体积。它的好处是画质完全不变,缺点是压缩率有限,通常只能减小一到三成,远远达不到「压到 200KB」这种硬指标。
有损压缩则会真正丢弃一部分图像信息——降低分辨率、提高 JPEG 量化等级——以换取更小的体积。代价是画面会变软、文字边缘可能轻微发虚。绝大多数「压到指定大小」的需求,本质上都需要有损压缩,因为只有它能把几兆的扫描件压到几百 KB。
- 无损:画质不变,压缩率低(约 10%–30%),适合已经不大、只想稍微瘦身的文件。
- 有损:画质有损耗,压缩率高,是「压到 200KB/500KB/1MB」这类硬指标的唯一可行办法。
- 实务建议:先定目标体积,再让工具在清晰度和体积之间自动权衡,而不是手动猜参数。
什么时候需要压缩 PDF?
需要压缩,几乎总是因为某个上传系统对文件体积设了上限。不同场景的限制差别很大,下面是三类最常见的,每一类都有对应的场景指南可以细看。
- 考试报名:教育考试院、各类资格考试报名系统常要求证件照、报名表 ≤200KB,部分照片字段甚至 ≤30KB–50KB。
- 签证材料:使领馆在线预约、银行流水、护照扫描件常要求每个 PDF ≤1MB(部分系统 ≤2MB),且需要批量处理多份材料。
- 政务网站:营业执照、合同扫描、各类申报材料常要求 ≤500KB,超标会直接被驳回、无法提交。
如何用压缩猫把 PDF 压到指定大小?
压缩猫专为「过上传体积限制」设计:你只要告诉它目标大小,它会在清晰度和体积之间二分逼近,自动找到刚好达标的参数,不需要你手动调 DPI 或压缩等级。
- 打开「压缩 PDF」工具,把 PDF 拖进上传区,或点击选择文件(可一次选多个)。
- 勾选「压缩到目标体积」,填入目标大小,或直接点 100KB / 200KB / 500KB / 1MB 快捷预设。
- 点「开始压缩」,压缩猫会在浏览器本地二分逼近你的目标体积。
- 查看每个文件的压缩前后对比,逐个点「下载」保存。若某个文件信息量太大无法达标,会返回它能做到的最小结果并提示「已尽力压缩」。
压缩失败或压不下来,怎么排查?
「压不下来」通常不是工具的问题,而是文件本身已经接近信息密度的下限。下面是几种常见情况和对应的处理办法。
- 文件已经是高度压缩的图像:再压只能略微减小,且画质明显劣化。这时应适当放宽目标体积。
- 页数太多:100 页的扫描件想压到 200KB 几乎不现实。可以先用「拆分 PDF」拆开,或「删除页面」去掉空白页、无关页。
- 目标设得过激:把一份清晰的彩色扫描压到 30KB,结果往往糊到看不清。先试 200KB,不达标再分次收紧。
- 彩色不必要:纯黑白文字扫描没必要保留彩色,转灰度能显著减小体积(可在扫描或导出环节设为灰度)。
- 压缩后无法选中文字属于正常现象:压缩猫用图像化方式压缩,最适合扫描件;纯文字文档压缩后会变成图片,详见下文。
扫描件和文字型 PDF,压缩方式有什么不同?
这是决定压缩效果的关键区别。扫描件(包括手机拍照转成的 PDF)整页本质就是一张图片,压缩猫降低图像采样后能轻松压掉 80%–95% 体积,且不会破坏内容结构——它本来也没有可选中的文字。
文字型 PDF(Word/WPS/导出的电子文档)里,文字是矢量对象,本身几乎不占体积。压缩猫采用图像化(rasterize)方式压缩,会把整页转成图片,结果是文字虽然看得见,但无法再选中、复制或搜索。如果你需要保留可复制的文字,就不要用图像化压缩去处理纯文字文档;这类文件通常也不大,未必需要压缩。
- 扫描件 / 照片型 PDF:压缩率高、效果好,是压缩猫的最佳适用对象。
- 纯文字型 PDF:压缩后文字会变成图片、无法复制;体积本就不大,多数情况不必压缩。
- 混合型 PDF(文字 + 大图):可优先考虑压缩其中的图片来源,或接受图像化后失去文字可选中性。
常见问题
PDF 能精确压到 200KB 吗?
可以。压缩猫会在清晰度和体积之间二分逼近你设定的目标大小(如 100KB / 200KB / 500KB / 1MB)。扫描件、图片型 PDF 通常能稳定压到目标以内;若内容信息量过大无法达标,会返回它能做到的最小结果并提示「已尽力压缩」。
压缩 PDF 会上传到服务器吗?
不会。压缩在你的浏览器内通过 WebAssembly 完成,文件全程留在本地设备,不上传任何服务器,隐私安全。
压缩后为什么文字不能复制了?
压缩猫采用图像化(rasterize)方式压缩,最适合扫描件和照片型 PDF。纯文字型 PDF 压缩后会变成图片,无法再选中或搜索文字。若需要保留可复制的文字,请不要用本工具压缩纯文字文档。
压缩会让清晰度下降很多吗?
取决于你设的目标体积。目标越激进,画质损耗越大。建议先设一个相对宽松的目标(如 200KB)确认清晰度可接受,再视需要分次收紧,而不是一上来就压到极限。
可以一次批量压缩多个 PDF 吗?
可以。压缩猫支持一次选择多个 PDF 并按同一目标体积处理。如果还要在压缩后接合并、加水印等步骤,可以用压缩猫的工作流编排器把多步操作串成一条可保存复用的流水线。
更新于 · 压缩猫团队