扫描件 PDF 为什么特别大、怎么压
扫描件 PDF 特别大,是因为它和文字文档根本不是一回事:扫描出来的每一页本质都是一张高分辨率的彩色图片,几页就能堆到几十兆。要把它压小,关键是降低图像采样和压缩这些图片——而这正是压缩猫的主场。用「压缩 PDF」填一个目标体积、点开始压缩,它会在浏览器本地把扫描页重新采样压缩,常能从几十兆砍到几百 KB 还看得清。下面讲清扫描件为什么大、以及怎么压最有效。
扫描件 PDF 为什么动辄几十兆?
因为扫描件里没有「文字」,只有「图片」。扫描仪或手机拍照得到的是一张张位图,PDF 只是把这些图片一页页装起来。图片的体积取决于分辨率(DPI)和颜色:扫描仪常默认 300DPI 甚至 600DPI 的彩色输出,一页 A4 就可能好几兆,十几页自然几十兆。
相比之下,由 Word、WPS 直接导出的文字 PDF,文字是矢量数据、几乎不占体积,同样页数往往只有几百 KB。所以「同样十页,为什么扫描的就是大」——区别全在于一个是图片、一个是文字。
- 高 DPI:扫描默认 300–600DPI,分辨率越高、像素越多、文件越大。
- 彩色:彩色扫描比灰度、黑白大得多,很多纯文字材料其实不需要彩色。
- 无文字层:扫描页是纯图片,体积全来自像素,不像文字文档那样紧凑。
扫描件用压缩猫压最有效,因为它就是为图片型 PDF 设计的
压缩猫用图像化(rasterize)方式压缩——逐页渲染后降低采样、提高 JPEG 压缩率。对扫描件来说这恰好对症:扫描页本来就是图片,压缩它不会破坏任何「文字结构」(它本来也没有可选中的文字),却能把体积压掉 80%–95%。这也是为什么压缩猫对扫描件压得比对纯文字文档狠得多。
- 打开「压缩 PDF」,把扫描件拖进上传区(可一次多个)。
- 填目标体积,或点 200KB / 500KB / 1MB 快捷预设(按你要过的上传限制选)。
- 点「开始压缩」,压缩猫在浏览器本地逐页重采样、二分逼近目标。
- 对比前后体积、放大确认文字仍清晰后下载。
怎么在压小的同时尽量保住清晰度?
扫描件最怕压到看不清,几个习惯能让你既达标又清楚:源头降彩色、过程别一步压到极限、页数多就先精简。
- 源头省体积:纯黑白文字材料,扫描时就设成「黑白」或「灰度」,比彩色小得多,压起来也更稳。
- 分次收紧:先压到较宽松的目标看效果,清晰可接受再往下压,别一上来就压到 50KB。
- 页数太多先精简:几十页扫描想压到几百 KB 不现实,先用「删除页面」去掉空白页、无关页,或「拆分 PDF」只留要用的页。
- 压完逐页放大,确认文字、印章、签名清晰,再去上传或发送。
常见问题
为什么我的扫描 PDF 只有几页却有几十兆?
因为扫描件每一页都是高分辨率的彩色图片,不是文字。300–600DPI 的彩色扫描一页就可能好几兆,几页叠起来就几十兆。用「压缩 PDF」重新采样压缩,常能砍掉八九成体积。
扫描件压缩后文字还能选中、搜索吗?
不能,但这对扫描件不是损失——扫描页本来就是图片,原本也没有可选中的文字。如果你需要可搜索、可复制的文字,先用「OCR 可搜索化」给它加一层文字层(这是单独的步骤)。
怎么扫描才能让文件一开始就小一点?
扫描时把彩色改成灰度或黑白(纯文字材料尤其没必要彩色),并把 DPI 调到 200–300(够清晰又不臃肿)。从源头省下来的体积,比事后硬压更不掉清晰度。
压缩扫描件安全吗,会上传吗?
安全,不上传。压缩在你的浏览器本地通过 WebAssembly 完成,扫描的合同、证件等材料全程留在你的设备上,不经过任何服务器。
更新于 · 压缩猫团队