ScanSnap S1500で自炊したPDFを、ChainLPで第3世代iPadの最適画素数に変換し、i文庫HDで読書していたところ、トリミングしたはずのページが元に戻っていることに気づきました。そこで、PDFのトリミングについてちょっと試してみた結果をメモしておきます。

■Adobe Acrobat 9でのトリミング

  • Adobe Acrobat 9で「ページのトリミング」をすると、見かけ上はトリミングされたように表示される。
  • ただし、内部的な元画像はそのままで、一部を隠して非表示にしているだけ。
  • 選択ツールでページ全体を選択すると、隠れている部分も含んだ範囲で選択枠が出るので、トリミングされていることが分かる。
  • 余白をゼロに戻すと、隠れていた部分を再び表示させることができる。
  • トリミングの範囲は数値指定しかできず、GUIでの領域指定はできない。
  • 複数ページを一度にトリミング設定できる。
  • OCRテキスト認識をすると、トリミングで隠れていた部分は消滅する。傾き補正時に、隠れている部分を捨てているためと思われる。また、傾き補正の結果ページの端っこに生まれた斜めの余白は、トリミングで隠している。なので、OCRテキスト認識後は大部分のページにトリミングがかかった状態になる。

■ScanSnap Organizerでのトリミング

  • ScanSnap Organizerでトリミングすると、見かけ上はトリミングされたように表示される。
  • ただし、内部的な元画像はそのままで、一部を隠して非表示にしているだけ。
  • 一旦トリミングしてしまうと、隠した部分をScanSnap Organizerで再表示させることはできない。(Adobe Acrobat 9を使えば元に戻せる)
  • トリミングの範囲はGUIで領域指定しかできず、数値での領域指定はできない。
  • トリミングはページ単位のみ。複数ページまとめて設定はできない。

■PDFから画像抽出するときのトリミングの扱い

  • ChainLPでPDFから画像を抜き出すと、トリミング情報は無視される。
  • Adobe Acrobat 9の「ファイル → 書き出し → 画像」を使って画像をJPEGに書き出すと、トリミングが適用された状態で書き出される。「アドバンスト → 文書処理 → すべての画像を書き出し」で書き出した場合も、同様にトリミングが適用された状態で書き出される。
  • xpdfのpdfimagesコマンドでPDFから画像を抜き出すと、トリミング情報は無視される。

自炊したPDFにトリミングをかけるシチュエーションはあんまりないかと思いますが、私の場合、本の帯が細すぎてそのままではScanSnapでスキャンできなかったことがあり、2冊分の帯を養生テープで貼りあわせてスキャンし、ScanSnap Organizerで片方をトリミングしていました。iPadでその本を読んでいたら、全然違う本の帯が一緒に表示されて、一瞬面食らったというわけです。こういう場合はまずJPEGでスキャンして、画像編集ソフトでトリミングしてからPDFに取り込むのがよさそうです。

※バージョンメモ

  • Adobe Acrobat 9 Standard 9.5.1
  • ScanSnap Organizer V4.1L41
  • ChainLP v0.40-9
  • xpdf-3.03