第25回 PDFを編集する①
〜【準備編】PDFは「ページを描く命令の集まり」〜

はじめに

私たちが日常的に利用するPDFは、請求書や契約書、マニュアル、プレゼン資料など幅広いビジネスシーンで欠かせない存在です。しかし、「PDFを編集する」と一口に言っても、WordやExcelの編集とは仕組みが大きく異なります。文字や図形、画像がひとつの紙面に描かれるように配置されているため、内部の構造を正しく理解しておかないと、思わぬトラブルや不具合を招くこともあります。
今回から5回シリーズで、PDF-XChange Editorを使った「PDF編集」の実際を、初心者の方にも分かりやすく解説していきます。初回は「準備編」として、「ドキュメントの設計と構造」を理解するところから始めましょう。

電子文書形式におけるドキュメントの設計と構造

PDFやWordなどの電子文書形式では、それぞれの設計(仕様)に基づいてページ上の情報が記述されます。ページ上の情報は以下の3つの主要カテゴリに分けられます。

文字:グリフ(フォントに含まれる形状)と文字コード(Unicodeなど)を対応付けてページ上に配置するための記述。

図形:始点と終点をページ上の座標で指定したパス、曲線、線の太さ、線や線で囲まれた面の色や透過の指定など幾何的形状を記述。

画像:ビットマップ画像およびそれらを座標に従って配置するための記述

PDFは「ページを描く命令の集まり」

Wordファイルは「文書の論理構造(段落や見出し)」を持ち、Excelは「セルと数値の関係」で成り立っています。これに対してPDFは「ページに対する描画命令の集合体」です。つまり、PDFファイルは『この位置に文字を描く』『この座標に画像を貼る』『この範囲に線を引く』といった命令の連続として記録されているのです。
そのため、PDFを開いたときに目に見える「文字や図形」は、内部的には「描画の結果」に過ぎません。編集時にこの仕組みをすこしでも理解しておくと、期待どおりに綺麗な表示を得やすくなります。

電子文書PDFの基本要素

PDFファイルではページを定義する情報が書かれています。1ページごとにサイズが決められています。そのサイズの範囲内に様々な要素が配置されることで見た目のページが構成されます。そのページ上に配置される主な要素は次の通りです。

1.テキスト:文字コードとフォント、座標を指定して描画

2.パス(線や図形):直線・曲線を定義し、塗りつぶしや線の太さを指定して表示

3.画像:写真などを配置

これらが組み合わさり、最終的に1ページが描かれていきます。PDF-XChange Editorで文字や図形を編集するとき、実際にはこの「描画命令」を書き換えていることになります。

編集の違いを理解する

ここで注意しておきたいのは、PDFの編集は「Wordの文章修正」とは根本的に異なるという点です。

文字の編集

Wordのように「段落全体が流れる」わけではなく、座標ごとに置かれた文字の集まりを修正します。そのため、フォントが置き換わったり、改行位置がずれたりすることがあります。

図形の編集

ExcelやPowerPointで作った図形がPDF化されると「パス」として固定化されます。再編集できる場合もありますが、グループ化や塗りつぶしの仕方によっては思うように動かせないこともあります。

画像の編集

PDF内に直接埋め込まれたビットマップ画像は、拡大縮小はできますが、画質を高めることはできません。元画像が低解像度の場合は注意が必要です。

編集時の注意点

初心者がつまずきやすいポイントをいくつか紹介します。

1.テキストが選択できない

スキャンして作成したPDFは文字情報がなく、単なる画像です。この場合はOCR処理をして文字データを埋め込む必要があります。

2.文字化けやフォント置換

使用されているフォントが環境にない場合、代替フォントで表示され、レイアウトが崩れることがあります。重要文書では埋め込みフォントを確認しておきましょう。

3.編集後にサイズが大きくなる

画像の差し替えや透過効果の多用でファイルサイズが膨らむことがあります。保存時に最適化オプションを活用すると効果的です。

事例紹介

ある企業では、取引先から送られたPDFに誤記があり、自社で修正して回覧する必要がありました。Wordファイルのように簡単に修正できると思ったところ、文字がうまく編集できずに困惑。原因は「テキストがアウトライン化(文字の形を線画で表現)され、文字情報が失われていた」ことでした。このような場合は再入力やOCR処理で対応するしかなく、PDFがどの様に描かれているかを理解していれば、なぜ編集できないのかを納得できたはずです。

まとめ

今回の記事では、PDF編集の前提となる「PDFの基本要素」について解説しました。PDFは文章作成用のファイルではなく、描画命令の集合体です。その仕組みを理解することで、編集の成否や注意点も納得できるようになります。次回は「PDFの文字編集」に焦点を当て、文字情報の扱いと編集の実際を詳しく見ていきます。

記事一覧を見る
ページ先頭へ