紙の本の電子書籍化

 電子書籍端末について、シリーズで書いています。今回は、紙の本の電子化です。私の持っている電子書籍端末はamazonのキンドルですので、キンドル向けに特化したお話も書きます。

 最近、電子書籍端末の話題が盛り上がっており、自作で本の電子化を行うことを、「自炊」と呼ぶようです。

 書籍の電子化を行うには、それなりの仕掛けが必要です。その手順、機器などについてのは「自炊技術Wiki」を参考にして下さい。このサイトでは、非常に詳細にわたり書かれており、自炊に関する大抵のことがわかります。従いまして、機器に関しましては、この記事では要点のみ書きます。

 先ず必要なものはスキャナーです。

 ページ数の多い書籍を、フラットベッドスキャナで1ページずつスキャンするのはなかなか大変な作業です。そこで、自動的に読み取るスキャナが必須です。これは、ドキュメントスキャナと呼ばれます。自動読み取りの方法としては、自動紙めくりを行うスキャナと、自動的にフィード(紙送り)するスキャナが考えられます。前者はちょっと特殊で入手しづらいようです。自宅で行うには後者の、1枚ずつ連続して読み取るタイプのドキュメントスキャナを使うことになります。

<本の裁断>

 その場合、本を裁断(背をはずし、バラバラにする)しなければなりませんので、裁断する器具が必要です。裁断方法はいくつかあります。先ず、ハンディタイプのカッターとしては、
 ・ナイフの形をした普通のカッター。
 ・円盤型の歯のついたロータリカッター
があります。それと、卓上設置型の裁断機としては
 ・円盤型の刃をスライドさせながら紙を切るディスクカッター
 ・レバーを押して刃を押し付けて紙を切る大型のペーパーカッター
等があります。これらの詳細については、「自炊技術Wiki」等を参照して下さい。

 私は、ディスクカッターを使っています。20年くらい前に買ったものです。余り厚いものは裁断できません。結構手間がかかります。読みそうもない本は裁断するのが大変なので、電子化せずに古紙回収にまわす決断がしやすくなりました。なお、裁断しスキャンした後は、もちろん古紙回収です。

 大量の本を裁断するには特殊な器具が必要ですし、結構大変な作業ですの、裁断を請け負う業者も多いようです。インターネットを見ていると、大体1冊100円くらいです。但し、ファイル名をつけたりとかいろいろとオプションがあると値段が上がります。

<ドキュメントスキャナー>

 本をバラスことができましたら、次はスキャンです。自炊のスキャナーとして、よく使われるのは
 ・PFUのScanSnap S1500
 ・キャノンのimageFORMULA DR-2510C
等のようです。実売価格は3万円前後です。スキャナについても、「自炊技術Wiki」等を参照して下さい。

 私は、上のどちらにしようか迷いました。どちらもそれなりのレベルで、甲乙を付けがたいようです。私は、キャノンのDR-2510Cを購入しました。少し安かったから、といそれだけの理由です。以下に、使い方のヒントを書きます。

 実際にスキャンをしようとしたときに迷うのは、
 ・ファイルフォーマット
 ・読み取りのモードについて(カラー、グレイ、白黒か)
 ・解像度の設定
でしょう。

 フィルフォーマットは、汎用性を考慮すると、PDF(OCRしたテキスト付き)で、ということになると思います。

 読み取りモードと解像度については、テキスト検索もできる(キンドルでは日本語検索はできません)ことを考慮しOCRでの文字認識率をある程度保つこと、を前提にしますと、基本的な考え方としては、以下のように、色の有無と図の有無で判断すると良いでしょう。
 ・カラーの図がある場合 → カラー24色、300dpi
 ・色無しだが、白黒(2値)だけではなく灰色部分のある図がある場合 → グレイ 300dpi
 ・図がない場合、および、図はあるが白黒(2値)の場合 → 白黒、400dpi

 なお、古い本をスキャンする場合には、標準の設定ではうまくいかない場合があります。黄ばんだ本もありますし、特に、昭和の時代の本は酸化してひどく赤茶けていることもあります。私は、標準設定の他に、パラメータを設定したいくつかの詳細設定を作り、本の状態により選んでいます。酸化が進んでいる場合は、多少の図があっても白黒2値でスキャンしています。

<PDF化について>

 キンドルの表示面はあまり大きくないため、空白部分を削除したほうが読みやすくなります。私は、アドビのアクロバットのトリミングを使っています。

 また、スキャナーで読み込んだデータは、PDFファイルとして、そのままオリジナルとして保存し、空白をトリミングした結果は、別ファイル(やはり、PDF)として保存しています。これは、キンドル用です。但し、アクロバットでは、トリミングしても元のデータに戻すことができますので、オリジナルを残す必要はありません。ただ単に使いやすくするためです。

 さて、キンドル用に各ページの周囲の空白部を削除する際の配慮について書きます。
 
 私の使っている電子書籍端末キンドルは6インチのサイズです。これは表示面の対角線の長さが約15cmということです。横9cm、縦12cm程度です。私は遠近両用のメガネを使っており、矯正後、30cm程度の距離で視力0.7~1.0程度ありますが、もっと近い距離では視力が落ちています。私にとって小さい文字は苦手です。そのため、縦書きの場合は、40文字+アルファが目安です。横書きの場合は、30文字+アルファ程度かと思います。

 そのため、文庫本はそのままでもOKですが、余白は削ってPDF化する方が読みやすいのは確かです。新書版やB6サイズは上下の空白を削ってPDF化するのが良いでしょう。私は、ページも削ってしまいます。キンドルの表示面にページが現れますので(数ページずれることはありますが)、余り支障はありません。

 それより大きい場合(A5を越す場合)はどうか、というと、場合によります。キンドルには、キンドルを横にしてページを分割して読むモードがあります。が、英語での読みしか考えられていません。つまり、日本語でも横書きの場合はOKです。縦書きの場合、中央あたりで切れているニ段組の場合は多分何とかなるでしょう。しかし、一段組みの縦書きの場合はあきらめるほうがよさそうです。なお、A5程度でも、大きな活字を使っている場合は新書版に準じて判断すればよいでしょう。

 とはいえ、使われている活字のサイズはまちまちですし、視力も人によって違いますので、実際にPDF化してキンドルに入れて試してみるとよいでしょう。

 スキャンとPDF化の具体例は別の記事で書きます。


 なお、この記事に関連する、電子書籍端末のシリーズ記事は以下のとおりです。
電子書籍と電子書籍端末(リーダー)
キンドル(電子書籍端末)の購入
キンドル(電子書籍端末)が到着。どう使う?
紙の本の電子書籍化  ←今お読みの記事です
キンドルのための自炊 -スキャンとPDF化の具体例-
WEBページのPDF化(キンドル用)


この記事へのコメント

この記事へのトラックバック

  • キンドル(電子書籍端末)が到着。どう使う?

    Excerpt: <キンドルを手にして> Weblog: 作って試して見て聴いて racked: 2011-03-01 23:36
  • キンドル(電子書籍端末)の購入

    Excerpt:  私の通勤時間は往復4時間弱で、そのうち3時間弱は電車とバスの中です。私はここを読書用のスペースと考え、カバンには新書、文庫本を中心にいつも何冊か入れてあります。が、結構重くて余り沢山持ち運べません。.. Weblog: 作って試して見て聴いて racked: 2011-03-01 23:39
  • 電子書籍と電子書籍端末(リーダー)

    Excerpt:  今、世の中では、「断捨利」がはやっているようですが、私も物を捨てられないたちで、特に本は捨てられません。そのため、家には本が溢れています。ときどきブックオフに持ち込んだり、売れそうもない本は古紙回収.. Weblog: 作って試して見て聴いて racked: 2011-03-01 23:41
  • キンドルのための自炊 (スキャンとPDF化の具体例-文庫と新書など)

    Excerpt:  自炊とは、紙の本から自分で電子書籍データを作ることだそうで、この記事のタイトルに借用しました。 Weblog: 作って試して見て聴いて racked: 2011-03-07 21:56
  • WEBページのPDF化(キンドル用)

    Excerpt:  web(ホームページ)には貴重な資料が沢山あります。当然、htmlフォーマットが中心ですが、pdf化されている資料もたくさんあります。私は、必要な資料を印刷して持ち歩いたりしており、大変重宝していま.. Weblog: 作って試して見て聴いて racked: 2011-03-16 20:55
  • 紙の本の電子書籍化

    Excerpt:  電子書籍端末について、シリーズで書いています。今回は、紙の本の電子化です。私の持っている電子書籍端末はamazonのキンドルですので、キンドル向けに特化したお話も書きます。 Weblog: 作って試して見て聴いて racked: 2011-03-16 21:02