本を電子書籍化することで、わかってきたこと
というわけで、明日から仕事が始まり、またもやブログ更新が危ぶまれるので、半年とか立ってしまう前に、書いておきたいことを書いてしまおう。
スキャナを買って、マックも新しくして、文芸誌などを電子書籍化してみたことを前回書いたわけだが、今回は、その続編として、いろいろな感想を書いてみたいと思う。
1。検索可能性と、OCRで文字を認識する現実
アクロバットを使えば、あるいはほかのソフトを使えば、いったん読み込んでPDFファイルにした書籍を、OCRにかけて、文字にすることができる。そしてこのテキストを画像のPDFファイルにくっつけることができる。
こうすると、たとえば、「群像」の2010年1月号から12月号までの間で「猿」という単語が使われた文章を抜き出す、といったことができるようになる。
これは大変便利で、すべての書籍にかけたい処理ではあるが、少々難点があり、結局、私はOCRはかけていない。
問題点は
i)OCRには時間がかかる。古いG4マックでは、1ページにつき1分ぐらいかかっていました。1冊3時間とかいうオーダーです。新しいマックならば、数秒程度ではないかと思われますが、それでも、1冊何分から十何分はかかると思われます。資料検索としては、かなりの冊数をしなくてはあまり意味がないのですが、そうすると、まるまる1日2日は、OCRのために使うというようなことになります。専門でやっているならともかく、私にはそんな時間的余裕はないのです。
ii)ファイルサイズが大きくなる。画像だけの場合とくらべて、OCRテキストをくっつけると倍ぐらいのファイルサイズになってしまいました。原因を調べていないので、このあたりはノウハウをためれば、小さくできるかもしれませんが、とりあえず、今回パスしました。容量がおおきくてもいいじゃないか、という方はそれでもかまわないですが、私の場合、iPhoneに転送するとか、保存のハードディスクとかの問題を考えると、現時点では容量は小さい方がいいからです。
と、実は、技術的な問題や、容量的な問題が主で、これらは、時間が解決するだろうと思っています。で、時間や容量的な問題が解決されたら、OCRにかけることは、むしろ電子化する大きなメリットになると、1冊やってみて実感しました。
目次のかわりに、著者名やタイトルで検索するだけで、そこにジャンプできる、だけでも使用感は紙を超えます。さらに、「ああ、○○っていう文章がこのあたりにあったけど、どこだっだかわからない」というようなことにも、かなりの確率でヒットするだろうと思います。これは大きい。とくにたくさん本があった場合、引用したい1行を探すだけで、半日かかったりすることもあるからです(暇ならそれはそれで楽しいけれど)。
ただ、OCRにかけたテキストを読むことは、不可能でした。読み取りは完璧からはほど遠く、とくに記号やアルファベットが違う文字になってしまっていたりすることがあり、原文を想像することも困難になっていました。ただ、漢字などはかなり正しく認識されているようなので、「猿」がかかれているページを検索するという場合には、おそらくかなり正確に発見できているようでした(確認したわけではないですが)。
本を電子化するの大きな理由は、大量の在庫を小さなメモリチップやハードディスクに納めてしまうことですから、検索はメリットであると同時に、必要不可欠な機能です。なぜなら何千冊の在庫のなかから必要なものを見つけ出すには、タイトルや著者名だけではできないことがたくさんあるからです。これは、ウェブはもちろん、パソコンのファイルや、メールにも今や検索が必要不可欠であることから、理解できると思います。
ただ、それらを取り巻く状況は、まだまだ発展途上だと感じます。処理速度、容量、転送(通信)速度、OCRの認識率、検索などの操作性。しかし、これらは早晩改善されることでしょう。
(今日、家電屋にふらっとよってみたら、1テラバイトのハードディスクが7千円でした。1テラだと、書籍が1万冊ぐらい入りそうです。これが、iPadやらKindoleやらのメモリになると、話はかなり変わると思います)
2。情報以外のものの重要性
前回もちょっと書きましたが、「本文のレイアウト」、というのは、実際のところ、「読む」という行為においては、かなり重要なものではないか、というのが私の直感的な印象でした。
実は、群像の電子書籍版だけでなく、村上龍「歌うクジラ」のiPhoneアプリも買ってみました。まだ、きちんと読み進んでいないので、正確な評価は難しいですが、iPhone用に横書きで、1画面の文字数も少ないので、読むこと自体には問題はない(拡大縮小の必要はない/やろうと思ってもできない)のですが、やはり、もっと1ページには文字がたくさん欲しいなあ、という気がしています。1ページの文字数が少ないのでページ数がやたらあるので、これいつなったら終わるのかなあ、とも思う。でもこれは、私が本になれているからで、ケータイになれている若い人にはむしろ好ましい形態なのかもしれません。
ただ、私が「歌うクジラ」を買った第一の理由は安さでした。書籍を買う約半分の値段でしたから。ただ、文庫を買うよりは高そうなので、本当に安くて携帯性のあるものを読もうと思う人は、文庫を待つだろうと思います。それから、本としてはまあまあの値段ですが、アプリとしては、1400円は高額な部類に入る値段です。ですから、ハードカバーを買ってもいいと思う人間で、iPhoneやiPadを持っていて、なおかつ、小説を電子端末で読んでもいいと思っていて、なおかつ紙にそれほど執着がない人間しか買わないだろうと思います。このあたりずいぶん難しいだろうと思います。(あとは、上に書いたように検索できない仕様なので、そのあたりの利便性は薄い/ただし目次から章へ飛ぶことはできる)
話がずれました。書籍そのものをスキャンすると、本文のレイアウト、あるいはフォントや禁則や割り付けのようなもの(すいません組版についてはいまいちよくわかっていません)も残るわけですが、文字だけ、あるいは内容だけを電子化すると、そのあたりの微妙な味わいがかわってしまうわけです。そして、それはやはり、なにかしら大きな違いを生んでいるような気がします。
それから、表紙。私はいま、表紙はスキャンしないしていないのですが、これはカラーでスキャンして、本文PDFにくっつけるという手間を省いているからで、できれば表紙はカラーで保存しておきたいとは思っています。
今最新のiPod nanoでも、音楽を聴くこととは一見無関係といえるジャケットをキチンとかっこ良く見せる機能がCMなどでも強調されています。私が初めてソフトのiTunesにCDを読み込ませたとき、自動的にインターネットからジャケットや曲名を調べてくれることに驚き、感動した覚えがあります。音楽を聴く、ということには、ただ、音を聴くだけではなく、曲名やジャケットも大切な音楽の要素なんだということを、このソフトは理解しているということに感動したのです。
本も同じで、当然、装丁や本文のこまかなレイアウトにも、本を読むという行為に含まれて
いることを、今回、私は改めて感じました。
3。未来について
音楽好きが、iPod+iTunesの存在を認めるのにどれくらいの時間と、また、どれくらいの機能や環境が必要だったか、を考えることは、本好きが、電子書籍をダウンロードして、携帯端末で読むことを認めるのに、どのくらい時間がかかり、どのような機能と環境が必要かを考えるのに役立つと思う。
いまでも、音楽好きの人の中では、圧縮しない形式で音楽ファイルをパソコンやiPodに保存している人がいる。MP3という非可逆な圧縮形式で音楽を聴くことに、抵抗を持つ人はたくさんいる。けれども多くの人はそれを認めて、それでもかまわないと思い始めている。
それは、ダウンロードで購入することによって失われるもの以上の利便性がある、と多くの人が感じているからだ。その利便性とは、CDを買う手間暇だったり、リッピングや転送する手間、容量の大きさ、手軽に大量の音楽を持ち歩けることだったりする。
私が、「自炊」をしてみて感じることは、「現時点では好事家が最新ガジェットをつかって流行の先端をやってみました、という程のものでしかないが、早晩、このような電子書籍による読書は、多くの本好きの人たちに普及するだろう」ということだ。
それは、電子化することによって失われるもの、以上の利便性を電子化がもたらすことが、実感としてあるからだ。私は本を解体し、スキャンし、パソコンに保存する気持ちは、そのめんどくささよりも、大きい。それだけでなく、今までだったら、本を置くスペースもないから買うのはやめようと思っていた本まで買いかねないぐらいに、本を買うモチベーションを押し上げている。
スキャナーを買ってまだ半月も経たないわけだから、この結論は、まだまだ暫定的なものだが、しかし、本好きとしての私にとってはとてもうれしく、書店員としては極めて厳しい結論になっている。
とりあえず、半年後、私の本の自炊がどんなふうになっているか、それを待ってみる。
追伸
新書を20冊ぐらい解体したのだが、どうしても解体したくない、つまり紙の書籍の形で置いておきたい本があり、それは解体せず、残した。思い入れがある本で、また、どうしても紙で読みたい本だったからだ。それはこれです。
- 作者: 小林恭二
- 出版社/メーカー: 岩波書店
- 発売日: 1991/04/19
- メディア: 新書
- クリック: 7回
- この商品を含むブログ (18件) を見る
続編もいいです。
- 作者: 小林恭二
- 出版社/メーカー: 岩波書店
- 発売日: 1995/02/20
- メディア: 新書
- クリック: 3回
- この商品を含むブログ (19件) を見る
- 作者: 小林恭二
- 出版社/メーカー: 岩波書店
- 発売日: 1997/04/21
- メディア: 新書
- 購入: 4人 クリック: 10回
- この商品を含むブログ (33件) を見る
新書は全部電子化できると思っていたのですが、
どうしても、断裁できない本があることに、やってみて気がつきました。ほんとにいい大切な本はそういうものなのでしょう。私はけっこう平気でガンガンものを捨てたりできるんですけどね。