2010年06月19日

本の電子化で必要なもの(経験談)

本の電子化で必要なものをまとめてみました。

ブックスキャンさんなど本を電子化してくれる業者に依頼するのも手ですが、自分でやりたい場合は以下のような機材で取り込むことができます。

ひとまずスキャナと裁断機があれば、本を減らし始められるわけですが、経験上、ほかにもあるといいものがいくつかありましたので、そちらも紹介します。


1)両面対応スキャナ(ScanSnapとか)

必須。

関連:
ScanSnap: よし、本を電子化するぞ - ScanSnap S510買ったよ
書籍の電子化、絶賛進行中
ScanSnap: コミックの電子化

本も数百冊となると片面用のフラットベッドスキャナでは事実上無理ですので、両面対応のドキュメントフィーダー付きスキャナを用意しましょう。

現行のScanSnap S1500にはグレースケールモードが搭載されているので、コミックの取り込みもしやすくなっているはずです。

自分の使っているS510ではカラーかモノクロ2値しか使えず、コミックはフルカラーでJPEG取り込み、画像をグレースケール化下上でPDFにまとめる、という手順を踏む必要があり、面倒でした。

フルカラー→グレースケールとしているのは、モノクロ2値だとスクリーントーンがモアレになるのでNG、カラーのままだと紙の黄ばみとかがまさしく黄色く保存されたり、印刷の境界に変な色が出たりしたためです。



2)裁断機

ほぼ必須

関連:うちで使ってる裁断機

本の背の、のり付けされているところをばっさり切り落とすためのものです。

ちょっと高いけどプラスのPK513がいいらしいです。

自分の買った中国製の裁断機は厚い本もばんばん切ってくれてよかったのですが、切断面が背に平行にはならず、下に行くほど裁ち落とす幅が広がってしまいました。

ほとんどの本はノド(http://www.jagat.or.jp/story_memo_view.asp?StoryID=3615参照)に余裕があるので裁ち落としの幅が変わっても大丈夫なのですが、なんというか、落ち着きません(苦笑)

場所がないとか子供がいるとかで、裁断機を買うのはちょっと、という向きにはフェデックスキンコーズでは有料の裁断サービスがあるらしいので、それもありでしょう。ソースはこちら
ただし、公式サイトにはメニューとしての記載はないようです。店頭のパンフレットにも「本の裁断」という項目はありませんでした。



3)電子ブックリーダーまたはiPad

持ち出したいならぜひ。

関連:ソニーの電子ブックリーダー「PRS-505」買った。いいね!

レッツノート使いですが、ノートパソコンを通勤中の電子ブックリーダーとして使うのはちょっと無理がありました(画面が縦長の方がいい!)。

何冊持って出ても荷物が重くならないのが電子化のいいところ。SDカード搭載端末なら、ばんばん入れ替えられます。うちで使っているのはSony Reader PRS-505で、SDとMSの両対応というステキ仕様です。ドイツ語版ですが、こちらで日本語フォントを使えるようにするツールが紹介されています。

Sony Readerについては、2010年内に国内販売というニュースもありましたので、それを待てば日本語化パッチとか使わずに日本語がいけるかと思います。

iPadはページめくりが速いので、そこはうらやましい。高いのでまだ買えてませんが。

Readerは、どうも1ページあたりの画像イメージの容量がおおきいと、表示(ページめくり)が遅くなるようです。文庫本ぐらいであれば、まあまあの速度でページが送られますが、B5変形など大きめの版形の本をReaderで読もうとすると、ページ送りが遅くて気になります。英語のテキストPDFはReaderが内蔵フォントで表示するので、判型にかかわらずそれなりの速度でページが送られます。



4)B5〜A4対応ディスクカッター

カバーを取り込みたいなら必須。

関連:カバーをディスクカッターで裁断して取り込み準備

カッターナイフ+定規+カッターマット、でもできますが、作業効率はディスクカッターの方が断然いいです。

コミックや小説などカバーが重要な本については、カバーも別途裁断して、取り込んで、PDFとしてくっつけます。ScanSnapのPDFビューアは編集機能(ページの切り貼りが可能)がありますし、付属のAcrobatで編集することも出来ます。見開きのページずれが起きないよう、表紙のみ組み込む(表紙・本文1ページ目…)、または、表紙と裏表紙をセットで組み込む(表紙・裏表紙・本文1ページ目…)という並びを使い分けるといいでしょう。

ただ、新書などカバーがいらない本であれば、本文だけ取り込んで終了、でも十分だと思います。ファイル名を書名にすれば、カバーが画像である理由はあまりないです。サムネイル表示にしたときに綺麗なのは楽しいですが、800冊ほど取り込んだ今となっては、サムネイル表示をほとんどしないです。

カバーは別作業になるから、全部取り込むぜ!と最初に走りすぎると気持ちが消耗しちゃうように思います。最初からコミックとラノベのみ、ビジネス書はカバー捨てる、とか割り切った方がいいかも。


5)RAID対応NAS+自動バックアップツール

取り込んだ本のデータが消えないか心配ならどうぞ。

関連:電子書籍保存用にLAN接続するHDDを買ったよ
ドキュメントフォルダを自動で定期的にバックアップする

まあ、何事も「完全」ということはないのですが、PCのScanSnapフォルダに入れっぱなしにしておくよりは、別にコピーをとっておけば、とりあえず安心感アップ。

我が家ではRAID対応のNASを導入しましたが、宅内の複数のパソコンから読めるようにしたかったのと、RAIDであればディスクの故障にある程度耐えるというのがその理由です。

バックアップツールも、手動で起動するタイプは「肝心なときのバックアップだけがない」という事態を招きがちなので、変更があったファイルを自動でバックアップしてくれるフリーのツールを入れています。Genie Timelineです。上位製品は有料ですが、フリー版で十分でした。英語版ですが、日本語ファイルも問題なく扱えますし、画面上でも日本語が化けるといった不都合は今のところ見かけません。


以上です。

本を捨てずに本棚を空けていけるのは、とても助かりますね。
posted by へろ at 09:16 | Comment(0) | TrackBack(0) | 本を電子化する

オライリー、紙の本を持ってる人には電子版をディスカウント提供

米オライリーやるなあ。

洋書の話ですが。

アカウントとって紙の本を登録すると4.99ドルで電子版にアップグレード(?)できるという会員サービスを提供中。買い直し感を抑えつつ電子書籍に移行をプッシュできそうです。

注意書きにもあるように、すべての本で電子版が提供されているわけではないですが、それでもEbook Deal of the dayの$9.99の約半額。オライリー本が本棚にあふれてる人ならけっこう助かりそうです。これ、日本のオライリーにもやってほしいなあ。。。

Upgrade to the electronic version of any print book you've registered at oreilly.com, for just $4.99.

Use discount code ***** in the shopping cart.

To view a complete lists of books you've registered with O'Reilly see "Registered Books" in "My Account" on oreilly.com.

Note: Offer only valid for titles published by O'Reilly Media.
Note: Discount pricing will be shown on the order summary page.
Note: Not all print books are available in ebook format.


登録フォームはこちら
posted by へろ at 08:09 | Comment(329) | TrackBack(0) | 本を電子化する

2010年05月07日

BOOKSCANさんでちょっと気になること

気になることといっても、著作権がどうこうじゃなくて、これを依頼する人がどれくらい期待しちゃってるか、ということなんですが。

 「モノクロ2値だと、そんなに美麗には取り込めないよ」

というのは、できるだけ大声で言っておいた方がいい気がする。

ScanSnapはすごいスキャナだけど、紙の上に載せられたインクのシミを、ローラーで紙送りしながら光学的に撮影するわけだから、限界もあるし、その限界は人の目からすると案外低いわけですよ。特に2値。

自分がScanSnap S510でスキャンして「なんかきれいに取り込めないなー」と苦労したところとして、モノクロ2値だとけっこうぎざぎざに見えちゃったり、網掛け(スクリーントーンみたいな感じのところ)のところもけっこうモアレっぽくなっちゃったり、写真や図版が濃淡がうまくとれなかったり。

あと、これは2値での取り込みに限らないのですが、紙への印刷がそもそも傾いてるので、スキャンしたテキストも画面で見ると右に傾いたり左に傾いたり(これ、PgUp/PgDnで高速ページ送りしていると気になりますが、どうにもならない面も)。

2値はスクリーントーンが苦手ということから、コミックはグレースケールがおすすめ(電子ブックリーダーに持っていきにくくなるけど、PC画面で読む分には問題なし)。

テキストがメインの書籍は基本的に2値の方が読みやすいけど、写真要素が多いときは悩ましい。

とりあえずBOOKSCANさんに依頼するのであれば、全部いきなり送るのではなく、再入手しやすい本から試しに何冊か選んで依頼するのがいいと思います。写真見たらScanSnap S1500を使ってるようなので、試しに依頼したものがダメだと思ったら、自分で同じスキャナ(あるいはキヤノンとかの別商品でもいいし)を買って取り込むこともできるわけですし。
posted by へろ at 11:29 | Comment(0) | TrackBack(0) | 本を電子化する

BOOKSCANさんが規約をゆるめてた!素敵!

本の電子化サービスを開始したBOOKSCANさん。2年以内の本に限るとか、制約が厳しかったのですが、今日サイトを見に行ったらいくつかの制限がゆるめられていました。4月30日付けでの改訂告知だったようです。

とりあえず、年数制限とページ数制限、本の価格制限が、条件つきながら解除されています(要同意等)。

近いうちに依頼するのだー、ということで、候補の本を床に積み上げてみました。さて、頑丈な段ボールを用意しないとね。

bookstack.jpg
posted by へろ at 01:48 | Comment(0) | TrackBack(0) | 本を電子化する

2010年04月30日

5x3カードを電子化する(微妙?

というわけで、懐に入れるようにしている5x3カード。これを書きっぱなしにするのも何だなーと思ってScanSnapに食わせてみました。

・・・微妙。

evernote-and-5x3.png

なんというか、手書きのカードに感じていた密度感が、画面に映った瞬間にスカスカに見える。

「書き込めない感」に由来するのか「手書きをそのまま画像化すること」に由来するのか、「文脈が内容じゃなくてメディアにひもづけられてるんじゃねえの?」とか、ちょっと自信がないのですが。。。

ま、バックアップとしては使えるかな、という感じ。
個人的には、書き込み済みのカードもまだまだ持ち歩くようにしたいです。
posted by へろ at 15:00 | Comment(0) | TrackBack(0) | 本を電子化する

よくある簡易説明書を電子化する

小物家電によくある、ぱたぱたと畳まれた大きい紙のマニュアル。あれも電子化することにしました。

今回取り込んだのは、エネループの単1〜単4兼用充電のマニュアル。

この手のマニュアル、私の場合は畳んだままどっかに無くしてしまうことが多いので何とかしたかった。大したことは書いてないことも多いのですが、インジケーターの色の意味とかマニュアル見ないとわからない情報もありますしね。

■取り込みますよ

最初は長いままScanSnapにくわせて取り込もうとしたのですが、あまりに長いのと、折り目の影響もあり、だんだん紙の傾きが蓄積してきてフィードがうまくいきませんでした。

なので、ページごとに切り離してスキャンすることに。

畳んだ状態で左右を卓上用ディスクカッターで切り落とすと簡単。このくらいなら定規と普通のカッターナイフでも問題なくカットできますが、カッターマットが内蔵されててまっすぐ切れる、というのがとても楽ですね。

切ってしまえば、あとはスムーズに取り込めました。

cutmanual.jpg
posted by へろ at 13:12 | Comment(0) | TrackBack(0) | 本を電子化する

2008年10月27日

書籍の電子化、絶賛進行中

ebook.jpg

というわけで、先週届いたスキャナと裁断機をフル活用して、手持ち書籍をばんばんPDF化しているところ。とりあえず50冊ほど取り込んでみたけど、もうちょっと経験値をあげる要素はあるものの、だいたい良い感触にはなってきたかなと。

ただ、やってもやっても本棚があいてきた感じがしないんだよなあ(^^;;;

・本の背の糊はときどきいっぱいついてるので、裁断しきれてない(ページがつながったままになってる)ときがある。裁断するときはちょっとだけ多めに切り落とす(切り落としすぎると取り込んだときに左右の余白のバランスが崩れるので、ちょっとアレだけど) つながったままのを送ると、ガガガガッと音がしてページが見るからにヨレるので、その場にいればわかる。止めて最初からやり直してもいいし、そのページだけ取り除いて継続しAcrobatであとからページの差し替えをやってもいい。

・カラー・モノクロを自動判定する設定だと、紙によってはモノクロでなくカラーモードで取り込まれることがあるので、書籍はカバーと中ページでモードを切り替える。いちいち設定画面を呼び出すのは面倒なので、プリセットで「表紙用カラー」「書籍用モノクロ傾き補正あり」「コミック用モノクロ傾き補正無し」の3モードを追加して切り替えながら使用(雑誌はカラーページが多いので全ページカラー自動認識で取り込んでる)。

・コミックを取り込むときは「ページの傾きの自動補正」をオフにする。でないと枠線に引きずられて傾きが誤修正されやすい。

・書籍ではベースラインがちょっと傾いただけで読みづらくなるので「ページの傾きの自動補正」をオンにしておく方があとあと読みやすいけど、レイアウトによっては誤修正されるので、そのときは、そのページだけ自動補正をオフにして再取り込み。なんにしても、自動補正をオンにしているときは、取り込み後、全ページをサムネイルでざっと確認しておかないと変な傾きとかおきてるときがある。

・紙によってはバサバサさばいてフィーダに置いても2枚重なって送られたりする(ただし、これが発生したのは50冊ほど取り込んだ中でも「パロディ版アスキー」85年版のみ)。カラーページのコート紙とか、薄手の紙でも今のところ問題なし。

・ただし、ちゃんと1枚ごとに紙が切れてさえいれば、ハードウェア的にページ送りをミスって大きく傾くことはないみたい(紙送りのローラーはちゃんと仕事している)。

・イメージセンサ周辺は定期的に埃をぬぐってやらないと、すぐに細かい埃まみれになる。

・PDF化は1000ページが上限で、書籍によっては分冊にしてやらないといけない(「プログラミングWindows 3.1」がこの制限にひっかかった)。

・裁断機は納品時にべたべた塗られてるさび止めの油を拭き取って、何回か試し切りをして油を吸わせないと、思わぬところに油が残ってたりすることも。うちのは4cm厚が切れるということで、ものとしては無骨だけど非常に作業は快適。
posted by へろ at 11:32 | Comment(0) | TrackBack(0) | 本を電子化する

2008年10月22日

ScanSnap: よし、本を電子化するぞ - ScanSnap S510買ったよ

P1200546.jpg

というわけで、富士通(PFU)の両面対応スキャナ「ScanSnap S510」が届いた! あちこちで「ブックスキャナとして便利!」というレビューが出回ってて(こことかこことか)、ScanSnap自体も前のモデルを会社で触っていたので「まあ、あれならよかろう」って感じだったわけです。(それにしても行正さん、えらい気に入ってるなあw)

で、いっしょに注文した4cm厚対応の裁断機(なんと重量17kg(笑))は発送元が違うのでまだ届いてなくて、とりあえず手元にあったカッターで本をばらして読み込ませてみたのですが、確かに便利。ざーざー読み込んでPDFにしてくれる。しかも、PDFにしたあとで、OCRで日本語テキストをつけてくれるのです。(ちなみにこのテキストは検索用なので、あくまでも裏方データ。ページをめくってるときに見えるのは画像ベースのページ!これも素晴らしい)

本の置き場がないということで優先順位が低めの本は「捨てる」か「売る」しかなかったのですが、これからは「ばらして取り込んで紙は処分」という手が使えるようになります。

いや、むしろ、全文検索がPC上でできるということになると、「本の形で取っておきたいもの」以外は積極的にバラす方向になりそうです。むはー、本が「コレクション」から「資料」になるのですよ。素敵!

scansnap.jpg
posted by へろ at 00:18 | Comment(0) | TrackBack(0) | 本を電子化する