科学書籍は紙本を pdf化して使い倒す

本箱に大量の本が並んでいる様子は本好きにはたまらないインテリアですが、科学書籍はそこに書かれた内容を活用してこその本だと思います。でも数千冊の書籍の中からページをめくりながら必要な情報を探し出すことなど不可能です。なので、科学書籍はpdf化してPCに取り込んでアクロバットの検索機能で有用な情報源として活用しています。
科学書籍は紙本を pdf化して使い倒す

そのために使用しているのは書籍自炊派は必ずこれを買うという裁断機「PLUS PK-513L」とドキュメントスキャナ「ScanSnap S1500」です。S1500はもうすぐモデルチェンジで新型が出ます。
スキャンスナップは「ナショナルジオグラフィック」のようなフニャッとした紙質は苦手なので、次の機種ではそのあたりが改良されていることを望みます。
科学書籍は紙本を pdf化して使い倒す

試しにこの本を pdf にしてみます。
科学書籍は紙本を pdf化して使い倒す

裁断機で閉じてある部分を切り離して1枚ずつになるように本をばらばらにするのですが、カバーと本体は別々に裁断します。
科学書籍は紙本を pdf化して使い倒す

本体の方は、ノリの部分が文章側に残らない位置で余裕を持って裁断します。たとえばこの本の場合はこの赤い線のあたり。
科学書籍は紙本を pdf化して使い倒す

プラスの裁断機はLEDで切断される位置を表示してくれるので、切り落とす位置をLEDの赤い線にあわせてセットします。裁断は力もほとんどいらず、サクッという感じで切り落とすことができます。
ちなみに、危ないので絶対に写真のように裁断部分に指を近づけてはいけませんよ。これは写真撮影のために細心の注意で行っています。
科学書籍は紙本を pdf化して使い倒す

切り落とすとこんな感じ。
科学書籍は紙本を pdf化して使い倒す

カバーはまず正確に二つ折りにして、2カ所を切り落とします。本文を切り落としたときに設定した裁断機のガイドの位置を動かさずに、まず左側を裁断し、右側は裁断機のガイドにあわせて切り落とすとカバーと本体の横幅がきれいに揃います。
科学書籍は紙本を pdf化して使い倒す

カバーを切り落とすとこんな感じ。
科学書籍は紙本を pdf化して使い倒す

裁断したページをスキャンスナップにセットして読み込みます。
専用ソフトウエアで読み取り条件をセットしますが、「知りたいサイエンス」シリーズや「ニュートン」「日経サイエンス」図鑑類のように写真や図表が多用されている本の場合は・・・

 画質:スーパーファイン(カラー 300dpi)
 カラーモード:カラー
 読み取り面:両面
 ファイル形式:PDF
 テキスト認識オプション:日本語・全ページ 【←ここだいじ】
 原稿サイズ:サイズ自動検出
 ファイルサイズ:圧縮(一番弱く) 【←ここもだいじ】

とします。

新書や小説のように図表が重要でない場合は カラーモードを「白黒」にすると、pdfのコントラストが高まって読みやすくなります。「カラー」だと文字がちょっと薄くなります。もちろん、タブレット端末などで読む分には問題になりません。

スキャンスナップには何枚かまとめてドキュメントフィーダー部分にセットできますが、220ページほどある本書の場合はすべてを一度にセットできませんので、少しずつ読み取り部分に載せてスキャンに合わせて補充します。220ページをスキャンするのに要する時間は3分45秒でした。読み取り時間はページの大きさと画質設定によって変化します。
科学書籍は紙本を pdf化して使い倒す

スキャンが終了すると付属のソフトで自動的にOCRされます。時間はかかりますが、資料として活用するためには全ページをOCRすることを必ず行ってください。本書の場合、OCRに要した時間は2分弱でした。これはPCの性能に大きく依存します。また、最終的に pdfをネットワーク上に保存する場合でも、一時ファイルはPC上において下さい。ネットワーク上のファイルをOCRするととんでもなく時間がかかります。ローカルでOCRしたpdfをネットワークに保存しましょう。
ちなみに、220ページを2分間で全文OCRしたPCのスペックは

 SONY VAIO Z
 Core i7-3612QM 2.10GHz
 メモリ 8GB
 壁紙 森園立夏(D.C.III)
 天板 瑠川さらで萌PC化済み(D.C.III)

です。
科学書籍は紙本を pdf化して使い倒す

2分間待ってOCRが終わるとその後の処理を訪ねられますので、あらかじめ決めておいた電子書籍を保存するフォルダに保存します。特に理由は無いですがエバーノートとかは使いません。
科学書籍は紙本を pdf化して使い倒す

こんな感じで科学書籍は雑誌も単行本も新聞記事もすべて同じフォルダに放り込みます。サブフォルダを作ってもいいですが、細かく分類して保存するのは意味がありません。ざっくりと放り込みます。
科学書籍は紙本を pdf化して使い倒す

で、わたしの場合はこんな感じで自宅の NAS に入れています。左側が電子書籍や普段持ち歩かない講演会の動画などを保存しているNASで、1TB×4をRAID6で使用しています。使える容量は2TBになります。これを外付けの2TBでミラーリングし、さらにNASにUSB接続した外付けHDDに時々バックアップしています。USBバックアップは普段はUSBも電源コードも抜いています。不在時に落雷などでNASのデータがすべて破損しても接続していないドライブのバックアップデータは守られますので。

右側のNASはDLNA機能を持っているNASで科学情報テレビ番組などをまとめて保存しています。こちらは1TB×4をRAID5で使用し、外付けドライブで2TB増設し拡張しています。増設分はRAIDになっていません。テレビ番組はまぁ、なくなってもそれほど困らないので、特別な対応は取っていません。
科学書籍は紙本を pdf化して使い倒す

で、保存するとこんな感じ。220ページの本をカラーでスキャンして 150MBくらいです。
科学書籍は紙本を pdf化して使い倒す

検索はアクロバットスタンダードの検索機能で行います。
科学書籍は紙本を pdf化して使い倒す

たとえば、pdf化したすべての書籍から「黄砂」に関する記述を探し出してみましょう。
科学書籍は紙本を pdf化して使い倒す

今のところ、860冊、116GBの科学書籍がpdf化されていますが、2時間くらいで「黄砂」の記事をリストアップしてくれます。ファイルをローカルに置いて検索すればもっと速くなると思うので、1TBの容量がある VAIO Z が発売されたら買い換えて科学書籍はローカルに置こうと思っています。860冊の本を人力で調べるとなると1日では終わらないと思うので、それに比べると圧倒的な速度です。

で、アクロバットが該当する書籍と該当箇所をこのようにリストアップしてくれますので、
科学書籍は紙本を pdf化して使い倒す

気になる文献をクリックすると、下のように該当ページが表示され「黄砂」に色づけされています。全文検索するので、このようなコラム記事でちょっと触れられている程度の箇所まで漏らさず確認することができます。人力で目次チェックをしたのならば、必ず見落としてしまうような該当箇所ですよね。
科学書籍は紙本を pdf化して使い倒す

ちなみにスキャンした書籍は紙ゴミとしてリサイクルしましょう。
科学書籍は紙本を pdf化して使い倒す
 


関連記事
スポンサーサイト
2012-11-25 : 雑談 : コメント : 0 :
コメントの投稿
非公開コメント

« next  ホーム  prev »

おびおのプロフィール

おびおがしかし

Author:おびおがしかし
会社員をしながら科学のコンテンツを作ってます。書籍とか、トークライブとか、セミナーとか、ネットラジオとか、Webコンテンツとか。でも、楽しいことしかしません。楽しいことしかできない病、TD! それがおびおなのです。
苦手な食べ物:シーチキン、レバー、昆虫系
Web:ヴォイニッチの科学書
お気づきの点はメール
twitter:科学の自動会話プログラム ぼっとびお。

スヴァールバルの画像保管庫

スポンサードリンク

スポンサードリンク

ワトソンの検索窓

ロザリンド・フランクリンのダイアリー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

QRコード

QR