MAROONのなんでも diary

MAROONの身の回りの諸々を雑多に書き連ねている日記です。(はてな日記からの移行です)

英Times、200年に渡る記事を完全デジタルデータベース化(Impress Watch)

  http://headlines.yahoo.co.jp/hl?a=20080616-00000011-imp-sci

英Timesはこのほど、1785年から1985年までに200年間に渡る記事を検索可能な形でデジタルアーカイブ化し、データベースを公開した。
英国でも最も歴史を誇るメディアの1つであるTimesは、既に「Times Online」という名称で、最近の記事についてネットで提供している。今回、さらに過去の記事をデータベース化し、その歴史資産を活用することで、サイトの魅力を向上させることを図っている。

いやー、すごいですね。このサービスって無料なんですね。ユーザー登録は必要ですが、検索や閲覧には費用がかかりません。日本の新聞社も見習ってもらいたいですね。最近の記事を検索するだけでも有料になっているのが多いですからね(-_-)。200年とは言いませんが、日本の新聞も100年ほどの歴史がある訳で公開されれば貴重な資料になると思います。
試しに「World War」「1945年8月1日〜31日」で検索してみると316件ヒットしました。ここまでは未登録でも出来るようですが、実際の紙面を見るにはユーザー登録が必要です。
残念なのは閲覧できるのは紙面の GIF データでテキスト化まではされていないようですが、これは仕方が無いでしょうね。でも全文ではないにせよ。キーワードを抽出して検索できるように登録する作業は大変だったと思います。
←検索した記事の例


【追記】よく見たら「READ FULL TEXT」というボタンがあって、ここをクリックするとテキスト部分のみをまとめたものがテキスト形式で表示されました。いやー、すごいです。