情報資源センター・ブログ

情報の扉の、そのまた向こう

公益財団法人渋沢栄一記念財団情報資源センターがお送りするブログです。
渋沢栄一、社史を始めとする実業史、アーカイブズや図書館に関連する情報をご紹介しています。

 Googleブックス定点観測 第25回(最終回) (検索日時:2010.02.28 23:25)

Google Books(http://books.google.com)、およびその日本語版である Googleブックスhttp://books.google.co.jp) での検索結果(件数)の一覧です。
検索結果は表示方法ごとに掲載しています。(さまざまな表示方法についての詳細
 

検索語すべての書籍限定/全体表示全体表示PDO(*)
渋沢栄一 (books.google.co.jp)939(↓)171(↓)1(→)1(→)
渋沢栄一 (books.google.com)976(↓)170(↓)1(→)1(→)
shibusawa eiichi (books.google.co.jp)1007(↓)652(↑)2(→)0(→)
shibusawa eiichi (books.google.com)1168(↓)647(↑)2(→)0(→)
eiichi shibusawa (books.google.co.jp)927(↓)664(↑)2(→)0(→)
eiichi shibusawa (books.google.com)1158(↓)664(↑)2(→)0(→)
shibusawa ei'ichi (books.google.co.jp)296(↓)69(↑)1(→)0(→)
shibusawa ei'ichi (books.google.com)295(↓)69(↑)1(→)0(→)
ei'ichi shibusawa (books.google.co.jp)269(↓)69(↑)1(→)0(→)
ei'ichi shibusawa (books.google.com)297(↓)69(↑)1(→)0(→)
*PDO = Public domain only/公共利用できる書籍のみ
前回(2010.01.31検索)の検索時と比べると、アルファベットで検索してヒットした限定表示の書籍以外は、すべてヒット数が減少、もしくは同じ数になってしまいました。特に、漢字(渋沢栄一)でのヒット数の減少が目立っているように思われます。
 

最終回にあたって

2008年3月に定点観測の第1回を掲載して以来、今回で25回目の連載となりましたが、「Googleブックス定点観測」は2009年度の最終月をもって一端区切りをつけることにいたしました。

Googleブックス定点観測グラフ

  • Googleブックス定点観測、「すべての書籍」におけるヒット数の推移
    第1回(2008年3月)より第25回(2010年3月)まで。「渋沢栄一」および「shibusawa ei'ichi」のヒット数は books.google.co.jp と books.google.com でほぼ一致するためグラフが重なっており、一本の線になっているように見える。

この2年間におけるヒット数の推移を振り返ると、必ずしも右肩上がりになっていないことに気づかされます。スキャン作業は進んでおり、登録されている書籍データも増えているはずだと思われるのですが、そのことがヒット数に直接反映されるわけではないことがよくわかりました。本文の表示範囲が「全文表示」から「限定表示」に変更された例もありますが、Googleブックスの検索アルゴリズムが修正されることによるヒット数の変化も見逃せないところなのではないか、と感じています。日米のGoogleブックスで、ヒット数がいつも同じになるわけではない点も興味深いところでした。
ただ、その中で「shibusawa ei'ichi」「ei'ichi shibusawa」でのヒット数だけ、ほぼ右肩上がりに増加していたことは注目すべき所なのかもしれません。第1回と今回の「すべての書籍」のヒット数を比較すると「98」および「297」となり、この2年の間にヒット数がほぼ3倍となっています。この「3倍」という数字が、Googleブックスに登録されている書籍データの本当の増加率とどのくらい近いものなのかは想像するより他はありませんが、極めて興味深い数字であることは確かだろうと思われます。
Googleブックスは機能面でも進化を遂げてきました。その中でも、書籍本文から地名と思われるものを抽出しGoogleマップ上に展開する機能は注目されてよいものです。第18回の定点観測にも書いたように、それは「今までは不可能だった「地理情報から書籍へ、そしてその内容へ」というアプローチの方法を実現し」、「書籍に書かれている様々な情報を「本」という物理的な囲いの中から解き放ち、新たな利用価値を生み出」しているからです。
KindleiPadなど、新しい形のビジネスモデルを伴った電子書籍端末の出現により、「書籍のデジタル化」への期待は日増しに高まってきています。しかし、私たちは今こそデジタル化ということ、テキスト化ということ、日本語文献をデジタル化・テキスト化するということをよく把握する必要があるのではないかと感じています。日本語による過去の書籍をデジタル化するには、OCRによるテキスト読み取り技術や表示させるフォントの問題、そして第二次大戦以前に使われていた文体を無理なく解析し検索できるようにするエンジンの開発など、解決すべき事柄はまだまだあるのではないでしょうか。実業史研究情報センターでは『渋沢栄一伝記資料』のデジタル化を進めておりますが、このような点にもできるだけ配慮しながら、公開へ向けて尽力してゆきたいと考えております。どうぞご期待ください。
長い間ご愛読いただき、ありがとうございました。
参考:Google ブック検索について
http://books.google.co.jp/intl/ja/googlebooks/about.html