このページは、知のWebマガジンen に連載した「概説情報論〜情報とは何か〜」の12回シリーズの12回目「情報検索(2003年10月号)」の原稿をhtml形式に変換したものです。原文は、http://www.shiojigyo.com/en/backnumber/0310/main3.cfm を参照ください。
第12回 情報検索
今回は情報を収集するための有力な手段である情報検索について述べる。情報検索といっても高度な専門知識が要求される商用データベースを使用した検索から、誰にでもできる検索エンジンを使用したインターネットWeb検索まで様々な情報検索がある。情報検索は通常コンピュータを利用してデータベースをキーワードにより検索することを意味するので、ここでは情報検索を行うために必要な基礎概念と、情報検索の中でも利用頻度の高いと思われる検索エンジンの具体的な使用方法について紹介する。
1.情報検索と情報収集
情報検索は英語でinformation retrievalという。回収する、回復する、取り戻すという意味がretrievalに含まれており、information
retrievalには、必要な情報の存在場所を捜し出し、さらに情報を利用するために存在場所から原文を情報検索者の手元まで持ってくるという意味を含んでいるといって良いであろう。情報発信者が創造した情報を、情報検索者が回収する、回復する、取り戻すというのが情報検索の本来の目的である。
一方、インターネットで検索エンジンを使用して情報検索を行う場合にはinformation searchという言葉が使用される。このinformation searchは私たちが情報を探すという意味を英訳する場合に最初に考える言葉でもある。情報を探る、調べる、たどるといった意味をsearchは持っており、information
searchの意味は必要な情報がどこにあるか探し出すという意味あいが強い。インターネットの情報を検索する場合には、検索エンジンも検索結果から得られる情報の原文も同じインターネット上にあることから、検索エンジンによる情報検索結果から原文の所在場所を示すURLを得ることができるだけでなく、リンクにより原文まで容易にアクセスできる。従って検索エンジンではinformation
searchに原文までのアクセスも含むと考えることができる。しかし、information searchという言葉は、情報を捜し出せばほぼ目的が達成されたような意味合いを持つことから、また検索エンジンの情報と原文の境界をリンクにより簡単に超えられるため両者の違いを意識せずに済むことから、information
retrievalに比べると原文の存在意義が希薄になり、捜し出した情報を活用しようという意欲は弱くなりがちである。
そもそも情報は前に触れたように(3回目参照)「ある特定の目的について判断したり行動の意思決定を行ったりするために役に立つ資料や知識」である。人が情報を必要とするのは、自己の意志に基づいて意図した目的や目標の達成のために、情報に基づいて実現可能な計画や企画を組み立て(企図)、集めた情報とそれまでに有していた知識に基づいて適切な判断や意思決定を行うためである。情報が多ければそれだけ選択肢が多くなり、目的や目標を達成できる可能性が高くなるため意思決定の前の情報収集が非常に重要である。情報収集の対象は情報発信者が創造した、多くの場合は文字で記述された情報の原文である。従って、情報、特に原情報、原文、オリジナル情報を必要な人の手元に持ってくるinformation retrievalとしての情報検索が情報収集の有力な手段となる。単に情報がどこにあるかを探すinformation
searchとしての情報検索は情報の活用を前提とした情報収集のためにはあまり有用でない。
情報検索は情報収集の有力な手段であり、目的や目標を達成するために判断や意思決定に有用な情報の原文を効率的に収集する手段であるといえる。従って、目的や目標が明確な情報検索により得られる情報は有用であるが、目的や目標が不明確な情報検索により得られる情報の多くは活用できない情報となる。そのため、情報検索の前に情報収集の目的や目標をできる限り明らかにしておくことが重要である。
2.データベース
図書館に行って図書カードや索引誌を使用して情報を探すことも広い意味の情報検索である。しかし、現在情報検索といえば電子化された情報ファイルを、コンピュータを使用して適切なキーワードで検索することを意味するといって良い。
情報は通常、情報発信者から情報受信者へメディアを通じて伝達される。情報受信者の存在とは無関係に、情報発信者の意志で情報発信者の発信したい情報が発信される。図1に示すように、情報は常に情報発信者から情報受信者に向かって伝達されるのが基本であり、情報の発信には情報発信者が絶対的な主導権を持っている。これに対し、データベースを利用する場合は図2に示すように、情報を利用したい情報受信者が主にキーワードを使用して情報発信者の情報を探すため、情報受信者が主導権を持つ。情報の伝達は情報受信者からまずデータベースのある情報発信者の方向へ向かうため、図1に示した通常の情報の流れとは逆になる。情報発信には情報発信者の意志が反映され、情報検索の場合には情報受信者の意志が反映された情報の流れとなる。
情報検索では情報に関する著者名、本や雑誌の名前、出版年といった書誌事項といわれる情報が出力されることから、データベースを使った情報検索で良い結果が得られたとしても情報の内容を取得できたわけではなく、書誌事項により原文の所在が確認できたにすぎない。従って、情報収集のためには情報検索の後に書誌事項に基づいた原文の入手作業が不可欠である。情報の多くは通常メディアを通じて発信されることが多いので、原文は図書や雑誌が蓄積されている図書館で入手するのが通常である。情報収集の方法としては情報発信者に直接問い合わせるのが最も確実であるが、本人に問い合わせる場合でも事前にメディアを通じて発表された情報を収集し内容を理解したうえで問い合わせるほうが効果的である。データベースの中には検索結果から必要な情報の原文を発注できる機能を持ったデータベースもある。また原文のコピーサービスを専門に行っている企業も存在する。原文の全文を情報ファイルとするデータベースも存在するが、レイアウトや図表まで原文と同じ内容を表示できるシステムは少ない。原文の入手は、情報収集のためには情報検索と一体のものであるが、情報検索とは別の作業として捉えた方が現実的である。
3.キーワード
情報検索はキーワードを使用して実行される。キーとは車軸と車輪、歯車と軸のように、円形の軸と円形の軸受けをもった物の間にあって力を伝達する働きをする一種のくさび状のものをさす。伝達をより確実なものにするため、くさびのように両者の間に単に差し込むだけでなく、両者に溝をつくりその溝の形に合う形状のキーが使用される場合もある。このようにキーとは2つの物を結びつける手がかりとなるものであり、キーワードも同様に情報の持つ内容と情報を検索する人の間にあって、両者を結びつける手がかりとなる言葉を指す。
人類の資産である知識の本体はほとんどが文字により表現され伝達されている。現在もほとんどの情報は情報の媒介物として文字を使用している。図表、画像などは文字情報の理解を深めるため、あるいは正確に文字情報を伝達するため補完的に使用されているにすぎない場合が多い。情報の本体が文字列で構成されていることから、情報を探す場合も文字列を使って探すことになる。情報検索を行う場合に手がかりとなる文字列の中でも特に重要な語をキーワードと呼ぶ場合が多い。キーワード(複数になる場合が多い)から元の情報の内容が推定できえれば、そのキーワードは良いキーワードであることから、情報の持つ概念を的確に表現する文字列がキーワードとなる。新聞の見出し、雑誌記事の表題、本のタイトルなどは短い文字列で記事の内容をある程度把握できることから、良いキーワードで構成されている例といえる。
英語の場合は文書を構成する単語の間に必ずスペースが入ることから、ストップ.ワードと呼ばれるシステム運営上障害になる語(ワード)を除き、文章を構成する全ての語がキーワードとなる。これに対して日本語の場合は文章を構成する語が連続しているため文章からキーワードとなる語を切り出す操作が必要となる。表1に日経四紙の新聞記事から切り出された情報で始まるキーワードの中で比較的重要だと思われるキーワードを示す(1)。
この表からキーワードの特徴を考えてみると、まず全てのキーワードは物事や状態の名を表す名詞で、情報が示す概念を的確に表現している。形容詞や動詞がキーワードとして使用されても間違いではないが、情報を探すには内容の概念を示す名詞が最も適している。殆どのデータベースでは情報を構成する文章をばらばらにして語を切り出しているが、切りだす対象となるキーワードは名詞である。英語では全ての語をキーワードとして扱えることから、名詞以外の語もキーワードとして有効であるが、基本的に情報検索の役に立つのは日本語の場合と同様に名詞である。名詞には固有名詞と普通名詞があるが、情報検索のキーワードとして考えた場合、情報の概念を特定できる固有名詞がキーワードに適している。さらに、固有名詞の中でも情報の発信源そのものを特定できる人名が情報検索のキーワードに最も適している。人名の次に有効な固有名詞は、人の集合体で組織としての機能を有する会社、団体などの名称であろう。次に有効な固有名詞は人の所属する範囲がもう少し広くなった地名であろう。情報は国家や言語に依存する部分が多く、国の単位で創造、発信されることが多いため、情報の所属する国名は情報が発信される前提となっていることが多い。そのため個々の情報には情報が発信された国名は説明文として含まれておらず、国名がキーワードとして有効に機能する場合は少ない。例えば日本の新聞記事のように日本語で書かれた情報の発信地が日本であることは自明である。そのため、個々の記事に日本というキーワードは一般的に含まれておらず、日本語の情報に対して日本というキーワードは有効に機能しないことが多い。実際は使用するデータベースファイルを使い分けることにより国別に検索する場合が多い。動詞は情報の概念を特定するためにあまり有効でないことから日本語のデータベースでは基本的に使用されていないが、観測する、実施する、影響するなどの場合は、するが動詞であり、観測、実施、影響はキーワードとして有効である。
別のキーワードの特徴としてキーワードの長さがある。表1のキーワードの中で非常に文字数の多い「情報処理技術者試験解答例」を例にとって考えると、このキーワードを構成する基本の単語として、情報、処理、技術、者、試験、解答、例の7語を考えることができる。このうちの2語を組み合わせた、情報処理、処理技術、技術者、回答例、3語を組み合わせた情報処理技術、試験解答例といった言葉もキーワードとして使用可能である。キーワードとして使用する場合にどの長さのキーワードが適当かはデータベースによっても処理方法が異なるため正解はない。キーワードが長くなるほど概念は絞り込まれるので、一般に意味が通用する範囲で最も長いキーワードが適当なキーワードということになる。実際には使用するキーワードを決め付けないで試行錯誤により多くのキーワードによる検索を繰り返すことが重要となる。
4.論理式
幾つかの既知の事実である情報や条件から新しい事実を推し量ることを推論という。推論を行うためには論理記号による論理式が用いられることが多く、情報検索でも既知のキーワードから新しい情報を得るために論理式が使用される。その論理式はand、 or、 notの3つの論理記号から成り検索式と呼ばれる。 and は日本語では「かつ」と表現され、「情報 and 検索」という検索式では、情報と検索という2つのキーワードを含む情報を探すことが可能となる。orは日本語では「または」と表現される、「情報
or 検索」という検索式では、情報と検索という2つのキーワードのどちらか一方あるいは両方を含む情報を探すことが可能になる。
このand とorの概念を説明するために集合を使った図が良く使用される。図3の赤色の丸部分がキーワードに情報を含み、黄色の丸部分がキーワードに検索を含む情報群である。「情報
and 検索」の検索式は、情報(赤の部分)と、検索(黄色の部分)の両方のキーワードを持った情報群が、情報検索で探すべき情報の集合であるという推論を示しており、オレンジの部分が相当する。図4に示す「情報
or 検索」の検索式は、情報と、検索のどちらか一方あるいは両方のキーワードを持った情報が、情報検索で探すべき情報の集合であるという推論であり、オレンジの部分全てが相当する。予備知識のない大学生にこの説明をすると、大多数の学生が理解できた気分になる。しかし、実例で理解度を試してみると、約半数近くの学生は正確な理解レベルに達していない。and、
or、 notを使った検索式は情報検索にとって非常に重要であり、検索エンジンを使用してインターネットの情報を検索する場合にも非常に有効である。検索式の理解を深めることができる例題を以下に示す。
例題: 以下のQ1からQ7に相当する検索式を作り、表2に示す10件の新型肺炎SARSに関する新聞記事見出しから作成した検索式に該当する記事番号を選択し、選択した全件数を回答せよ。但し、SARSと新型肺炎は同じ概念を示すものとする。
|
Q1 北京のSARSに関する記事の検索式を作れ |
|
Q2 北京の新型肺炎に関する記事の検索式を作れ |
|
Q3 北京の、SARSと新型肺炎に関する記事の検索式を作れ |
|
Q4 中国の、SARSと新型肺炎に関する記事の検索式を作れ |
|
Q5 中国と北京の、SARSと新型肺炎に関する記事の検索式を作れ |
|
Q6 SARSと新型肺炎に関する全ての記事の検索式を作れ |
|
Q7 北京の新型肺炎SARSの感染に関する検索式を作れ |
表3に回答を示す。A1、A2のand検索については特に問題は無いと思われるが、A3、A4のor検索における括弧( )の使い方が問題になることが多い。A3を「北京
and SARS or新型肺炎」とすると、A1の「北京 and SARS」の1件(記事番号2)に、「新型肺炎」の回答6件(記事番号1,3,4,5,7,9)を加えた7件が回答となる。orよりandの方が優先されるため、orで部分集合を先に作る必要がある場合は括弧( )を使用する必要がある。A4,
A5, A7も括弧( )の使用方法に注意すれば論理式が完成する。生涯にわたって個人に求められる情報リテラシー能力の一つでもあるので、実際の情報収集や情報検索を行う際にも正しく実行できるように理解を深めておくことが望まれる。
5.検索エンジン
インターネット情報を検索する情報検索システムを検索エンジンと呼ぶ。検索エンジンは情報源と同じインターネット上にあり、同じ階層のサーバで運営されている。そのため検索結果から直接原文(主にサーバ上のWebページ)にアクセスできる。検索エンジンのデータはWeb情報収集ロボットシステムにより、リンクをたどりながら機械的に収集されたものである。収集されたデータは予め設定された手順に従って検索エンジンのデータベースに組み込まれる。多くの検索エンジンは個々の情報に人が関与することなく情報検索システムを稼動させており、情報発信者の文章から取り出したフリーキーワードを使用する情報検索システムとなっている。ほとんどの検索エンジンは広告収入に依存したビジネスモデルからなっていることから、使用頻度の低い論理式による検索機能、検索結果の件数表示などの基本的な情報検索機能を提供する検索エンジンは少なくなっている。また、情報の収集範囲あるいは収集率などの情報源に関する基本的な情報は公開されていない。数ある検索エンジンの中でも、Google, goo, AltaVista, OCNサーチ, HotBotなどは現在でも基本的な検索機能を提供している。これらの検索エンジンでは、表現は統一されていないが多くの場合Advanced
Searchという表示されている機能を使えば、and やorの検索が可能になる。Googleのホームページが示す30億ページという膨大なWeb情報の中から、判断や意思決定に必要な情報を得るには、基本的な検索機能が非常に重要となる。
一方、このようなキーワード方式の検索エンジンではなく、検索エンジンというとYahooを思い浮かべる人が多いと思われる。最近大学に入学した学生の中にはYahooが検索エンジンであると認識している学生がかなり存在する。予めYahooのよって選択されたサイトの情報は、Yahooのカテゴリーに従って整理されており、カテゴリーリストから情報を選択することにより、大カテゴリーから下位カテゴリーに向かって情報を探しだすことができる。カテゴリーは使いやすさに重点が置かれ、現実に存在する情報の実態を踏まえて作られるため完全な分類とは異なり、カテゴリー方式というより(カテゴリー)リスト方式の検索と呼ぶ方が正確であろう。
リスト方式では選択するためのカテゴリーが予め準備されているため、キーワードを自分で考える必要がなく、従って論理式の組み立ても全く必要がない。情報検索の基礎的な理解がなくても誰でも手軽にインターネット上の情報検索が可能である。リスト方式の検索エンジンの使用にあたってキーワードの準備が不要であるということは、収集した情報を使用する目的や目標もあらかじめ設定しなくても情報検索が可能になるということである。Yahooが多くの人に情報検索の能力や機会を与えることになった功績は非常に大である。しかし、目的や目標の明確化なしに収集した情報の活用は不可能であり、判断や意思決定に必要な情報収集の手段という情報検索の本来の意味が希薄になっていることを認識すべきである。Yahooを使う場合でも、収集した情報を使用する目的や目標を予め明らかにしておくべきである。ネットサーフィンという言葉に代表される目的や目標のない場当たり的な情報検索のにより見い出した情報を活用することは困難である。
「検索エンジンはYahooである」と考えられるほどYahooが多くの人に支持されているのは、単にYahooが誰にでも手軽に使えるという事だけではない。Yahooが支持される真の理由は、キーワード方式の検索エンジンによる膨大なページの検索結果より、Yahooの検索結果が情報検索者にとって格段に使えるサイト情報を出力することにある。これは検索方式の違いではなく、Yahoo検索はYahooが(サーファーという人が)使えそうだと判断し選択したサイトのみが検索対象となっていることによる。Yahooは全てのインターネット情報を使えそうなサイトのみに凝縮した、選択的サイト情報提供システムといえる(9,10回参照)。
6.Yahooの使い方(リスト方式)
Yahooは検索エンジンの基本機能にポータルサイトとして多くの機能を付加することにより業務の拡大を図ってきため、ホームページの上半分は検索エンジンとは直接関係ないポータルサイトの機能である。Yahoo!カテゴリの表示から下半分がYahoo本来の検索エンジンとしてのカテゴリーリストである。エンターテイメントで始まる14の大カテゴリーはそれぞれ下位に向かって複数の階層カテゴリーを持つ。14の大カテゴリーリストから順に下位のカテゴリーリストにリンクが張られているので、該当するカテゴリーを順に選択(クリック)することに検索が可能になる。最後に検索対象となるWebサイトへリンクが張られているので最終的にはYahooでなくリンク先のサーバ情報を閲覧することになる。Yahooのサーバとリンク先のサーバの違いを意識することなく検索が可能であるが、Yahooのサーバの情報か、検索先のサーバの情報かを見分けるには、表示しているページのURLのドメイン名にyahoo.co.jpあるいはyahoo.comがあればYahooのサーバの情報で、なければリンク先のサーバの情報である。このリンク先こそがYahooの担当者により利用価値があると判断され選ばれたサイトである。
大カテゴリーリストからのリンクだけで目的とする情報にたどり着けない場合も多いため、Yahooでもキーワード検索が可能になっている。しかしその回答には、Yahoo!カテゴリとの一致、Yahoo!登録サイトとの一致、ページとの一致の3種類が存在する。あまり気にせずに使用されている場合が多いと思われるが、この3種の回答の違いを把握することが、Yahooを一層効果的に使いこなすために重要なポイントとなる。
Yahoo!カテゴリとの一致は、英語ではCATEGORIES あるいはRELATED DIRECTORY CATEGORIESと表示される。これはYahooが独自に選んだWeb
サイトをYahooの基準に従って分類したカテゴリーを表示したものである。キーワードを使って大分類から見出すことができなかった検索対象のカテゴリーを見つけ出すことができれば、そのカテゴリをチェックすることにより関連情報を全て入手することが可能となる。Yahooの情報検索ではまず検索対象と一致するYahoo!カテゴリを探すと良い。
Yahoo!登録サイトとの一致は、英語ではSITE LISTINGSあるいはTOP 20 DIRECTORY RESULTS と表示される。このYahoo!登録サイトとの一致で、サーファーが使う価値があると判断し選択したWeb
サイトが表示される。ページでなくサイトを検索の対象としており、サイトのタイトルとサーファーによるサイトの紹介文が検索対象のキーワードとなる。紹介文は各ページの文章を引用しているが、短い要約文にしているため不要なキーワードが除去され必要なキーワードのみで構成されている。そのため情報の漏れは増加するが、検索結果にノイズが入り難くなる。このYahoo!登録サイトとの一致が、回答結果が簡潔でノイズが少なく、サイトを閲覧した場合に満足度の高い結果が得られる、Yahoo独自の情報検索方法であることを理解しておくと良い。
ページとの一致は、Yahoo!ページとの一致と表現されていないように、Yahoo!カテゴリとの一致あるいはYahoo!登録サイトとの一致とは性格の異なった情報検索結果となる。英語ではTOP
20 WEB RESULTS となっている。この検索結果はGoogleを使用したキーワード検索の結果と同じであり、Yahooが整理した情報の検索結果ではない。検索に使用するキーワード数が多くなるとカテゴリーの名称やサイトの説明文に検索に使用した全てのキーワードが含まれなくなり、該当するカテゴリーやサイトが0件となる。0件という回答結果を避けるため、Yahooの検索結果に代えてGoogleの検索結果が表示されるのがページとの一致である。
キーワードの使用とYahooの機能を両立させるには、使用するキーワードを少なくする必要がある。基本的にキーワードを1語使用しYahooのCategoriesを検索するか、目安としてキーワードを2〜3語使用して登録サイトを検索するのが適当である。登録サイトが表示されたらサイトの表示の上部にあるカテゴリーをチェックすることも有効である。キーワードはスペースで区切って入力するとand検索となる。検索(Search)ボタンの右の検索オプション(Advanced
Web Search)をクリックすると論理式を使用したキーワード方式の検索も可能となる。詳細なキーワード検索を試みれば試みるほどGoogle検索を実行することになり、Yahooの検索機能とは関係のない結果を得ることになるので注意が必要である。Yahooの使用にあたっては、Yahoo!カテゴリとの一致、Yahoo!登録サイトとの一致、ページとの一致の違いを把握し、特にYahoo!登録サイトとの一致の結果を活用できることが重要となる。
7.Google(キーワード方式)の使い方
GoogleはYahooと異なり完全なロボット型の情報収集と一定のアルゴリズムに基づくデータベース化を行っている。ロボット型の検索エンジンは1Webページを1情報として処理を行っているため検索結果は膨大なページリストとして出力され、欲しい情報になかなかたどり着けないという大きな問題を抱えていた。そのため、使用したキーワードがWebページのどの部分にあるか、頻度がどの程度かといったキーワードの使用状態で情報をウエート付けしてウエートの高い順に出力するなど、検索結果の出力順序に様々な工夫が試みられてきた。しかしキーワードによる情報のウエート付けだけでYahooのように使い易い出力結果を得ることは困難であった。
そこでGoogleはそれまでのロボット型の検索エンジンが出力方式で克服できなかった使いやすさを実現するため、リンクが張られている件数の多い順に検索結果を出力するようにした。一般に良く利用されるページはそのページに張られているリンク数が多いため、リンクが多いページを上位に出力すれば、一般の利用者にも利用頻度の高いページが上位に出力されることになる。Googleは実際に使用者が必要とするページを上位に出力することを可能にし、キーワード方式の検索エンジンとしては非常に使いやすいシステムとなった。収録ページは3,307,998,701ウェブページ(2003/8/27)と他の検索エンジンと比べても圧倒的に多く、また情報検索の基本機能も完備していることから、完成度の高い情報検索システムとなっている。なお、約4ヶ前には3,083,324,652ページ(2003/5/5)、さらにその1年まえには2,073,418,204ページ(2002/5/5)であったことから、総ページ数は毎日200万ページの割りで増え続けていることになる。
Googleのホームページのキーワード入力窓の右にある検索オプションをクリックすると検索条件として、すべてのキーワードを含む、フレーズを含む、いずれかのキーワードを含む、キーワードを含めないの4種類の入力窓が表示される。すべてのキーワードを含むがand、いずれかのキーワードを含むがor、キーワードを含めないがnotの検索に相当する。例えば、論理式の所で示した、A7の「北京
and (新型肺炎 or SARS) and 感染」を実行する場合は、すべてのキーワードを含むの窓に「北京 感染」と、and検索を実行するキーワードをスペースで区切って入力する。さらに、いずれかのキーワードを含むの窓に「新型肺炎SARS」と
or検索に相当するキーワードをスペースで区切って入力する。こうしてGoogle検索を実行するとA7の論理式が実行され、検索結果とともに実行したgoogleの検索式「北京 感染 新型肺炎OR
SARS」が表示される。慣れてくれば検索オプションを使用しなくても直接googleの検索式を入力することが可能になる。例えば、A5の「(中国 or北京)
and(SARS or新型肺炎)」は検索オプションの画面から入力することは不可能であるが検索式の欄に「中国
OR北京 SARS OR 新型肺炎」と入力すれば実行できる。論理式の項で説明したand と( )が省かれた検索式になるが基本的には同じ式である。なお検索式を直接入力する場合に、現在のシステムでは、OR は有効であるが、orは単にキーワードとして扱われるので注意が必要である。
フレーズ検索はもともと英語の熟語を探すための機能である。例えば「information literacy」と検索オプションのフレーズ検索の入力欄に入力して検索を実行すると、and検索が実行されるわけではなく単語がこの順に連続する内容を持つ情報が検索される。通常の検索欄に、”information
literacy”と入力しても同じ結果が得られる。日本語の場合もこのフレーズ検索の機能を使えば中間一致検索が可能になる。例えば、"情報検索の方法"と入力すると日本語の文章の中に「情報検索の方法」という部分が含まれている情報が検索される。このようにフレーズ検索は英語、日本語にかかわらず非常に有用な機能である。
Google以外にも情報検索の基本機能を提供しているシステムとしてmsn、HotBot、AltaVistaなどがある。いずれもAdvanced
Searchなどの詳細な検索が可能なページを持っている。いずれも論理式を使った情報検索が実行可能で、検索結果には回答件数が表示される。検索エンジンの詳細については、http://www.nuis.ac.jp/~takagi/(2)にWWW検索エンジンリストを整理しているので参照されたい。
まとめ
1)情報検索は、目的や目標を達成するための判断や意思決定に有用な情報の収集を効率的に行うための有力な手段である。
2)データベースは情報が存在することと、その存在場所を確認するために有効であるが、情報収集のためにはその存在場所から原文を入手することが必要となる。
3)キーワードには情報の概念を示す名詞が使用されるが、中でも固有名詞が有効なキーワードとなる。
4)情報検索はand、 or、 notを使用した論理式で実行されるので、論理式の理解は情報収集を行うために重要である。
5)検索エンジンにはリスト方式とキーワード方式が存在するが、検索結果からリンクが張られているので内容(原文)を直ちに確認することが可能である。
6)リスト方式の検索エンジンであるYahooの検索結果には、Yahoo!カテゴリとの一致、Yahoo!登録サイトとの一致、ページとの一致の3種類が存在する。Yahooの機能を活用するには「Yahoo!登録サイトとの一致」が最も重要になる。
7)Googleは、情報検索機能が充実していること、リンクが多く張られているページを上位に出力すること、そして収集ページが多いことから、キーワード方式の検索エンジンの中では非常に使いやすいシステムとなっている。
資料
(1) 日本経済新聞社:DVD-ROM日経全文記事データベース、日本経済新聞社、1999
(2) 高木 義和:WWW 検索エンジン一覧 List of Search、http://www.nuis.ac.jp/~takagi