あいまい検索とは?社内ナレッジの平準化にも役立つ実は優れた検索機能

カテゴリ:技術課題・解決法

あいまい検索とは?社内ナレッジの平準化にも役立つ実は優れた検索機能

あいまい検索とは、短文や質問文などを検索語句として入力した際に、その文章と類似した情報を検索結果として返す検索機能です(類似検索とも呼ぶ)。

他にも、文字の全角と半角、大文字と小文字などを区別せずに検索するのも、あいまい検索の一種として知られています。

実はこのように、あいまい検索の意味や使われ方は実はあまり定まっていないケースも多く、文字通り「あいまい」なのです。

そこで今回は「あいまい検索」にテーマを絞り、

  • あいまい検索とは何か
  • あいまい検索が社内のナレッジを標準化に役立つ理由
  • あいまい検索の未来

についてお伝えします。

最後までお読みいただければ、便利な「あいまい検索」の可能性を感じていただけるでしょう。ぜひお付き合いください。

企業内検索システム「Neuron ES」製品紹介動画
エンタープライズサーチ「Neuron ES」紹介動画
エンタープライズサーチ「Neuron ES」は、企業内に点在する資料やデータの保存場所を意識することなく、素早く欲しいファイルが検索できる企業内検索システムです。本動画は「Neuron ES」の概要や各機能紹介、導入効果をご紹介する「Neuron ES」をクイックにご理解いただけるコンテンツです。ぜひご視聴くださいませ。

動画視聴はこちら

あいまい検索とは

冒頭で紹介したように、あいまい検索とは、短文や質問文などを検索語句として入力した際に、その文章と類似した情報を検索結果として返す検索機能です(類似検索とも呼ぶ)。

他にも、文字の全角と半角、大文字と小文字などを区別せずに検索するのも、あいまい検索の一種として知られています。

一般的なビジネスシーンにおいては上記のような理解で問題ありませんが、実は本来のあいまい検索の意味とはニュアンスが異なります。

本来のあいまい検索の意味

本来のあいまい検索の意味はどういったものでしょうか?少しだけ解説します。
例えば、下のような5つの文字列があったとします。

  • 1:シマリス・シロクマ
  • 2:ネコ・フェレット・ウサギ
  • 3:コビトカバ・シマウマ
  • 4:アマガエル・リクガメ
  • 5:コネコ・ハムスター

この文字列の中で「ネコ」をキーワードにしてあいまい検索を行うと、検索結果は次のようになります。

2:ネコ・フェレット・ウサギ
5:コネコ・ハムスター

どちらも「ネコ」が含まれていますよね。
このように検索キーワードを含むものを取り出すといった基本的な検索方法のことを、本来「あいまい検索」と呼びます。

また、あいまい検索には「前方一致検索」と「後方一致検索」があります。

前方一致検索は、「指定した検索キーワードで始まる」データを取り出す検索のこと。
後方一致検索は、「指定した検索キーワードで終わる」データを取り出す検索です。

先ほどの文字列に対して、前方一致検索で「コ」をキーワードに検索を行うと、

3:コビトカバ・シマウマ
5:コネコ・ハムスター

が検索結果としてヒットします。

同じように、後方一致検索で「マ」をキーワードに検索すると

1:シマリス・シロクマ
3:コビトカバ・シマウマ

がヒットします。

繰り返しになりますが、上記のように何かしらのキーワード(今回は「コ」や「マ」)を含むデータを取り出す(検索結果として抽出する)ことを本来「あいまい検索」と呼ぶのです。

しかし普段私たちが使うあいまい検索の意味合いは、自然文検索や表記揺れなどに対応した検索機能を指すことが多いため、本来の意味と比べると多少違和感を感じるのでしょう。

では私たちがよく利用する使い方に戻って、現在の進化したあいまい検索について詳しく見ていきましょう。

さらに進化するあいまい検索

さらに進化するあいまい検索

現在のあいまい検索はさらに進化しています。

一般的にあいまい検索と聞いて、多くの方がイメージするのは「検索語をうろ覚えでも、多少の誤字脱字があっても何となく検索できる」といったものではないでしょうか。

例えば

  • 「データベース」「データーベース」のどちらで検索しても同じ結果が出てくる
  • 「メガネ」「めがね」「眼鏡」のどれで検索しても同じ情報がヒットする
  • 単語の一部を忘れていても、想定通りの検索結果が得られる

というように、検索語句と完全に一致していなくても、欲しい情報を手にすることができるように進化しています。

またこれらの一般的なあいまい検索に加えて、あいまい検索がさらにその威力を発揮するのが、自然文検索です。

自然文とは私たちが普段会話で表現するような文章のことを指します。自然文検索のメリットは、その場で思いついた言葉で検索できるというもの。

例えば「スマフォで撮影した写真をプリントアウトする方法は?」と検索すると、

  • 「スマホで撮影した写真を印刷するには」
  • 「スマートフォンで撮影した画像を出力する方法」
  • 「スマホで撮った写真をプリントするには」

といった具合に、入力した質問の答えが記載されていそうな類似サイトがいくつも表示されます。

検索キーワードを何にするか考える手間が省けるため、普段検索に慣れていない方でも、検索へのハードルが大きく下がります。

ではこうした「あいまい検索」が、私たちのビジネスシーンにどのようなメリットをもたらすのでしょうか。

あいまい検索が社内のナレッジを平準化に役立つ理由

あいまい検索が社内のナレッジを平準化に役立つ理由

業界・業種に関わらず、今や多くの業務がデジタル化されています。チャット・メール・データ保管ストレージ・各種業務システムなど、多数のITツールを使いこなせなければ仕事が成り立たない方も多いでしょう。

そしてこのようなツールを使いこなす上でも、検索のスキルはもはや必須とも言えます。これからの情報社会を生きていくためには、検索上手であることが圧倒的に有利に違いありません。

しかし当然ながら企業には様々な人が働いています。全ての人が必ずしも検索が得意、というわけではありません。また業界用語・専門用語が思いつかない人もいるでしょう。そうした人を取り残さないようにするのが、あいまい検索の最大のメリットです。

あいまい検索が可能な企業内検索システムの導入で社内のナレッジを平準化

業界用語や専門用語をうろ覚えの新入社員や、ITに抵抗感のある方など、社内情報へのアクセスに時間がかかる人もいるでしょう。

あいまい検索が可能な企業内検索システム(エンタープライズサーチ)を導入すれば、そんな方々でも最短距離で欲しい情報にたどり着けるようサポートしてくれます。

横断検索のイメージ

> エンタープライズサーチとは?主な機能や導入メリット・活用事例を解説

    あいまい検索の機能

  • 自然文による検索にも対応
  • 表記ゆれでも、類似するドキュメントを検索
    検索を補助する機能

  • 類似する文書の最新版のみを表示する
  • 他の従業員からよく利用される文書の優先表示
  • よく検索されるサジェストキーワードの表示
  • 管理者によるサジェストキーワードの登録機能

さらに企業内検索システム(エンタープライズサーチ)は、あいまい検索によって検索が得意でない人の業務をサポートするだけでなく、普段から検索を使いこなしている人にとっても効率的な検索を実現します。

なぜなら、従来から利用するファイルサーバはもちろん、SharePoint OnlineやBoxなどのクラウドストレージ、さらには社内ポータルサイトや社内データベースなども含めて、一括で横断的に検索できるためです。(いちいち各ストレージで検索する必要がない)

上記のほか、企業内検索システム(エンタープライズサーチ)には様々な機能や導入メリットが存在するので、気になる方は下記記事をご覧ください。

> エンタープライズサーチとは?主な機能や導入メリット・活用事例を解説

あいまい検索の未来

あいまい検索の未来

さて、あいまい検索の未来はどうなっていくでしょうか。考えられるのはAI(機械学習)の活用です。

AIを搭載した検索エンジンの登場により表記揺れに対する対応も進化し、よりパーソナライズされた情報が届くようになったり、検索意図の理解が深まると言われています。

具体的には、検索を重ねるごとにAIが検索意図を学習していくことで、検索者の職種や職位に即した内容や、業務の状況に合わせた検索結果が表示されるようになっていくのではないでしょうか。

さらにはそこから派生して、テキストデータだけでなく画像や動画内に映っている情報をあいまい検索によって取り出すことができるようになるとも予想されています。

このように実は奥の深い「あいまい検索」の世界。今後もビジネスシーンを始め、私たちの生活に欠かせない技術の一つとして存在し続けるでしょう。

では最後にあいまい検索の技術的な処理方法について少しだけ触れて、終わりにしたいと思います。

あいまい検索の処理方法

このように便利なあいまい検索(類似検索)ですが、どのような仕組みで検索が行われているのでしょうか。

あいまい検索は、
1.部分文字列を選別する
2.スコアを算出する
といった2つのステップで行われます。

ステップ1:部分文字列を選別する

まず入力した自然文を品詞分解し、キーワードをピックアップします。

先ほどの「スマフォで撮影した写真をプリントアウトする方法は?」という文を品詞分解すると、スマフォ/で/撮影/した/写真/を/プリントアウト/する/方法/は となります。

このうち「で」「を」「は」などは検索対象から外し、キーワードになる語句を抽出します。

上の例だと「スマフォ」「撮影」「写真」「プリントアウト」「方法」となるでしょう。

ちなみに、この文章の分割には「形態素解析」という手法を使うことが一般的です。

ステップ2:スコアを算出する

抽出した各キーワードを全文検索します。そして、それぞれのキーワードがどのくらい出現するか、出現回数や出現集中度などから関連度合いをはかり、スコアを算出します。

先の例でいえば「スマフォ」「撮影」「写真」「プリントアウト」「方法」のうち、どれか1つでも含まれるドキュメントを検索し、それぞれのスコアを算出します。

まとめ

さて今回は、検索機能の一つである「あいまい検索」についてお伝えしました。

あいまい検索は指定した検索ワードを含むデータを探す検索方式で、表記の揺れや誤変換などに対応するほか、自然文検索でも威力を発揮する私たちの検索において協力にサポートしてくれる技術です。

そしてAIの技術によって今後もさらに進化を続け、私たちの生活やビジネスシーンにおいて、欠かせない存在となっていくでしょう。

> エンタープライズサーチとは?主な機能や導入メリット・活用事例を解説

企業内検索システム「Neuron ES」製品紹介動画
エンタープライズサーチ「Neuron ES」紹介動画
エンタープライズサーチ「Neuron ES」は、企業内に点在する資料やデータの保存場所を意識することなく、素早く欲しいファイルが検索できる企業内検索システムです。本動画は「Neuron ES」の概要や各機能紹介、導入効果をご紹介する「Neuron ES」をクイックにご理解いただけるコンテンツです。ぜひご視聴くださいませ。

動画視聴はこちら

企業内検索システム「Neuron Enterprise Search」製品紹介動画 企業内検索システム「Neuron Enterprise Search」製品紹介動画

技術課題・解決法の記事一覧へ戻る

\ 企業におけるデータ活用の最新情報をお届け /

ホワイトペーパー参考弊社ブレインズテクノロジーでは、企業におけるデータ活用の最新情報として下記のようなお役立ち情報を毎月定期的に発信しております。

・企業における情報管理・情報共有の実態調査
・従業員の働き方やデータ活用に関するテーマ
・ナレッジマネジメントに関する課題や解決法  など

メールアドレスの登録のみで無料にて情報をお届けいたします。配信の解除もいつでも可能です。ぜひご登録ください!

※弊社個人情報の取り扱いに同意頂いた上でご登録ください。

まずはお気軽に
お問い合わせください!