ページの本文へ

Hitachi

株式会社 日立ソリューションズ・クリエイト

テクノロジー テキストマイニングとは? 手法や活用法を解説

テキストマイニングとは? 手法や活用法を解説

マーケティングへの活用や顧客満足度の向上、社内ナレッジの抽出などに役立つ「テキストマイニング」という手法をご存知でしょうか。データマイニングのなかでも、身近なテキストデータを使用することで幅広く活用できるのがテキストマイニングの特徴です。その概要と手法、活用方法について解説します。

テキストマイニングとは

テキストマイニングとは、定型化されていない文章の集合からなるテキストデータをフレーズや単語に分解して詳細に解析し、有用な情報を抽出する分析手法です。テキストマイニングの対象となる文章としては、TwitterやFacebookなどのSNSの文章、顧客からのアンケート回答、コールセンターに寄せられる意見や質問などがあります。

テキストマイニングはもともと、データマイニングから派生した技術・手法です。データマイニングは統計学や機械学習などによる分析を用いて大量のデータから有益な情報、価値ある知見を抽出する手法です。

テキストマイニングの場合は、その分析対象がテキストデータに限定されています。データマイニングのなかでもテキストマイニングが注目されるようになった背景には、AI関連技術によって自然言語処理が実用レベルに達したことが挙げられます。曖昧さやゆらぎが多いという特徴を持つ日本語で書かれた文章でも、その意味をAIがある程度的確に把握し、分析することが可能になりました。

現在ではテキストデータを分析するためのさまざまなテキストマイニングツールが開発・販売されています。ソーシャルデータを取得して分析するツール、ビジネス現場で発生するテキストを分類・分析するツール、ビッグデータの処理に優れたツールなどその種類も増えています。

テキストマイニングでできること

テキストマイニングを利用すると、具体的にどんなことができるようになるのでしょうか。

まず挙げられるのがSNSにアップされた文章を分析して、自社が販売する商品に関する感想を拾い上げ、分析することです。また、ソーシャルデータは他社商品との比較などの競合調査、ユーザーの属性に応じた有効なアプローチ方法の選定、リアルタイムな話題の見える化、インフルエンサーの起用などにも役立ちます。

選択肢方式ではなく、自由回答のアンケートを分析する際にもテキストマイニングを活用できます。インターネットを使って得た膨大な数の回答に対応することも可能です。

コールセンターやカスタマーサポート向けに特化したテキストマイニングツールもあります。対応履歴だけではなく、通話内容をテキスト化する機能を備えたツールでは、顧客とのやりとり中にリアルタイムで適切な回答候補を提示することも可能です。通話ログを分析して顧客の潜在的な要望や顧客満足度を分析する、FAQ作成のヒントを得るといった活用法も考えられます。

一般企業の業務日誌や営業日報などのテキストデータも分析対象となります。業務上の問題点とその解決法など、社内のナレッジを抽出し、蓄積することが可能です。

さらに新聞記事やインターネット上のニュース記事から経済状況や株式市場の変動を分析し、予測を行う試みも行われています。

テキストマイニングの手法

テキストマイニングの手法としてよく知られているのは、センチメント分析、対応分析、主成分分析の3つです。以下、それぞれの概要を説明します。

センチメント分析

文章に込められた顧客や消費者の感情を分析する手法です。主にSNSに書き込まれる文章を分析する場合に利用されます。

センチメント分析は、SNS上の特定のテーマに対するコメントを「肯定的」「中立」「否定的」の3パターンに分類するのが一般的です。そのためネガポジ分析と呼ばれることもあります。ただし、たとえば「ヤバイ」という言葉は使用する年代や文脈によってポジティブともネガティブとも受け取ることができ、機械的に分析するのが難しいといった弱点もあります。

企業が販売した商品を分析するのに利用されるほか、選挙予想にも活用された事例もあります。

対応分析(コレスポンデンス分析)

アンケートやリサーチの結果をクロス集計表で示すとき、目で見てわかりやすくするために散布図を用いて提示する分析手法です。ブランドイメージや自社と競合他社のポジションの違いを可視化する場合などに使われます。

対応分析は次に挙げる主成分分析と比べて、あるものとあるものの差異(または類似)を見つけ出したい場合に適している手法です。

主成分分析

データを解釈しやすくするためにできる限り変数を少なくし、データを要約して提示する分析手法です。主にビッグデータなどの膨大なデータをわかりやすく、分析しやすくするために用いられます。大量のテキストデータの主成分のみを抽出して、人間が理解できるようにまとめた分析というイメージです。ただし、一部の主要でない情報は切り捨てられてしまうというデメリットもあります。

差異の発見ではなく、データを圧縮して関係性を見たい場合には、対応分析よりも主成分分析のほうが適しています。

テキストマイニングはすでにさまざまな分野で活用されています。SNSや自社のビジネス現場で蓄積されるテキストデータを有効活用し、価値ある知見を得る方法を考えてみてはいかがでしょうか。

※「Twitter」は、Twitter,Inc.の商標または登録商標です。
※「Facebook」は、Facebook,Inc.の登録商標です。