【わかりやすく解説】テキストマイニングとは?|事例や手順、無料で使えるテキストマイニングツールについて

最終更新日 

テキストマイニングは、膨大なテキストデータを分析して有益な情報を探し出す手法です。
近年、ビッグデータの解析はあらゆる企業が進めるマーケティング手段となっており、宝の山から経営に活かせる鍵を探し出す手段としてテキストマイニングに注目が集まっています。
果たしてどのような活用法があるのか、無料ツールも含めて紹介します。

テキストマイニングとは?どんなことをするのか初心者にもわかりやすく解説

テキストマイニングには、自然言語処理という技術が使われています。
ビッグデータなど構造化されてないテキストデータから、必要とする情報を抽出する手段として現在もっとも注目されている手法です。
たとえば、使われる単語の使用頻度や相関関係などを知り、市場の傾向などを知ることにも活用できます。
データマイニングから派生した分野であり、これまでデータ分析で用いられてきたノウハウも活かし、さらに発展させた分析手法です。

データマイニングとは

データマイニングは、すでに構造化されたデータベースから有用な情報を抽出する分析手法です。
たとえば、「見える化エンジン」は、Twitterやメールの問い合わせなどの文字列からデータマイニングを行うツールです。
顧客の声を口コミやアンケート、問い合わせなどから効率良く分析し、レポート化することにより、経営に役立つ資料に整えることが可能となります。
あらゆるところからデータを収集し、それを分析、レポート化したり時系列で分析したりすることで経営課題を洗い出し、素早く対応することができます。

テキストマイニングの活用方法とは?

テキストマイニングは、あらゆるテキストデータをそのまま有益な情報源にすることができます。
同じことを人の手で実施しようとすれば、膨大な時間と労力を要し、作業コストが跳ね上がる結果になるでしょう。
テキストマイニングを活用することで、これまで利用したくてもできなかった情報の宝庫から実際に宝を引き当てることが可能となります。

SNSの分析

SNSほど一般消費者の生の声が詰まった場はありません。
口コミや投稿からリアルな声を集め、それをテキストマイニングで分析することで経営に活かせるアプローチ法を見出すことができます。
ユーザー属性で分析することも可能なため、自社がターゲットとする層に絞った情報解析も可能です。
実際に自社の商品やサービスを購入した、利用したという顧客やこれから検討しているという顧客の声を知ることで、どのように評価されているかの実態や競合を調査することに活用できます。

アンケートの分析

アンケート調査は有効でありながら、集計作業に膨大な手間と時間を要するため、従来ではどうしても質問に制限を設けざるを得ない状況でした。
たとえば、自由にコメントしてもらっても分析しきれず、結局決めつけの選択肢からチェックしてもらうしかなかった状況が、テキストマイニングで大きく変わります。
テキストマイニングを活用すれば、ユーザーの自由意見もきちんとデータとして分析が可能となり、より生の声を知ることができます。

コールセンター対応履歴の分析

コールセンターは日夜応対履歴を記録していますが、それを本当に経営に活用できている企業は限られています。
テキストマイニングを活用すれば、対応で出現頻度の高い内容を解析し、顧客満足度を測ることも可能です。
実際にどのような要望やクレームがあるのか、現場を知る手掛かりになります。
このほかにも現在、あらゆるテキストデータの中から有用な情報を引き出す研究が進められているのです。
Webだけでなく新聞や雑誌など、あらゆるテキストをデータ化し、そこから市場を読み解く手段として活用が期待されます。
ただし1点だけネックなのは、日本語(和文)の文節化がAIには難しいということです。
英語であれば単語で一つひとつ区切られ、スペースが空いているので認識は容易です。
日本語の文章は切れ目がほとんどなく、意味をセンテンスで区切るのは容易ではありません。
そのため英語ほどの精度はまだ出せていないことは、あらかじめ理解しておいてください。

テキストマイニングをする手順を解説

テキストマイニングでは、Pythonというプログラミング言語を使用することが多いです。
プログラミングは難しいので、ここではPythonを使用した手順をざっと解説します。
Pythonが使える分析ツールにJupyter Notebookというものがあり、開発環境パッケージAnacondaをインストールするとライブラリが入った状態で始められます。

ステップ1:データを取得

Jupyter Notebookを起動し、New>Python3を選択

ステップ2:コードを書き込む

「In[ ]:」の後にコードを書き込み、Shift+Enterキーで実行します。
一行ずつでもまとめてでも入力可能です。

ステップ3:形態素解析

テキストマイニングを難しくしているのが日本語の問題です。
英語のように単語でスペースがないので、正しく分析するために行うのが形態素解析です。
フリーソフトのKH Coderなどで分析対象のテキストを分析し、単語として理解させる必要があります。

テキストマイニングの具体的事例をご紹介

テキストマイニングを実際に活用している企業の事例を紹介します。

ITAS

株式会社インサイトテックが開発した文章解析ツールで、顧客の声をテキストデータで解析し意見を見つけ出す意見タグAIや可視化AI、感情を分類する感情分類AIの3種類があります。
市場心理指数から予測モデルを構築し、為替相場動向を予測しています。

CODE Meee ONE

株式会社コードミーが開発したツールで、SNS投稿からテキストマイニングします。
Twitter投稿から性格要素と、感情などのキーワードを抽出し、クセなどから深層心理を突き止めたうえで自分だけのアロマを作れるサービスも展開しています。

無料で使えるテキストマイニングツールについて

テキストマイニングのプログラムは、企業が独自に開発し利用しているものも少なくありません。
ただ、無料で誰もが使えるツールも公表されていますので、そちらを紹介します。

KH Coder

ダウンロードして使用するツールで、Windows版ソフトウェアと独自に機能を追加できるソースコードが公開されています。
Macはソースコードからの起動となりますが、有償であれば自動設定ソフトウェアがサポートされているのです。
テキストデータを統計的に分析するためのフリーソフトウェアで、アンケートの自由記述やインタビューなどの解析に使用できます。

統計ソフトR

Windows版、Mac版、Linux版があります。
ダウンロードしてインストールする形式です。
コンソール画面からプログラムを入力するとテキストを解析します。

テキストマイニングで効果的な分析を

テキストマイニングは、これからのマーケティングで重要な位置を占める分析手段です。
膨大なビッグデータの使い道は長らくあらゆる企業が頭を悩ませてきましたが、ようやく有効な活用法が身近に見えてきた状況と言えるでしょう。
日本語という足かせがありますが、日本語を意味のある単語として認識させるツールも登場してきました。
今後ますますマーケティング手段としてテキストマイニングは注目されていくでしょう。

    この記事が役に立ったらいいねやTweetをお願いします!

    執筆者  STRATE編集部

    リード情報をお求めの企業様へ
    STRATE[ストラテ]に貴社サービスを掲載しませんか?

    まずは無料で掲載