IT・AI・IoT・製造などビジネスに役立つ製品や企業などの最新情報・最新ニュースを随時更新

データマイニングとは?おすすめの分析手法もご紹介

データマイニングとは?おすすめの分析手法もご紹介

年々ITが発展し、文字や映像、音声など膨大なデータが企業に集まっている。その膨大なデータから有益な情報を発掘する技術がデータマイニングだ。まだ知られていないパターンや法則性など役立つ情報を得るため、様々な分析手法によるデータマイニングが行われている。

  1. データマイニングとは?
  2. データマイニングの目的とメリット
  3. データマイニングにおすすめな分析方法
  4. データマイニングを活用した機械学習
  5. まとめ

    1.データマイニングとは?

    データマイニングとは、CRMすなわち『顧客1人ひとりの深い理解に基づく企業と顧客の長期的かつ良好な関係を形成する手法、 戦略』を強力にサポートするテクノロジーだ。より具体的には、企業が収集する大量のデータを分析し、 有用なパターンやルールを発見し、マーケティング活動を支援する統計的手法やツールの集合体ともいえるだろう。

    2.データマイニングの目的とメリット

    データマイニングの目的は、データを分類することで未来を予測し、それに対応することだ。無関係に見えるデータどうしの関係性を発見しセグメントに分類することで、商品の売れる組み合わせや条件といった相関関係を明確にし、業務の改善に生かす。

    たとえば、顧客の属性や購買履歴から嗜好性を把握し、ターゲットを絞り込んだり、対象となる商品やサービスに興味がないと思われる顧客を除外したりすることができます。個々人の好みに合った商品やサービスを提案することができ、優良顧客には特別割引などのインセンティブを与えて、満足度の向上につなげることも可能だ。さらに、顧客の支持を得られそうな商品やサービスを予測し、開発・提案に生かすこともできます。

    データマイニングは業務の効率化にも利用される。製造業なら、機械の使用時間、頻度、故障箇所などのデータから部品交換や点検のタイミングを予測し、効率的にメンテナンスを行えます。

    3.データマイニングにおすすめな分析方法

    データマイニングには様々な方法があり、通常は複数の手法を合わせます。よく使われるものに、ロジスティック回帰分析、ABC分析、アソシエーション分析、クラスター分析、主成分分析などがある。ここでは、その中でもよく使われるクラスター分析、マーケット・バスケット分析、ロジスティック回帰分析、ABC分析を取り上げる。

    クラスター分析

    データから性質に共通性のあるものを選び出し、クラスターつまり集団に分ける手法だ。One to Oneマーケティングやイメージワードの分類などに用いられる。

    クラスター分析を行うには、まずグループに分ける対象をサンプルなのか変数なのか決め、次に分類する方法を階層的か非階層的にするかを決めます。階層的方法とは、距離の近さによって樹形図を作成するものだ。下の階層でつながるほど、真ん中に位置するものほど似ていることを示し、上の階層あるいは両サイドに分かれるものほど似ていないことを表す。この方法は変数の分析に適し、データが多い場合は不向きですが、結果が直感的に分かるのがメリットだ。
    非階層的方法とは、似ている対象はその類似性を、似ていない対象はその非類似性を際立たせるものだ。サンプル分析に適し、データが大量でも結果が安定しているのでビッグデータはこの方法で分析する。
    クラスター分析は似ているか似ていないかの結果を返すだけですから、そこから法則性を見つけ出し、どのようにビジネスに応用していくかは人が判断する。ビジネスでの活用事例は、顧客をデータによって高級品志向、流行品志向、保守的、無関心などに分類し、個々に合ったメルマガを送るなどがある。

    マーケット・バスケット分析

    マーケット・バスケット分析とは、データ同士の関係性を分析するもので、どの商品とどの商品をどのような顧客が同時に購入したかを分析する手法だ。
    データマイニングの利用法の1つで、POSデータやECサイトのトランザクション(取引)データを分析して、“一緒に買われる商品”の組み合わせを発見する探索的データ分析のこと。

    コンビニのPOSデータの分析でよく使われます。また、AmazonなどのECサイトで、レコメンド機能に応用をきかせることができます。

    なお、夕刻、紙おむつとビールが同時に購入される、という有名な事例がアメリカにある。夕食の準備に忙しい母親に言われて商店に紙おむつを買いに来た父親が、自分へのご褒美にビールを買うため、と解釈されている。しかし、実際にこの話を基に商品の配置を変更した商店はないそうだ。

    1顧客による1回の取引データをマーケットバスケット・データといい、これを週や月単位に集計した取引データベースをソースとしてデータマイニングを行う。量販小売業で特に有効とされるが、クレジットカードの取引データや通信系会社の利用記録などに適用することもできる。

    ロジスティック回帰分析

    ロジスティック回帰分析は、発生確率を予測する手法だ。企業ではマーケティング施策に対する顧客の反応を改善するためなどに使いる。

    判別分析と同様に、量的変数から質的変数を予測しますが、予測する変数の値(1か0かなど)を予測するのではなく、目的変数が1となる確率を予測します。目的変数として、DMに対して(反応する/反応しない)の1/0データがあり、それをいくつかの量的説明変数で予測をしようとする場合、どの顧客がどの程度の確率で反応するかという予測ができる。

    ABC分析

    数多い指標の中から重要なものを抽出し、A・B・Cの三段階に優先度をつけて分析する手法だ。売上分析によく用いられ、どのような商品が売れているのかを把握し、商品の露出を高めたり仕入管理に反映したりします。

    やり方は、まず商品ごとに売上額や粗利益、販売数量などのデータを整理し、次にどの指標に着目するかを決めます。売上額に着目するなら、商品ごとに全売上額に占める割合を計算し、結果をもとに商品をAからCのランクに分けます。貢献度の高いAランクの商品は売り切れを避けるため、常に一定量の在庫を確保し、Bランクの商品は在庫がなくなった時点で発注、Cランクの商品は他に有望な商品があれば入れ替えも検討する、という具合で経営に生かします。ただしネットショップの場合は実店舗よりも在庫管理のコストが低いので、細く長く売れるCランクの商品も取り扱いを継続するという判断もあり得る。
    ABC分析を活用する際には、売上だけでなく粗利益や販売数量にも着目し、複数の視点から判断する。

    4.データマイニングを活用した機械学習

    AIにデータマイニングをさせると、人間が仮説を設定しなくても機械が与えられたデータから相関関係や傾向などを見つけ、人では気づかなかったデータの法則や分類が見つかる場合がある。

    そうして得た新たな法則をマーケティングや業務に適用し、例えばこれまでは見過ごしてきた潜在顧客の存在を浮き彫りにしたり、既存の業務フローを改善することも考えられる。
    しかし、データマイニングのツールを用いてデータマイニングを行うと、打ち出の小槌のように常に有用なルールが導き出される、というわけではない。

    例えば、風力および風向きのデータ(A)と、桶屋の売り上げデータ(B)をデータマイニングして「風が吹けば桶屋が儲かる」ルールが見つかったとして、この時「Aが生じるとCのメカニズムによりBになる」のCは機械の中に隠ぺいされて人間には見えない。

    つまり、Cがデータマイニングに利用したデータの中でしか導けないメカニズムである可能性もあり得る。
    また、ルールが存在しないところでルールを発見することはできない。

    ツールを用いて出てきた結果の使い方や応用の仕方は、人間が決めるものなのだ。

    5.まとめ

    データマイニングは、データを分類し関連性を見つけ出し、事象が発生する確率を予測することで、業務改善につなげていく技術だ。コンピュータを使った様々な分析ソフトやツールが開発されているので、目的に合った分析手法を選択することが大切だ。

    Comments

    comments

    よく一緒に読まれている記事・ニュース

    この記事についているタグ

    今話題のニュース・記事

    今話題の特集・コラム