Contents
クラスター分析とは
「クラスター」という言葉には、群れや集団という意味があります。そしてクラスター分析とは、多量に集めたデータを分類別やジャンル別に分け、それぞれの特徴や特性、傾向などを見えやすくする手法です。なので、性別や年齢、住んでいる地域など、分類の違いが最初からはっきりしている集団に分けることは、クラスター分析とは呼びません。クラスター分析は、性別など見た目ではっきりしているデータを分ける時には使わず、傾向や特性といった目で見えない部分を分ける時に使われる分析手法なのです。
どういった場面で使われているかというと、一般消費者の購買特性の調査、マーケティングのターゲット分析、Webサイト作成や商品開発におけるペルソナ解析などに使われるケースが多いです。
クラスター分析を理解する上で大切なことをお伝えします。それは、クラスター分析で得ることができる分析結果は、あくまでも分類分けや傾向を掴むための分析結果であるということです。「表面的に分類分けをする際、役立つ分析方法」ということを頭に入れておくと良いと思います。消費者がなぜそのような行動をとったのかまでは教えてくれないので、分析結果からさらに深堀りして分析結果に意味を持たせる必要があります。
クラスター分析の種類
クラスター分析は、主に2つの手法に分けられます。「階層的手法」と「非階層的手法」です。それでは、それぞれを詳しく説明していきます。
階層クラスター分析
ざっくり説明すると、似ているデータ同士でクラスターを組んでいき、階層別に類似度を比較するのが「階層クラスター分析」といいます。階層別に分ける際、樹形図(別名、デンドログラム)で表し見やすくしていきます。樹形図はトーナメント表のような形をしています。そして、「似ている」「似ていない」の類似度の計算結果は、計算時に用いる距離測定方法によって違う可能性があります。主な距離測定方法は5つ程ありますが、よく使われる計算方法は「ウォード法」です。
階層クラスター分析では、最終的にトーナメント表のような図形を作るので、類似度が高いクラスターを判別しやすいのが特徴です。また、計算方法により類似度の結果が違う場合もあるので、どの計算方法で分析したのか把握しておくと分析結果の理解が深まるでしょう。
分析結果が見やすいメリットがある反面、計算量が多いと計算ができなくなったり、結果が安定しないといった状況になる可能性もあります。なので、計算量が少ない分析に適しており、計算量が多い分析には、次に説明する「非階層クラスター分析」を用いると良いでしょう。
非階層クラスター分析
言葉通りトーナメント表のような樹形図を作成せずに行う分析が、クラスター分析です。分析する前に分類したいクラスターの数を決めて計算し、統計的に似ているデータを集めグループを繰り返し作る特徴があります。距離測定の計算方法には、k-means法が主に使われています。
k-means法は、全てのデータ間の距離を計算せずクラスター間の重心距離をもとに計算するため、多量のデータを分析する際に効果を発揮します。そのため、ビッグデータの分析にはこちらの方法が適しているでしょう。ただ、任意にクラスターの数を決めて計算を行うので、予想に近い分析結果が得られない場合は再計算の必要があるかもしれません。また、クラスターの重心はその都度計算されるため、分析毎に結果が少し異なる可能性があるのも注意点です。
クラスター分析で出来ること
実は、色んなことができます。顧客の購買行動や特性の把握、自社ブランドに対するイメージ調査、競合他社との商品比較など様々な情報を分析できます。代表例として、次のような項目があります。
・顧客のグループ化(例:具体的なペルソナ設定)
・情報発信の最適化
・競合他社との区別、差別化
ここでイメージを膨らませてみましょう。例えば、自社で車を販売しているとします。店舗は、地下鉄が開通しており路線バスも多く比較的交通網が整備されている土地にあるとしましょう。そして、この地域で長年車を販売しているが、カーシェアリングや環境問題を意識する人が増えたのか販売台数が右肩上がりにならない。売り上げを伸ばす方法がないか模索中。といった場合、クラスター分析で得られる効果は何でしょうか?
もし、過去の販売実績から顧客情報(独身、子持ち、家持ちの新婚家庭、定年を迎えた夫婦など)を集めることができれば、クラスター分析を使うことで、顧客をグループ化することができます。加えて、それぞれの顧客に比較的売れている車種やタイプも合わせて分かれば、来店時に顧客が求める理想に近い車を提案できる可能性が高まるでしょう。
クラスター分析をすることで、「こうだろう」と思い込んでいる部分を視覚化して分かりやすく仮定を立てられる点が、クラスター分析の強みではないかと思います。
クラスター分析の方法
クラスター分析をする際、次のようなポイントがあります。
・分析する目的を明確にする
・階層クラスター分析か非階層クラスター分析なのか適切に選ぶ
・計算方法を適切に選ぶ
・分析結果から仮説を立てる
それでは、1つずつ具体的にみていきましょう。
分析する目的を明確にする
目的を持って仕事することは何かを成し遂げるにあたって大切です。クラスター分析でも「明確な目的」を決めることがポイントになります。先程、分析方法により得られる結果が違ってくることをお伝えしましたが、目的が明確でないと適切な分析結果を得られない可能性が高まります。アンケート調査で得たビッグデータを分析したいのか、商品のブランディングやライバル企業との比較を分析したいのか、目的が非常に重要になります。
階層クラスター分析か非階層クラスター分析なのか適切に選ぶ
目的を明確にできれば、クラスター分析の種類を選びましょう。階層クラスター分析と非階層クラスター分析の特徴はそれぞれ違います。覚えていますでしょうか?
階層クラスター分析は、分析結果を視覚化しやすいのが特徴です。しかし、大量のデータを分析するのが苦手なので、ビッグデータの解析をすると不安定な結果となり情報の信頼性が低下するかもしれません。分析にかけたいデータ量が多くなく、似ている物同士を見やすくしたい場合に適している方法です。
逆に、非階層クラスター分析は、ビッグデータなどの大量のデータを分析するのに適しています。ただ、欲しい分析結果をある程度予測し、分析の前にあらかじめ、任意でクラスターの数を決める必要があります。そのため、正しいと思われる結果を得るまで再計算する必要がでてくるかもしれません。
これらの特徴を考慮し、どちらの分析に適しているのか検討してみましょう。
計算方法を適切に選ぶ
分析に用いる計算方法により、得られる分析結果が異なってきます。クラスターを作成する際、データが似ているかどうかを判断するために、データ間の距離を測定しています。その距離が近ければ似ていると判断し、クラスターを作っていくのが基本的な計算方法です。そのため、計算方法の特徴をある程度しっておく必要があるでしょう。分からなければ、データ分析会社に分析依頼をするのが良いかもしれません。
分析結果から仮説を立てる
分析結果は「表面的な情報である」と受け取るようにしましょう。分析では、カテゴリー別の袋に分けるまでが仕事と考えると良いと思います。なぜかというと、得られた結果は仮説を立てるのに役立つ情報であり、顧客の心に刺さる情報や商品、サービスを提供するには深堀することが大切だからです。
「顧客はドリルを買うためにお店に来たのではなく、穴を作るためにドリルを買いに来た」という例を聞いたことはありませんか?分析だけで顧客の本質を理解することができていれば、もっと成長している企業は多いでしょう。しかし、そうなっていない現状から、あくまでも分析は表面的な結果であり、深堀する場所のヒントを得るための手段にすぎない、と理解することが大切であると思います。
クラスター分析の使用例
実際にどのような場面で効果的に使えそうなのか?この項目では2つの例を仮定し、クラスター分析の有効性を説明します。
①アンケート調査のデータ分析
市場やアンケート調査のデータ分析にクラスター分析は効果的です。分析により、効果的な施策を打ち出せる確率を高められる例を考えてみます。例えば、顧客に対しスーパーで買い物する基準の調査を実施するとします。アンケートの内容は、品質重視、価格重視、品揃え重視、アクセス重視などを5段階に評価してもらうといった質問項目にしてみます。そうするとクラスター分析で、30代の主婦は価格重視、50代の夫婦は品質重視といった傾向が掴めるでしょう。
アンケート調査を分析したことで、スーパーを選ぶ基準が顧客の年代により変わることが仮定的に分かりました。このように集団の傾向を想定できれば、今度実施するキャンペーンの方向性などが決めやすくなるでしょう。
②メルマガの配信停止率を下げる
顧客に適切なタイミングで適切な情報を配信する、その傾向を掴むためにクラスター分析を使えないか考えてみましょう。メルマガ配信を受け取る側としては、毎日、望んでいない情報を送られてきては非常に迷惑に感じているでしょう。メルマガ配信側に何も改善がなければ、きっと受け取り側は配信停止に至ると思います。そうならないために、配信情報や配信するタイミングの最適化をする必要があります。そこで、最適化にあたりクラスター分析が役立ちます。
例えば、自社で集めた顧客情報をクラスター分析にかけることで、価格が高くても品質を重視して購入する顧客クラスター、低価格を重視する顧客クラスター、ブランド品を重視する顧客クラスターのように顧客の特徴を掴むことができるでしょう。
分類できたことで、メルマガで配信するコンテンツを品質重視、価格重視やブランド嗜好のようにパターン分けでき、顧客が求める情報と配信内容のすれ違いを解消できるかもしれません。また、メルマガを確認する頻度の傾向も合わせて分析できれば、的確な情報を最適な頻度で届けることができるでしょう。
①、②と仮定の例として紹介しましたが、クラスター分析の有効性や効果をイメージしやすくなったのではないでしょうか?
おわりに
クラスター分析が秘める可能性を感じてもらえたでしょうか?商品の売り上げを上げたい、
顧客への情報発信を最適化したい、ペルソナ設定を詳細に決めたいなどの思いがあれば、クラスター分析を取り入れてみると解決の糸口を発見できるかもしれません。
ただ、最後に覚えておいて欲しいことがあります。それは、クラスター分析は表面的な結果であり、中身を詳細に教えてくれる方法ではないということです。あくまでも顧客の傾向や特性に対し仮説を立てられた、という視点を持つことが大切でしょう。
クラスター分析を使う上で、「顧客の購買行動や市場構造の本質的な部分を見抜く確率を高めるためにクラスター分析を使う」といったスタンスが必要になってくると思います。