なぜクラスター分析などの統計学や手法について叫ばれるようになったのか━その時代背景は何なのか

昨今は本屋などに「統計学」について本が多くなってきた印象があります。他にも中小企業診断士の経営情報システムという科目に統計学についての記述があります。

 

自分は以前から不思議に思っていました。

「なぜ統計学なのか」と。

 

統計学というと「一部の専門家や研究者が使うもの」といったイメージがあり、自分のような一般の人間には全然関係がないものと思っていました。

 

中小企業診断士や会社の仕事で何らかの形で使うからだろうとは思っていましたが、具体的にどのように使うのか、なぜこの分野が必要なのかと以前から疑問に思っていました。

 

ですが、ここまでいろいろと勉強してきた中で、「おそらくこういう理由からではないか」と思うことを今回は書いていってみます。

データマイニングから「大量のデータから未知の関連性を探る」ことについて

回路の概念図

インターネット上で「統計学 なぜ 必要」と検索してみても、いまいち納得できる答えを見つけることができません。

 

統計学の「内容」とか「すごさ」といったものや、なんだかすごく難しい単語はよく見かけるのですが、その統計学が私達の目に入る機会が多くなってきた「時代背景」に対しての記述というのはなかなか目にしません。

 

統計学というと、その中に「データマイニング」という言葉が出てきます。

 

このブログでは『CRM―顧客はそこにいる (Best solution) 』という本について以下の過去記事で触れています。

その『CRM―顧客はそこにいる (Best solution) 』にはデータマイニングというものについて以下のように書かれています。

p.224

CRM実現の技術要素としてデータマイニングが注目されている。米国ウォルマートなどの流通業の事例で有名になったこの手法は、金融、保険、通信などの業界で急速に用いられるようになった。

 

CRMの分野では、顧客セグメンテーションへの応用が先進的企業によって始まっている。データマイニングは一般的に、「大量のデータから未知の関連性を探る」手法と紹介されている・・・

ほうウォルマートや金融、保険、通信の分野でよく使われているのですか。確かにこれらの分野はかなり高度な数値を使う、といったイメージがあります。

 

これだけだと、まだわかりづらいのでもう少し調べてみます。

データマイニングとは、情報システムに蓄積した巨大なデータの集合をコンピュータによって解析し、これまで知られていなかった規則性や傾向など、何らかの有用な知見を得ること。

 

「マイニング」(mining)とは「採掘」の意味で、膨大なデータの集積を鉱山になぞらえ、そこから有用な知見を見出すことを鉱石を掘り出すことに例えた表現となっている。

多くのデータの中から何らかの規則性や傾向を見出すこと、というのがデータマイニングということですね。

データマイニングというものには、その中に以下のような手法があるようです。

  • クラスター分析
  • 相関分析
  • CART
  • カイ二乗分布
  • ニューラルネット

ここで自分の中で点と点が繋がった感じがしました。「なるほど、今までの大量生産、大量消費の時代では顧客の嗜好は画一的だった、だけど多くの顧客に一定の商品がいきわたり、嗜好も多様化するようになった。

 

そういった中で効率よく見込み客を見つけて、効率よく相手の求めている商品を提供するには『統計学』という分野の知識が必要になってくる」ということであろう、というのが自分の考える背景です。

 

解が見えない現代社会には客観的な事実(エビデンス)が必要

『実践ワークショップExcel徹底活用統計データ分析 改訂新版 (EXCEL WORKSHOP) 』には次のように書かれています。

p.12

1-1なぜ統計が重要なのか?~ビジネスにおける統計利用~

解が見えない社会では、客観的な事実(エビデンス)に基づく意思決定が求められます。データは事実を表現するために活用されます。・・・

なるほど、ここまでの文章にも書いてきましたが、顧客の嗜好は多様化してきて、「これだ」という解は見えなくなってきています。

 

確かに今の時代は「良い物をつくれば売れる」というわけではないですし、「安くすれば良い」というわけでもありません。価格を下げることは体力勝負になってくるのでなるべく避けたい所です。

 

「顧客の求めるものをつくればいい」という方法も考えられますが、じゃあその「求めるもの」って何なのか。顧客自体がわかっていない、ということもあるのです。

現代の「見つけられない解」をいかに見つけるか。

そういった現代の「見つけられない解」をいかに見つけるか。それを「データ」とか「統計」を使って見つけよう、というのが昨今の「統計学が求められる」背景にあるのでしょう。

 

さらに本書には次のように書かれています。

p.12

例えば、コンビニエンスストアの棚割りは、消費者の時間帯別購入パターンや商品嗜好パターンに応じて適時調整されます。

 

スーパーや百貨店の販売戦略は、商品カテゴリー別の特性ホテルやエアラインチケットの価格と付帯サービスは、顧客をセグメンテーションした上でセグメンテーション別の要求が徹底的に研究され、セグメンテーション別に価格やサービスを変える方式が採用されています。

コンビニの棚割りというと「POS(Point of Sales):販売時点管理システム」が思い浮かびます。他にもFSP(Frequent Shopper Program:顧客識別付販売管理)データなどの消費者の日常的な購買行動が記録されたデータというものも診断士の勉強をしている中で知るようになりました。

 

要は「我々人間の無意識にとっている行動を分析して、その行動に合うようなシステムや商品を提供する」といったイメージかもしれません。その人間の無意識の行動を分析して企業経営の改善に繋げるためには、「統計学」が必要になってきているということでしょう。

 

コメント