なぜクラスター分析などの統計学や手法について叫ばれるようになったのか━その時代背景は何なのか

昨今は本屋などに「統計学」について本が多くなってきた印象があります。

他にも中小企業診断士の経営情報システムという科目に統計学についての記

述があります。

自分は以前から不思議に思っていました。

「なぜ統計学なのか」と。

統計学というと「一部の専門家や研究者が使うもの」といったイメージがあ

り、自分のような一般の人間には全然関係がないものと思っていました。

中小企業診断士や会社の仕事で何らかの形で使うからだろうとは思っていま

したが、具体的にどのように使うのか、なぜこの分野が必要なのかと以前か

ら疑問に思っていました。

ですが、ここまでいろいろと勉強してきた中で、「おそらくこういう理由か

らではないか」と思うことを今回は書いていってみます。

データマイニングから「大量のデータから未知の関連性を探る」ことについて

インターネット上で「統計学 なぜ 必要」と検索してみても、いまいち納

得できる答えを見つけることができません。

統計学の「内容」とか「すごさ」といったものや、なんだかすごく難しい単

語はよく見かけるのですが、その統計学が私達の目に入る機会が多くなって

きた「時代背景」に対しての記述というのはなかなか目にしません。

統計学というと、その中に「データマイニング」という言葉が出てきます。

このブログでは『CRM―顧客はそこにいる (Best solution) 』という本につ

いて以下の過去記事で触れています。

その『CRM―顧客はそこにいる (Best solution) 』にはデータマイニングと

いうものについて以下のように書かれています。

p.224

CRM実現の技術要素としてデータマイニングが注目されている。米国

ウォルマートなどの流通業の事例で有名になったこの手法は、金融、

保険、通信などの業界で急速に用いられるようになった。

CRMの分野では、顧客セグメンテーションへの応用が先進的企業によ

って始まっている。データマイニングは一般的に、「大量のデータか

ら未知の関連性を探る」手法と紹介されている・・・

ほうウォルマートや金融、保険、通信の分野でよく使われているのですか。

確かにこれらの分野はかなり高度な数値を使う、といったイメージがありま

す。

これだけだと、まだわかりづらいのでもう少し調べてみます。
データマイニングとは – IT用語辞典

データマイニングとは、情報システムに蓄積した巨大なデータの集合をコン

ピュータによって解析し、これまで知られていなかった規則性や傾向など、

何らかの有用な知見を得ること。

「マイニング」(mining)とは「採掘」の意味で、膨大なデータの集積を鉱

山になぞらえ、そこから有用な知見を見出すことを鉱石を掘り出すことに例

えた表現となっている。

多くのデータの中から何らかの規則性や傾向を見出すこと、というのがデー

タマイニングということですね。

データマイニングというものには、その中に以下のような手法があるようで

す。

  • クラスター分析
  • 相関分析
  • CART
  • カイ二乗分布
  • ニューラルネット

ここで自分の中で点と点が繋がった感じがしました。

「なるほど、今までの大量生産、大量消費の時代では顧客の嗜好は画一的だ

った、だけど多くの顧客に一定の商品がいきわたり、嗜好も多様化するよう

になった。

そういった中で効率よく見込み客を見つけて、効率よく相手の求めている商

品を提供するには『統計学』という分野の知識が必要になってくる」という

ことであろう、というのが自分の考える背景です。

解が見えない現代社会には客観的な事実(エビデンス)が必要

『実践ワークショップExcel徹底活用統計データ分析 改訂新版 (EXCEL WORK

SHOP) 』には次のように書かれています。

p.12

1-1なぜ統計が重要なのか?~ビジネスにおける統計利用~

解が見えない社会では、客観的な事実(エビデンス)に基づく意思決定が求

められます。データは事実を表現するために活用されます。・・・

なるほど、ここまでの文章にも書いてきましたが、顧客の嗜好は多様化して

きて、「これだ」という解は見えなくなってきています。

確かに今の時代は

「良い物をつくれば売れる」というわけではないですし、

「安くすれば良い」というわけでもありません。価格を下げることは体力勝

負になってくるのでなるべく避けたい所です。

「顧客の求めるものをつくればいい」という方法も考えられますが、じゃあ

その「求めるもの」って何なのか。顧客自体がわかっていない、ということ

もあるのです。

現代の「見つけられない解」をいかに見つけるか。

そういった現代の「見つけられない解」をいかに見つけるか。それを「デー

タ」とか「統計」を使って見つけよう、というのが昨今の「統計学が求めら

れる」背景にあるのでしょう。

さらに本書には次のように書かれています。

p.12

例えば、コンビニエンスストアの棚割りは、消費者の時間帯別購入パターン

や商品嗜好パターンに応じて適時調整されます。

スーパーや百貨店の販売戦略は、商品カテゴリー別の特性ホテルやエアライ

ンチケットの価格と付帯サービスは、顧客をセグメンテーションした上でセ

グメンテーション別の要求が徹底的に研究され、セグメンテーション別に価

格やサービスを変える方式が採用されています。

コンビニの棚割りというと「POS(Point of Sales):販売時点管理システム

」が思い浮かびます。他にもFSP(Frequent Shopper Program:顧客識別付販

売管理)データなどの消費者の日常的な購買行動が記録されたデータという

ものも診断士の勉強をしている中で知るようになりました。

要は「我々人間の無意識にとっている行動を分析して、その行動に合うよう

なシステムや商品を提供する」といったイメージかもしれません。その人間

の無意識の行動を分析して企業経営の改善に繋げるためには、「統計学」が

必要になってきているということでしょう。