ROTデータであるダークデータの存在とその有効活用について

最近電車内の広告から「ダークデータ」なる言葉を目にしました。初めて目にするその言葉から「どういったデータなんだろう」と頭から離れずにいました。

 

昨今「ビッグデータ」というものが注目されていますが、必ずしもそれが全て有効活用されているわけではなく、その中にはあまり有効活用されていない「ダークデータ」と呼ばれるものも存在するようです。

 

この分野については、まだあまり調べてはいないのですが、興味があるので今知っている範囲でダークデータというものについて書いていってみます。

ダークデータとは

「ダークデータ」と意味について次の記事で以下のように書かれています。

これだけはマスター!情報戦略キーワード – ダークデータ:ITpro

価値がある(もしくは、あるかもしれない)にもかかわらず、収集・蓄積されるだけで活用されていないデータのことを、ダークデータと呼ぶことがあります。

 

研究・開発者が収集する実験や調査、観測に関するデータは、「実験に失敗した」、「仮説を裏づけるものではなかった」など様々な理由でお蔵入りになることが少なくありません。

 

研究室の片隅で“日の目を見ない”ことから、ダークデータと呼ばれるようになりました。このように元々は学術分野で使われていた言葉ですが、厳密な定義があるわけではありません。

 

企業が保管するデータの85%は価値がないと書かれている記事もあります。「データ」というとパソコンのフォルダ内にある過去のデータなどデジタルデータを思い浮かべる人が多いでしょう。それだけではなく「アナログデータ」も含まれるようです。

 

わかりやすい例で言えば文書類でしょう。パソコンなどがまだ普及していなかった時代に記録した顧客データや売上に関するものなど、他にもデジタル化されていない様々な記録が考えられます。

 

ダークデータというものに対してROTとも言われており、それは以下の3つの頭文字になります。

  • Redundant(冗長)
  • Obsolete(陳腐)
  • Trivial(無駄)

 

以上の3つは以下の意味合いで使われたりします。

  • 「重複している」
  • 「古い」
  • 「価値がない」

 

このような「ダークデータ」というものを企業活動において、もっと有益に使うことはできないかという流れがあるようです。

企業のサーバや倉庫でダークデータと化しているデータや文書

企業で働いていると、確かにダークデータと呼ばれるデータがたくさんあることがわかります。

 

経理として働いている人ならわかると思うのですが、会計伝票や証憑類は保管期間というものがありまして、それぞれ法律ごとにその期間が決まっています。

 

例えば決算書や総勘定元帳であれば会社法・法人税法において10年間保管する必要があります。

 

株主資本等変動計算書、個別注記表などであれば会社法において10年間の保管が必要。

 

請求書、注文請書、見積書、納品書などであれば法人税法において7年間の保管が義務付けられています。

 

それほど大きくない企業であればまだいいのですが、それでも書類がまとまるとかなりの量となり場所もとります。

 

ある程度の規模の企業になるとそれはもう膨大な量になります。その書類を保管するための専用の棚はもちろん、専用のスペースや部屋も使うようになるほどです。

 

以上のようなアナログデータは他の部署でもたくさんあるでしょう。また、デジタルデータでもつくられたままで、今はほとんど使われていないものもたくさんありました。

 

例えば企業が各地域に営業所を持っていたとして各営業所別の売上高やその他に使用した費用などの金額、それらの月次、年次ごとのデータなどがあるでしょう。

 

またどのような顧客に、どのような商品を、いくらで売ったのか、といった定量的なデータや、この商品を使ってもらった時にこういったコメントや意見をもらった、という定性的なデータもあるかもしれません。

 

これらの日々生成されるデータが、何の分析もされず、ただ積み重ねられていっているというケースは意外と多いかもしれません。

 

そもそもなぜこんな言葉が使われるようになったのだろうかと考えましたが、いくつかの意図がありそうです。

 

「ダークデータ」という言葉が使われるようになった理由や意図というのはいろいろとあると思うのですが、自分は「売上面」と「費用面」から考えてみました。

 

コメント