ROTデータであるダークデータの存在とその有効活用について

最近電車内の広告から「ダークデータ」なる言葉を目にしました。初めて目にする

その言葉から「どういったデータなんだろう」と頭から離れずにいました。

昨今「ビッグデータ」というものが注目されていますが、必ずしもそれが全て有効

活用されているわけではなく、その中にはあまり有効活用されていない「ダークデ

ータ」と呼ばれるものも存在するようです。

この分野については、まだあまり調べてはいないのですが、興味があるので今知っ

ている範囲でダークデータというものについて書いていってみます。

ダークデータとは

「ダークデータ」と意味について次の記事で以下のように書かれています。

これだけはマスター!情報戦略キーワード – ダークデータ:ITpro

価値がある(もしくは、あるかもしれない)にもかかわらず、収集・蓄積

されるだけで活用されていないデータのことを、ダークデータと呼ぶこと

があります。

研究・開発者が収集する実験や調査、観測に関するデータは、「実験に失

敗した」、「仮説を裏づけるものではなかった」など様々な理由でお蔵入

りになることが少なくありません。

研究室の片隅で“日の目を見ない”ことから、ダークデータと呼ばれるよ

うになりました。このように元々は学術分野で使われていた言葉ですが、

厳密な定義があるわけではありません。

企業が保管するデータの85%は価値がないと書かれている記事もあります。「データ

」というとパソコンのフォルダ内にある過去のデータなどデジタルデータを思い浮

かべる人が多いでしょう。それだけではなく「アナログデータ」も含まれるようです。

わかりやすい例で言えば文書類でしょう。パソコンなどがまだ普及していなかった時

代に記録した顧客データや売上に関するものなど、他にもデジタル化されていない様

々な記録が考えられます。

ダークデータというものに対して「ROT(Redundant(冗長)、Obsolete(陳腐)、Trivial

(無駄)データ」というように

  • 「重複している」
  • 「古い」
  • 「価値がない」

という意味合いで使われたりもするようです。

このような「ダークデータ」というものを企業活動において、もっと有益に使うこと

はできないかという流れがあるようです。

企業のサーバや倉庫でダークデータと化しているデータや文書

企業で働いていると、確かにダークデータと呼ばれるデータがたくさんあることがわ

かります。

経理として働いている人ならわかると思うのですが、会計伝票や証憑類は保管期間と

いうものがありまして、それぞれ法律ごとにその期間が決まっています。

例えば決算書や総勘定元帳であれば会社法・法人税法において10年間保管する必要が

あります。

株主資本等変動計算書、個別注記表などであれば会社法において10年間の保管が必要。

請求書、注文請書、見積書、納品書などであれば法人税法において7年間の保管が義

務付けられています。

それほど大きくない企業であればまだいいのですが、それでも書類がまとまるとかな

りの量となり場所もとります。

ある程度の規模の企業になるとそれはもう膨大な量になります。その書類を保管する

ための専用の棚はもちろん、専用のスペースや部屋も使うようになるほどです。

以上のようなアナログデータは他の部署でもたくさんあるでしょう。また、デジタル

データでもつくられたままで、今はほとんど使われていないものもたくさんありまし

た。

例えば企業が各地域に営業所を持っていたとして各営業所別の売上高やその他に使用

した費用などの金額、それらの月次、年次ごとのデータなどがあるでしょう。

またどのような顧客に、どのような商品を、いくらで売ったのか、といった定量的な

データや、この商品を使ってもらった時にこういったコメントや意見をもらった、と

いう定性的なデータもあるかもしれません。

これらの日々生成されるデータが、何の分析もされず、ただ積み重ねられていってい

るというケースは意外と多いかもしれません。

そもそもなぜこんな言葉が使われるようになったのだろうかと考えましたが、いくつ

かの意図がありそうです。

「ダークデータ」という言葉が使われるようになった理由や意図というのはいろいろ

とあると思うのですが、自分は「売上面」と「費用面」から考えてみました。