大数据革命的阴暗面

不言而喻,公司拥有的数据比历史上任何时候都多。 他们拥有比以往更多的方式来收集、生成和存储数据。 由于云存储,数据湖几乎可以无限扩展,无需查看堆积如山的硬盘。

这一切都很棒。 拥有更多数据意味着我们对世界了解更多。 因为我们对世界了解得更多,所以我们可以做出更好的决定。 我们可以制造更好的产品,因为我们了解我们的市场。 我们可以卖得更好,因为我们了解我们的客户。

或者至少这是理论。 实际上,许多公司拥有如此多的数据,他们不知道如何处理这些数据。 也许那是因为他们没有内部分析专业知识来正确分类和分析它。 也许是因为他们不知道为什么他们首先要收集所有这些数据,除了“拥有数据很好”。

结果是暗数据。位于巨大数据湖中的数据是惰性的,公司中没有人对其潜在意义或重要性有任何真正的了解。

暗数据存在两个主要问题。首先,如果你不知道它是什么,它可能是坏事。如果您恰好将私人用户详细信息存储在未正确加密和防火墙的数据湖中,那么就监管合规性和客户信任而言,潜在的灾难即将来临。

其次,暗数据代表了浪费的机会。有些数据根本没有价值。但它可以产生非常有价值的见解,为公司带来巨大的利益。如果您对数据湖的内容知之甚少,或者不了解如何利用这些数据,那么任何价值都将被浪费。

你能做些什么来解决暗数据的棘手问题?

删除它
最简单的选择。如果您的企业正在存储它不使用的千兆字节或千兆字节的数据,它不需要存储以符合法规要求,并且公司的任何人都不太了解,那么简单地将其丢弃是一种选择。

删除数据解决了两个问题。首先,如果您不存储数据,它就不会从您的网络中泄漏并使您的公司难堪。其次,数据存储要花钱,如果数据没有被使用,那笔钱就被浪费了。

分析它
如果数据已经存储在云平台上,则非常适合进行分析。这一行动过程需要公司的投资,并且很可能意味着雇用具有部署和管理分析解决方案的专业知识的人。

这里的好处是显而易见的。公司了解数据所代表的价值,意识到它所代表的任何风险,并可以将收集到的任何见解应用于未来的决策。