浅谈数据

原创
bbuugg888 2周前 (05-09) 阅读数 41 #投资

数据,算是近十年来耳熟能详的词汇了,相关的词汇有数据分析、数据思维、数据工具、大数据、数据挖掘、数据库、数据孤岛、数据湖、数据中台等等。相关词汇被越来越多的创造出来,一种程度上代表着对于它的使用越来越频繁与常见,在某种程度上也象征着它的蓬勃发展,不断壮大,现在可以说它已经与我们的生活密不可分了。

但是数据其实并不重要,一个孤立的数据,并不能解读出任何意义,重要的是它所蕴含的信息;作为信息的载体,对它的处理和分析,也只是为了得到信息的价值。在这里真的很钦佩人类的一种特殊天赋,那就是我们总是能够给虚构或者说是想象出来的东西赋予特殊的意义和价值。

个人认为数据就像是滚滚洪流,对于它的处理和利用,也是逐渐分层来的。最底层的数据处理者更像是大禹,他们并不大关注数据所蕴含的信息海洋,他们更关注的是,如何将混乱无章的数据流更好地记录存储下来,就像是大禹治水一样,将数据进行合理分流,缓解数据流的冲击,更好的进行数据存储,避免数据的缺失;

再上面一层是数据的加工者,他们通过各种加工工具,通过将分流后的数据进行ETL(抽取、转换、加载),一是数据的提质过程,二是通过虚构出各种不同维度的指标,定义指标口径,将数据加工保留储存在不同的数据库表中。其实在这个过程也是一个信息筛选的过程,因为我们无法做到信息的全部利用,所以就要特定地筛选出能够反映出业务运营场景的信息,通过指标以数据形式进行储存;

再上面一层就是数据的分析处理者,他们通过对业务的理解,结合数据去分析相关信息,一是对业务运营情况进行判断,二是通过数据信息去发现问题。通过自身对业务的理解将数据信息以业务的视角进行解读,用以辅助业务决策、定位业务问题、解决业务问题,使得业务不断向上发展,越来越好。

所以在我的理解里,数据的价值是围绕业务而存在的。作为一名数据分析师,并不是说业务熟悉了解到什么程度就可以了,对业务的了解应该没有止境,只有这样才能更大的数据价值,才能真正意义上地实现数据支撑业务、驱动业务、赋能业务。

最后浅谈一下数据挖掘、机器学习之我见吧,在我看来,数据挖掘和机器学习最关键的都是规则相关。不同的是,数据挖掘是在信息海洋里提炼规则,实现挖掘数据的潜在收益价值;机器学习是通过规则去训练数据,不断提升筛选分类的精准度,实现智能化、高效率化;二者各有千秋,对它们也各有展望与向往,目前了解不多,等我看完相关书籍后,如果有新的感悟在单独再开一篇作分享。

其实在我的假想里,数据发展到最完美的阶段,应该是现实场景的一种完全映射和体现,通过数据,真的可以考虑到各种变量的影响因素,实现精准预测未来。不过难点之一是这么大的数据量该如何进行完全存储,难点之二是需要多大的能量和算力才能支撑预测未来,或许宇宙级别的可以实现吧,数据存储在宇宙里,算力是宇宙的能量。想远了想远了哈哈哈

数据,其乐无穷!

版权声明

注意:以上内容(如有图片或视频亦包括在内)为自媒体平台用户上传并发布,本平台仅提供信息存储服务。

Attention: The above content (including any pictures or videos) is uploaded and published by users of self media platforms, and this platform only provides information storage services.

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门
标签列表