栏目导航
联系我们

成都海擎科技有限公司

电话:028-65065822

邮箱:cdhaiqing@163.com

联系人:袁女士

地址:成都市高新区天府三街69号

联系我们

整合或分解:哪种方式使大数据策略立于不败之地

添加时间:2017-05-09 10:05:21 文章来源:本站 浏览次数:125 次

大数据策略会失败吗?是时候该讨论一下这个问题了。企业才刚刚掌握如何集成ERP(企业资源规划)及其他业务应用来消除业务流程中妨碍效率的孤岛。面向服务架构、软件即服务、云计算及其他现代化解决方案在协助企业实现大型应用集成过程中都发挥了一定的作用。但是如今,在大量数据的环境中组织正面临新的一系列挑战。更清楚地说,它不是一条数据流。它是由许多独立的数据流组成的,使数据互相分离或者就像以前的企业应用那样将孤立起来。 这不是因循守旧 这些数据中有许多都不像那些企业用处理的数据那样。在大规模结构化数据环境中,数据激增所面临的大部分挑战都可以通过扩展、冗余及分析而得到解决。大数据时代,以上这些挑战仅仅是企业必须解决的小部分问题。如今收集到的数据类型来源非常广泛。

数据通过嵌入式传感器、RFID芯片、箱子和音像供给、文档和图像文件、图像等其他方式而传输到数据库中。社交媒体会改变数据应有的形象。这还不包括业务伙伴之间所共享过的大数据。 组织不再描述或者规定数据所要展现的形式。

实际上,如果尝试这样做,会大大地降低数据本身的价值。企业仅能预测一定数量的潜在情节或者反应。无论他们创建了多少复选框或者数据文件,总会有数据溢出的现象。从竞争的角度来说,忽视那些非传统数据的后果是极具破坏性的。最近麦肯锡全球研究院进行了一项研究,题目为:大数据是创新、竞争、生产率领域的下一个研究方向,研究表明如果企业未能充分利用现有的数据,那么该企业将亏损数千亿美元。 关系数据库仅能提供部分解决方法 由于数据量大而且种类不同,因此采用工具和技术管理非结构化数据就变得非常困难。

非关系型NoSQL、XML以及关键/数值数据存储都可以协助企业解决多数大数据的可伸缩性和可访问性问题。例如Hadoop这样的解决方案使用MapReduce及Hive Query Language,为企业提供管理大数据的一个起点,并获取商业情报。

如MongoDB和Cassandra这样的NoSQL数据库管理系统已经实现Hadoop集成,使客户获得至少一个客户端接口或者覆盖连接不同的数据流变得更加容易一些。 如今数据本身在企业中变得更加灵活。并行流程及智能数据将JitterBit这样的工具分块应用,将其设计成允许数据从一个应用程序传输到下一个应用程序,并保证传输的数据质量。这种通过数据类型及应用进行的集成对于时间敏感的企业活动来说非常重要,这些活动中也会涉及即时分析。一般地,这种形式的分析必须查询当前数据和历史数据,来识别新趋势。这就是SQL经常再次发挥作用的原因。