2012年维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》指出,大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯;维基百科中指出,大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间限制的数据集;全球著名的管理咨询公司McKinsey则将数据规模超出传统数据库管理软件的获取、存储、管理以及分析能力的数据集称为大数据;研究机构Gartner将大数据归纳为需要新处理模式才能增强决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产;以上所有关于大数据的定义都是建立在大数据的特征之上,即大数据的5V特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。通过这些权威机构发布的大数据概念,让我们对于大数据有了全新的了解,与此同时随着大数据时代的到来,大数据应用的爆发,大数据的概念是否也需要重新描述呢?其实早在几年前,数据的海量增长就引起了人们的关注,海量数据的发生、使用、储存伴随着云计算的发展等都成为了现实,“大数据”已经走入了我们的生活。
最早将大数据用于IT环境的是知名咨询公司麦肯锡,麦肯锡在研究报告中指出:如果云计算为数据资产提供了保管、访问的场所和渠道,那么如何盘活数据资产使其为国家治理、企业决策乃至个人生活服务,则是大数据的核心议题,也是云计算内在的灵魂和必然的升级方向。从信息安全角看,大数据是指规模和格式前所未有而又相互关联的大量数据,搜集自企业的各个部分,技术人员可以对它们进行高速分析。就像电影《黑客帝国》中的感知机器人或者《终结者》电影中的天网一样,现在的大数据环境由大规模并行处理数据库产品(不过所幸的是,它们没有自我感知能力)组成,这些产品通过处理PB级(1015)到ZB级(1021)看似不同的数据来创建趋势和数据映射。通过建立这种宏观层面的信息,大数据可以让企业了解到他们的产品是如何以前所未有的经济理解水平在运行。也就是说,通过以新方式来结合和分析海量数据,我们可以实现新的业务洞察力.