处理数据?不要一概而论

by Nick Jewell

根据《经济学人影响》研究发现,37%的企业将数据驱动思维列为业务关键的优先事项,而另有57%的企业将其列为中等或高度优先事项。

该研究还发现,80%的企业已经实施了大数据分析。然而,目前从数据中看到真正价值的公司比例仍然低得惊人,56%的高管没有从大数据分析项目中察觉到价值。同样,根据普华永道的数据,到目前为止,只有16%的企业通过在云端实施数据和分析项目实现了商业价值。

那么,为什么这么多企业在数据和分析项目实际运作中遇到困难呢?因为不同的用例和应用利用不同类型的数据,适用于一种情况的方法并不适用于另一种情况。要知道什么会起作用,同样,什么不会起作用,必须了解有关这些数据集如何随着时间的推移而创建、存储和访问的一些关键细节。

大而简单与小而复杂

其中一种数据集通常被称为“大数据”。在过去的十年中,这个术语被用于描述服务于在线客户服务的应用创建的数据集。围绕大数据建立的技术是为了处理一直在流动的大量数据而创建的。

如今,创建和使用这类数据集的企业数量有所增加。这类数据并不是大型社交媒体和网络企业的专利,而是在数千家企业中涌现出来。“大数据”这个称呼现在已经成为很多人的常态。这些数据集很大,更新速度很快,而且有序。这使得数据分析更容易,pb级的信息可以被快速扫描和使用。

然而,并不是所有的数据集都遵循这种模式。运营数据是业务应用在接受订单时创建的数据,并通过运行业务的企业资源计划(ERP)应用进行管理。这包括财务和会计系统、供应链运营和其他流程。操作数据集不是可以快速大规模处理的有序数据,而是高度连接且极其密集的数据。

这里的挑战是,建立ERP系统是为了从交易中获得每一盎司的性能。每个业务职能部门都有自己的交易记录系统,这些系统经过优化以提高特定功能的性能。

例如,客户销售将导致创建付款发票、制造和生产中的销售订单,以及内部帐户中的供应链流程和财务分类系统所需的订单。这些系统都相互连接,每个客户记录都必须在每个系统中更新。

实际上,跟踪业务数据元素和关系的数以万计的单个数据库表必须随着时间的推移进行更新。因为这种优化通常发生在每个领域,所以没有一个ERP提供整个业务的联合视图。

分析运营数据可以帮助了解业务的运行情况。然而,数据集的分离使得很难回答业务想要问的问题。例如,适用于大数据集的方法通常会在相互关联的ERP数据中失败。我们今天所知道和使用的数据管道模型是为大数据而建立的,而不是为ERP数据构建的。

设计数据分析方法

数据管道是团队用来从数据中获取价值的一组工具和过程。它从商业应用程序中获取信息,然后清理、组织并将数据呈现给需要的人。对于操作数据,试图以这种方式应用管道是无效的。

ERP系统用于提高交易速度并保持跨多个表更新客户记录的方法,与使用数据管道实现分析的方法并不真正兼容。操作数据不是已经组织好的直接数据,而是分布在多个不同的系统中。

所需的信息可能分布在50个或更多不同的表中,而不是能够在一个地方查看单个事务。然后,这些表可能需要多次查找和计算,以创建分析师想要的最终结果。

要将数据放入数据管道,需要理解所有这些不同的连接。为了建立这种关系,分析师通常试图将这些联系分解成越来越小的部分。这里的目的是创建一个简化的数据视图,然后可以运行查询,而不是试图一次性处理所有连接。

这种方法的问题是它过度简化了数据,这意味着分析师只能回答预定义的问题。如果他们还需要其他东西,那就意味着返回源系统以获取数据并将其调整到合适的状态的漫长过程。这意味着获得见解的时间更慢,因此实现结果的时间也更慢。

要解决这个问题,我们必须停止把每个数据分析问题都看成一个更复杂的管道就能解决的解决方案。相反,我们必须考虑如何从一开始就处理连接的数据集。实际上,这意味着让用户可以访问数据,而无需管理将数据传输到他们的管道。

它还包括在进行任何查询之前有正确的分析方法。Gartner将这种方法定义为查询加速,即在创建任何查询之前扫描整个数据集进行分析。它把所有的数据都带到了问题上,以便快速回答问题。这也改善了查询过程,因为分析师可以随着时间的推移提出他们想要问的问题,而不是拘泥于既定的问题。

根据需要使用正确的方法

为了使数据分析项目成功,我们必须考虑我们必须达到的目标和存在的目标。少数成功实施数据和分析项目的企业表明,我们必须观察我们在整个业务中拥有的数据类型,然后在需要的地方应用正确的工具和方法。随着越来越多的企业利用数据来创造竞争优势,并帮助决策过程,做好这方面的工作将变得至关重要。

-----------------------------------------------------------

峰会预告

近期,由千家网主办的2022年第23届中国国际建筑智能化峰会将正式拉开帷幕,本届峰会主题为“数智赋能,碳索新未来”,届时将携手全球知名建筑智能化品牌及专家,共同分享AI、云计算、大数据、IoT、智慧城市、智能家居、智慧安防等热点话题与最新技术应用,并探讨如何打造“更低碳、更安全、更稳定、更开放”的行业生态,助力“双碳”目标的实现。

欢迎建筑智能化行业同仁报名参会,分享交流!

报名方式

上海站(11月23日):https://www.huodongxing.com/event/3638582473900

北京站(11月25日):https://www.huodongxing.com/event/4638577546900

广州站(12月08日):https://www.huodongxing.com/event/2638587914600

成都站(12月20日):https://www.huodongxing.com/event/5657854318600

西安站(12月22日):https://www.huodongxing.com/event/4638585444400

更多2022年峰会信息,详见峰会官网:http://summit.qianjia.com/

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2022-11-07
处理数据?不要一概而论
如今,创建和使用这类数据集的企业数量有所增加。这类数据并不是大型社交媒体和网络企业的专利,而是在数千家企业中涌现出来。“大数据”这个称呼现在已经成为很多人的常态。这些数据集很大,更新速度很快,而且有序。这使得数据分析更容易,pb级的信息可以被快速扫描和使用。

长按扫码 阅读全文