Page 1 of 1

现代数据集成需要混合多云数据结构作者

Posted: Sat Feb 22, 2025 3:25 am
by asimj1
如果数据真的是驱动洞察力引擎的燃料,那会怎样?想象一个与我们完全一样的世界,除了一个关键区别之外。现代化石燃料供应链(即石油巨头)不是在汽车(即福特、大众等)大规模生产之前(或大致同时)创建的,而是实际赛车的基础技术首先完善。因此,在这个世界里, 在每个角落都有加油站之前,你就会看到福特与法拉利的对决 。在这个世界上,你仍然有激动人心的勒芒 24 小时比赛等等,但驱动这些漂亮机器的燃料将是一种手工制作的、定制的,大致就像布鲁克林的精酿啤酒或米慎区的墨西哥卷饼的生产一样。


那个世界可能不寻常,但完全可以想象。这是我的 哥伦比亚电话号码数据 思想实验的要点:它与现实世界(我们的世界)非常相似,涉及 IT、数据和 分析在这个类比的思想实验中,“美丽的机器”(即赛车)是我们实际的 ML 和 AI 驱动的分析系统,而汽油的手工供应链则是数据集成。我们这个世界的数据集成,请原谅我的双关语,相对粗糙。我们拥有尖端的洞察引擎,但它们仍然由我们在 1970 年代首次开始使用的相同的笨拙的数据集成系统驱动。简而言之,它们仍然由存储级数据物理整合驱动;它们仍然由数据位置驱动。

肯定有更好的方法吗?当然有。既然数据确实是驱动我们美丽的洞察机器的燃料,我们最好开始像它一样行动;也就是说,我们最好将数据集成从存储层转移到计算层,我们最好利用数据含义而不仅仅是数据位置。我的思想实验描述了我们的现状,它并不好。它是可行的,但远非理想。但近期的未来看起来更加令人不安。