什么是 Salesforce 数据湖?
Posted: Sat Dec 21, 2024 10:32 am
首先,以上都是描述数据存储和管理的方式。
企业目前面临的最大挑战之一是需要收集的受众数据量难以估量,而且这些数据通常分散在数十个甚至数百个平台上。
从社交媒体、网络研讨会和活动注册平台、网站分析、专用客户调查工具、运输和交付信息、支付处理等等,您需要分析和采取行动的关键数据分布在各种大多不相连的软件和应用程序中。
通过我们的101 指南了解有关 Salesforce Data Cloud 的更多信息。
而且重要的不仅仅是客户互动产生 阿尔巴尼亚 Telegram 手机号码列表 的数据。加上您的业务绩效指标和第三方情报来源,很容易看出为什么公司难以快速、一致且有意义地使用数据。
随着我们一头扎进人工智能成为商业和营销战略及决策前沿的时代,如何管理数据变得更加重要。人工智能依赖于完整可靠的数据。人工智能(以及更传统的系统)的效率还取决于您如何构建数据关系 - 这正是数据湖、数据仓库和数据湖库发挥巨大作用的地方!
数据湖、仓库和 Lakehouse
Salesforce Data Cloud将来自多个来源的客户数据整合到一个视图中,企业中的每个人都可以使用,无论他们来自销售、营销、客户服务、商务、业务开发还是其他团队。
但理解这些常用术语非常重要。
数据仓库:一种数字存储空间,可将结构化数据存档以用于特定的商业智能目的和报告。数据是预定义的,并以特定格式存储,可在数据集中使用。
数据湖:一种数字存储空间,其中以原始格式存储非结构化信息,可供我们现在或将来使用。一种更灵活的方法。
数据湖屋:以上两者的结合;将数据仓库的功能和工具与数据湖的非结构化原始数据结合在一起。
结构化数据与非结构化数据
如果数据仓库存储结构化数据而数据湖存储非结构化数据,那么您需要了解这些数据的类型,以便评估您的业务需求。
结构化数据:已经以某种方式组织和“结构化”的数据点,即表格,因此它们可搜索且定义明确。这种类型的数据包括数字、单词和字符串。例如,任何可以格式化为带有字段和值的标准订阅者列表的内容,或像Marketing Cloud Data Extensions这样的关系数据库。
非结构化数据:基本上是相反的。这种类型的数据更定性,例如由图像、电子邮件、文字处理文件、视频和音频组成。它不能轻易地显示在行和列的表格中,而且众所周知更难搜索和分析。
根据 Gartner 的数据,高达80% 的企业数据都是非结构化的。您可以猜到,这意味着数据仓库并不总是能满足企业的全部需求。为了使数据仓库从另一个系统接收数据,它必须首先提取、转换和加载 (ETL),这可能非常耗时。
然而,数据湖也有其缺点。它们没有考虑到另外 20% 的结构化企业数据,而且如果没有大量的数据科学资源和预算,就很难从中提取有用的见解。
解决方案是什么?数据湖屋——两全其美!
Salesforce 数据湖
数据湖屋将数据仓库的数据管理和安全性与数据湖的灵活性相结合,使企业能够存储和组织所有类型的数据。反过来,这意味着更好的洞察力、改进的人工智能工具(如 Einstein)的机器学习,以及对第一方和第三方数据快速采取行动的能力。
Salesforce Data Cloud 带有内置数据湖。它还有一个现成的数据模型,称为“星型模式”,可帮助您组织数据,以及一个更简单的“提取、转换、加载”(ETL)流程,该流程可以在 UI 中基本配置。
企业目前面临的最大挑战之一是需要收集的受众数据量难以估量,而且这些数据通常分散在数十个甚至数百个平台上。
从社交媒体、网络研讨会和活动注册平台、网站分析、专用客户调查工具、运输和交付信息、支付处理等等,您需要分析和采取行动的关键数据分布在各种大多不相连的软件和应用程序中。
通过我们的101 指南了解有关 Salesforce Data Cloud 的更多信息。
而且重要的不仅仅是客户互动产生 阿尔巴尼亚 Telegram 手机号码列表 的数据。加上您的业务绩效指标和第三方情报来源,很容易看出为什么公司难以快速、一致且有意义地使用数据。
随着我们一头扎进人工智能成为商业和营销战略及决策前沿的时代,如何管理数据变得更加重要。人工智能依赖于完整可靠的数据。人工智能(以及更传统的系统)的效率还取决于您如何构建数据关系 - 这正是数据湖、数据仓库和数据湖库发挥巨大作用的地方!
数据湖、仓库和 Lakehouse
Salesforce Data Cloud将来自多个来源的客户数据整合到一个视图中,企业中的每个人都可以使用,无论他们来自销售、营销、客户服务、商务、业务开发还是其他团队。
但理解这些常用术语非常重要。
数据仓库:一种数字存储空间,可将结构化数据存档以用于特定的商业智能目的和报告。数据是预定义的,并以特定格式存储,可在数据集中使用。
数据湖:一种数字存储空间,其中以原始格式存储非结构化信息,可供我们现在或将来使用。一种更灵活的方法。
数据湖屋:以上两者的结合;将数据仓库的功能和工具与数据湖的非结构化原始数据结合在一起。
结构化数据与非结构化数据
如果数据仓库存储结构化数据而数据湖存储非结构化数据,那么您需要了解这些数据的类型,以便评估您的业务需求。
结构化数据:已经以某种方式组织和“结构化”的数据点,即表格,因此它们可搜索且定义明确。这种类型的数据包括数字、单词和字符串。例如,任何可以格式化为带有字段和值的标准订阅者列表的内容,或像Marketing Cloud Data Extensions这样的关系数据库。
非结构化数据:基本上是相反的。这种类型的数据更定性,例如由图像、电子邮件、文字处理文件、视频和音频组成。它不能轻易地显示在行和列的表格中,而且众所周知更难搜索和分析。
根据 Gartner 的数据,高达80% 的企业数据都是非结构化的。您可以猜到,这意味着数据仓库并不总是能满足企业的全部需求。为了使数据仓库从另一个系统接收数据,它必须首先提取、转换和加载 (ETL),这可能非常耗时。
然而,数据湖也有其缺点。它们没有考虑到另外 20% 的结构化企业数据,而且如果没有大量的数据科学资源和预算,就很难从中提取有用的见解。
解决方案是什么?数据湖屋——两全其美!
Salesforce 数据湖
数据湖屋将数据仓库的数据管理和安全性与数据湖的灵活性相结合,使企业能够存储和组织所有类型的数据。反过来,这意味着更好的洞察力、改进的人工智能工具(如 Einstein)的机器学习,以及对第一方和第三方数据快速采取行动的能力。
Salesforce Data Cloud 带有内置数据湖。它还有一个现成的数据模型,称为“星型模式”,可帮助您组织数据,以及一个更简单的“提取、转换、加载”(ETL)流程,该流程可以在 UI 中基本配置。