Snowflake 和 ML:智能地使用数据 - 升级您的数据
Posted: Wed Jan 15, 2025 6:49 am
Snowflake于 2016 年在同名白皮书中被其创始人介绍并描述为“弹性数据仓库” 。八年后的今天,Snowflake 已成为一个综合数据平台,专为数据科学和 AI/ML 等众多工作负载而设计。我关于 Snowflake 人工智能功能的博客文章的第一部分着眼于其当前基于企业管理数据的单一平台上的端到端机器学习功能。这些功能可用于自定义和开箱即用的工作流程,包括功能工程、训练 API、模型注册等。
Snowflake 提供哪些选项?
机器学习功能
Snowflake 提供即用型分析功能。这些可以使用机器学习自动预测和洞察数据。如果您不是 ML 专家,则特别适合:
时间序列函数:此函数根据时间序列数据训练 ML 模型,以确定给定值如何随时间变化以及相对于其他值如何变化。
“预测”使用历史数据来预测未来值。
“异常检测”自动识别意外模式或异常值
“贡献浏览器”有助于找到对时间序列数据变化贡献最大的值和因素。
分类:此功能不需要时间序列数据。此函数根据行最有意义的特征将行分为两个或多个类。
图 2:如何训练模型并进行预测 - 只需几行 SQL,来源
图 3:ML 工作流程的 Python 库和底层基础设施
对于自定义工作流程,Snowflake 提供 API 来支持端到端开发和部 阿尔巴尼亚 whatsapp 数据 署过程的每个阶段,并包括以下关键组件:Snowpark ML 建模、模型注册表和特征存储。
图 4:有和没有雪场的数据移动
Snowpark 于 2021 年推出,是一个集成开发环境,用于将 Snowflake 扩展到基于 SQL 的用例之外。该环境为 Snowflake Virtual Warehouse 基础设施内的 Python、Java 和 Scala 编程语言提供支持。要开始使用 Snowflake ML,客户可以使用 Snowflake ML 库的 Python API 来访问所有操作功能:
ML 建模:通过此接口,可以使用 scikit-learn、XGBoost 和 LightGBM 等知名 Python 框架进行数据预处理、特征工程和模型训练。 Snowpark 默认提供超参数优化。
模型注册表:实现模型及其元数据的安全管理以及执行批量推理。这些模型存储为模式级对象,因此组织内的其他人可以通过 Snowflake 基于角色的访问控制轻松使用。注册表支持内部和外部训练的模型、多个模型版本以及默认版本的选择。
特征存储:特征工程是工作流程的核心部分,即将原始数据转换为可用于训练 ML 模型的特征。商店用于创建、存储和管理功能。
Snowflake 提供哪些选项?
机器学习功能
Snowflake 提供即用型分析功能。这些可以使用机器学习自动预测和洞察数据。如果您不是 ML 专家,则特别适合:
时间序列函数:此函数根据时间序列数据训练 ML 模型,以确定给定值如何随时间变化以及相对于其他值如何变化。
“预测”使用历史数据来预测未来值。
“异常检测”自动识别意外模式或异常值
“贡献浏览器”有助于找到对时间序列数据变化贡献最大的值和因素。
分类:此功能不需要时间序列数据。此函数根据行最有意义的特征将行分为两个或多个类。
图 2:如何训练模型并进行预测 - 只需几行 SQL,来源
图 3:ML 工作流程的 Python 库和底层基础设施
对于自定义工作流程,Snowflake 提供 API 来支持端到端开发和部 阿尔巴尼亚 whatsapp 数据 署过程的每个阶段,并包括以下关键组件:Snowpark ML 建模、模型注册表和特征存储。
图 4:有和没有雪场的数据移动
Snowpark 于 2021 年推出,是一个集成开发环境,用于将 Snowflake 扩展到基于 SQL 的用例之外。该环境为 Snowflake Virtual Warehouse 基础设施内的 Python、Java 和 Scala 编程语言提供支持。要开始使用 Snowflake ML,客户可以使用 Snowflake ML 库的 Python API 来访问所有操作功能:
ML 建模:通过此接口,可以使用 scikit-learn、XGBoost 和 LightGBM 等知名 Python 框架进行数据预处理、特征工程和模型训练。 Snowpark 默认提供超参数优化。
模型注册表:实现模型及其元数据的安全管理以及执行批量推理。这些模型存储为模式级对象,因此组织内的其他人可以通过 Snowflake 基于角色的访问控制轻松使用。注册表支持内部和外部训练的模型、多个模型版本以及默认版本的选择。
特征存储:特征工程是工作流程的核心部分,即将原始数据转换为可用于训练 ML 模型的特征。商店用于创建、存储和管理功能。