1 分钟阅读

将所有数据集中在一个地方:Shopify 店铺的 ETL 力量

Oleksandr Drok
将所有数据集中在一个地方:Shopify 店铺的 ETL 力量

在线购买的份额不断增加,这得益于范式的变化和互联网商店的普及。近年来,在市场上销售产品的趋势虽然显著增长,但正在放缓。消费者越来越倾向于选择小众在线商店,而这类商店的数量每年都在增长。

当将在线商店视为一个以销售增长为主要目标的完全功能性业务时,就会出现提高运营和营销效率的需求。

尤其是在从内部商店转型为中型企业的阶段,关于数据驱动决策的许多问题随之而来,因为数据源(应用程序、服务)非常多样化。

一方面,访问所有可用或可获取的数据是相对容易实现的(Google Analytics、Facebook Ads、Google Ads、Stripe、Paypal)——所有这些系统都提供了各自的数据访问和报告生成机制。

另一方面,所有这些系统之间差异很大,将所有必要的指标或图表整合到统一报告中,成为一项没有相当人工努力的挑战。

正是在这个关键时刻,需要将来自不同来源的数据集中在一个地方,以便后续分析、可视化或报告。

什么是ETL?

ETL(提取、转换、加载)是从一个源提取/收集数据、对其进行转换并加载到目标目的地的过程。换句话说,它是将来自多个不同源(输入)的数据移动到一个地方,例如数据仓库的过程。首先,这对于数据访问的标准化是必要的,因为每个源都有其数据访问接口(API),这使得构建Shopify Reports或分析变得复杂。拥有一个包含所有数据的单一来源显著简化了报告构建过程。

etl process
ETL过程

ETL过程的实现相当复杂,但从根本上说,它由三个阶段组成:

  • E - 提取:

    从源获取数据的阶段,可以是数据库、API或文本文件。

  • T - 转换:

    数据的变化阶段包括清除无效信息、改变结构,并将数据转换为更适合分析的格式。

  • L - 加载:

    将准备好的数据移动到目标目的地的阶段,通常是数据库,如Progress、Google BigQuery、Snowflake等。

因此,数据仓库包含来自不同来源的高质量和同质化数据,便于进一步分析和信息利用(尤其是对于电子商务,数据源的数量可能非常庞大)。

数据仓库

数据仓库是一个集中存储来自各种来源的准备信息的库。创建数据仓库的主要目的是保存来自不同来源的信息,以便在商业智能(BI)系统、内部报告系统或运营支持中后续使用。

warehouse
仓库结构

在电子商务背景下的关键要求包括:

  • 相关性:

    确保数据的持续更新和同步,以保持数据仓库中的信息始终最新和准确。

  • 完整性:

    存储来自各种来源的所有必要数据,以便拥有全面的信息集进行进一步分析和决策。

  • 选择的便利性:

    建立一个合理且易于访问的存储结构,以便高效查询(SQL)并获取满足不同业务需求的必要数据。

专用的数据仓库在电子商务中作为分析和与数据互动的中心点,使企业能够获得有价值的洞察,优化策略并完善运营流程。

Shopify:可以提取哪些数据?

由于Shopify是一个云平台,因此无法直接访问数据。然而,Shopify提供了高质量的API以供数据访问。Shopify API便于将数据处理和集成到数据仓库中。

shopify api
Shopify API

使用Shopify API,您可以提取各种数据,包括:

  • 订单数据
    订单
    订单项
    草稿订单
    退款
    履行
    客户
  • 产品数据
    产品
    产品变体
    图库
  • 交易数据
    交易
  • 支付数据
    支付
    支付交易
  • 用户数据(仅适用于Shopify Plus)
  • 库存数据
    库存水平
    库存项
    位置
  • 结账
    结账
    购物车

然而,值得注意的是,某些数据无法通过API获得,这可能会对全面分析和报告造成挑战。这些数据包括:

  1. 历史库存:特定日期内产品数量的变化;
  2. 库存转移:关于产品在仓库之间移动的数据;
  3. 采购订单:关于供应商订单的信息;
  4. 网络分析:关于访客、页面浏览量和其他网络分析的数据。

为了弥补这些缺失的数据点,建议将来自其他系统的数据(如Google Analytics和Google Search Console)集成到仓库中。这使得对客户与网站的互动、搜索引擎查询、可见性等有更全面的理解。

Shopify的ETL

在考虑Shopify的ETL过程时,数据处理过程中既有积极方面,也存在一些挑战。

积极方面:

Shopify API的质量:

高质量的Shopify API能够检索大量结构良好的数据。这包括关于产品、订单、客户等的信息,为进一步分析和商业分析提供了良好的基础。

Webhook支持:

Shopify支持Webhook,允许ETL系统实时响应数据的任何变化。这意味着数据几乎可以实时更新,确保数据的新鲜度。

挑战:

非结构化数据(原始JSON):

一些数据,如元字段和标签,以非结构化格式(原始JSON)呈现。这显著增加了处理和分析这些数据的复杂性,因为它缺乏明确的结构。使用这些数据需要一个转换阶段,将字段解析并分支到相应的表中。

转换阶段的作用:

由于某些数据以非结构化格式到达,转换阶段在处理这些数据时发挥着至关重要的作用。

总之,在与Shopify结合使用ETL过程时,必须考虑积极和挑战性方面,以确保有效处理和分析电子商务业务数据。

ETL系统概述

目前,有几个ETL系统在相对较高的水平上支持Shopify ETL。然而,重要的是要注意,这些系统都没有充分利用Shopify API的能力。这可能导致数据提取和处理特殊字段(如元字段或标签)时的限制,以适合报告构建的格式。

关于处理特殊字段(如元字段或标签),大多数ETL系统可能无法完全理解其本质。这使得报告构建和分析变得复杂,因为这些附加字段通常包含关于产品、订单、客户和第三方应用的重要上下文信息。

在选择Shopify的ETL工具时,考虑这些限制至关重要。面对大量数据和复杂结构,选择最适合您业务独特需求的工具,并确保与Shopify API功能的完全兼容是很重要的。

总结

通过ETL过程创建您自己的数据仓库在现代电子商务中是未来增长和做出明智数据驱动决策的关键步骤。随着您的商店发展,这一过程的紧迫性变得愈加相关。

总之,建立您自己的数据仓库不仅是向前迈出的一步,也是确保在快速变化的需求和趋势面前取得成功和韧性的战略决策。这是对改善、创新和公司整体发展的机会的投资。

Tags:
reporting
相关的 帖子
如何在 Shopify 上查看和分析您的库存历史 如何在 Shopify 上查看和分析您的库存历史

发现有效的方法在 Shopify 上跟踪和分析您的库存历史,以实现更好的库存管理和客户满意度。

ABC分析:如何分析库存和产品 ABC分析:如何分析库存和产品

了解如何使用ABC分析对库存进行分类,以增强销售并简化库存管理。

库存管理的重要关键绩效指标 库存管理的重要关键绩效指标

了解关键库存指标及其在您的 Shopify 商店中有效库存管理中的重要性。

准备好开始了吗?

立即加入Mipler,今天就享受有意义的报告。