Google Analytics有一个API( 核心报告API )。这对于获取偶尔的KPI很有用,但由于API的限制,它不适合导出大量的历史数据。
对于大数据转储,最好使用Link to BigQuery(“链接”,因为我想避免使用“集成”这个词,这意味着比你实际拥有更大的控制级别)。
设置BigQuery的链接非常简单 - 您可以在中创建项目 Google Cloud Console ,启用计费(BigQuery附带费用,不属于GA360合同),在“IAM& Admin”部分添加您的电子邮件地址作为BigQuery所有者,转到您的GA帐户并在GA管理员中输入BigQuery项目ID部分,“属性设置/产品链接/所有产品/ BigQuery链接”。这个过程在这里描述: https://support.google.com/analytics/answer/3416092
您可以在标准更新和流媒体更新之间进行选择 - 后者需要额外付费,但会为您提供接近实时的数据。前者每八小时一次三次更新BigQuery中的数据。
导出的数据不是原始数据,这已经是会话化的(即,每次点击会获得一行,例如该点击的流量属性将基于会话)。
您将支付三种不同的费用 - 一种用于导出到BigQuery,一种用于存储,一种用于实际查询。此处记录定价: https://cloud.google.com/bigquery/pricing 。
价格取决于地区等。在涉及法律问题时,存储数据的区域也很重要 - 例如如果您必须遵守GDPR,您的数据应存储在欧盟。确保区域正确,因为在区域之间移动数据非常麻烦(您需要将表格导出到Google云端存储并在适当的区域重新导入)并且价格昂贵。
您不能只删除数据并执行新的导出 - 在您的第一次导出时,BigQuery将回填过去13个月的数据,但是每个视图只会执行一次。因此,如果您需要历史数据,请更好地做到这一点,因为如果您在BQ中删除数据,则无法将其恢复。
我实际上并不了解Redshift,但根据您的评论,您希望在Tableau中显示数据,Tableau直接连接到BigQuery。
我们使用自定义SQL查询将数据导入Tableau(Google Analytics数据存储在每日表中,而自定义SQL似乎是在多个表中查询数据的最简单方法)。只要查询没有更改,BigQuery就会有一个基于用户的缓存,持续24小时,因此每次打开报表时都不会为查询付费。关注成本仍然是一个好主意 - 成本不是基于结果大小,而是基于必须搜索以产生所需结果的数据量,因此如果您查询很长时间并且可能做一些连接单个查询可以运行几十欧元(乘以使用查询的用户数)。