Pohybujete sa v divokej džungli digitálneho marketingu, kde sú dáta z Google Analytics 4 (GA4) vaším najlepším priateľom a rozhodnutia riadené dátami kľúčom k úspechu?
Aby ste mohli naplno využiť potenciál GA4, potrebujete však nástroj na správu, transformáciu a analýzu marketingových dát, ktorý vám to umožní. Riešenie je jednoduché – Google BigQuery, váš univerzálny nástroj na pokročilú dátovú analytiku (a mnoho ďalšieho).
Ak ste sa s Google BigQuery ešte nestretli, je to dátový sklad, ktorý umožňuje efektívne pracovať s veľkým množstvom údajov v rámci platformy Google Cloud.
V tomto článku sa pozrieme na možnosti využitia BigQuery pre digitálnu analytiku – od surových dát z GA4, cez ich transformácie, až po obohacovanie dát z rôznych zdrojov alebo odosielanie vlastných dát cez server-side Google Tag Manager (GTM).
Raw dáta z GA4
Nie všetky webové dáta, ktoré zozbierate pomocou Google Tag Managera sú v GA4 dostupné. Dôvodom je režimu súhlasu alias consent mode 👻. Keď používatelia neudelia súhlas so sledovaním, Google obmedzí použitie a ukladanie ich údajov, čo vedie k neúplným dátam v reportoch GA4.
Jednou z výhod integrácie BigQuery s GA4 je prístup k surovým, nevzorkovaným dátam. GA4 export do BigQuery obsahuje širšiu škálu dát, vrátane tých, ktoré sú generované aj bez súhlasu používateľov, tzv. anonymizované cookieless pingy.
Zaujímajú vás čísla? Urobili sme jednoduché porovnanie počtu zobrazení stránok u troch našich klientov. V GA4 sme použili “Explorations” report, v BigQuery export dát z GA4.
Ilustratívne sme vybrali klientov z troch rôznych oblastí, s rôznym objemom dát.
GA4 | BigQuery | rozdiel v % | |
blog | 5 383 | 8 864 | 39.27 |
služby | 296 421 | 540 364 | 45.14 |
ecommerce | 1 611 035 | 2 330 819 | 30.89 |
*Porovnanie počtu zobrazení stránok (page view) za máj 2024.
Ako vidíte, v BigQuery bolo v priemere o 38 percent viac dát ako v GA4. Toto číslo je individuálne pre každú stránku, ale bežne sa stretávame s hodnotami od 30 do 50 percent. Závisí to od konkrétneho webu, segmentu, ale aj nastavenia cookie lišty.
Výrazný rozdiel, čo poviete? 🤔
Ďalším benefitom integrácie je prístup ku všetkým dimenziám, ktoré do GA4 posielate. Nielen tým, ktoré ste si zaregistrovali.
V GA4 totiž môže byť problém s kardinalitou. To znamená, že veľký počet jedinečných hodnôt pre určité dimenzie, ako sú rôzne jedinečné identifikátory (napr. user id), môže spôsobiť nepresnosti v reportoch. Keď je kardinalita vysoká, GA4 môže dáta agregovať, aby sa zmestili do reportov. Výsledkom je menšia detailnosti a presnosť reportov.
Transformácie dát z GA4 Exportu
Ak používate na reporting v Looker Studiu raw dáta z GA4 exportu, určite ste sa stretli s dvoma, nazvime to nepríjemnosťami – pomalé načítavanie a zvláštne výsledky pri spájaní (blendovaní) dát. Niekedy dokážu poriadne potrápiť.
Raw dáta z GA4 exportu je dobré pred použitím ešte trochu “učesať”, aby boli pripravené na analýzu a reportovanie.
I keď nie ste dátový špecialisti a SQL experti, s pomocou internetu alebo AI si vytvoríte základné reportovacie tabuľky vcelku jednoducho. Či už ich chcete event scope, session, user, item alebo inak.
Výsledkom môže byť napríklad takáto custom reportovacia tabuľka. 👇
Nastavíte si automatické aktualizácie, prepojíte s Looker Studiom a máte hotovo.
Dobre, možno trochu preháňame. Nie je to až také jednoduché. Ak by ste si nevedeli rady, môžete sa na nás kedykoľvek obrátiť. 😅
Niekedy sa týchto transformácií nazbiera viac a začína byť zložité ich manažovať. Tu prichádza na rad Google Dataform. Je to nástroj, ktorý pomáha spravovať a spúšťať transformácie údajov uložených v BigQuery. Práca s ním však vyžaduje znalosť SQL a JavaScript, čo môže predstavovať pre mnohých problém.
Obohacovanie dát
Aby sme získali skutočne komplexný pohľad na marketingový výkon, nestačí sa spoliehať len na dáta z GA4. Je potrebné ich kombinovať s údajmi z Google Ads, Meta Ads, Google Search Console a ďalších zdrojov.
V BigQuery to nie je problém. Existuje veľké množstvo dátových konektorov, ktorými prepojíte marketingové platformy. alebo váš CRM systém s BigQuery. Niektoré sú platené, ale tie základné sú zdarma.
Integrácia rôznych dátových zdrojov potom umožňuje vykonávať analýzu naprieč kanálmi, čo je neoceniteľné pri pochopení, ako tieto marketingové kanály spolupracujú. Napríklad, kombinácia dát z GA4 a Google Ads môže ukázať, ako platené kampane ovplyvňujú návštevnosť a konverzie na vašej stránke za ostatných 7 dní.
Môžete na to skúsiť použiť takúto sympatickú query:
SELECT
ga.event_date,
ga.user_pseudo_id,
(SELECT value.int_value FROM UNNEST(ga.event_params) WHERE key = 'ga_session_id') AS ga_session_id,
ga.ecommerce.transaction_id,
ga.collected_traffic_source.gclid,
ga.collected_traffic_source.manual_campaign_id,
ga.collected_traffic_source.manual_campaign_name,
ga.collected_traffic_source.manual_source,
ga.collected_traffic_source.manual_medium,
MAX(ads.ad_group_id) AS ad_group_id,
MAX(ads.campaign_id) AS campaign_id,
MAX(ads.segments_click_type) AS segments_click_type,
MAX(ads.segments_slot) AS segments_slot,
MAX(cmp.campaign_name) AS campaign_name
FROM `project.dataset.table_*` AS ga
JOIN
`project.gads_data.p_ads_ClickStats_6464890505` AS ads
ON
ga.collected_traffic_source.gclid = ads.click_view_gclid
AND _PARTITIONTIME BETWEEN DATE_SUB(CURRENT_TIMESTAMP(), INTERVAL 8 DAY) AND DATE_SUB(CURRENT_TIMESTAMP(), INTERVAL 1 DAY)
JOIN
`project.gads_data.p_ads_Campaign_6464890505` AS cmp
ON
ads.campaign_id = cmp.campaign_id
WHERE _TABLE_SUFFIX BETWEEN FORMAT_DATE('%Y%m%d', DATE_SUB(CURRENT_DATE(), INTERVAL 8 DAY)) AND FORMAT_DATE('%Y%m%d', DATE_SUB(CURRENT_DATE(), INTERVAL 1 DAY))
AND ga.event_name = 'purchase'
GROUP BY ALL;
Vlastné dátové zdroje
S obohacovaním dát sa spája aj tvorba vlastných dátových zdrojov. Okrem prepojenia systémov pomocou dátovýh konektorov, môžete do BigQuery streamovať dáta z backendu, alebo zo serverového GTM. Hlavným dôvodom je, že tieto dáta nie sú inak dostupné alebo chcete maximalizovať ich množstvo a kvalitu.
Keďže posielania dát z backendu je bežné, uvediem dva menej tradičné spôsoby streamovania údajov do BigQuery cez serverové GTM.
- kvantita dát – ak chcete maximalizovať meranie určitej udalosti, môžete obísť klientské GTM a trackovací kód vložiť priamo do skriptu webovej stránky. Vyhnete sa tak prípadom, kedy sa GTM nespustilo alebo bolo zablokované.
Funguje to zhruba takto:
Udalosť pošlete z webu do serverového GTM, ktoré ju spracuje a odošle do BigQuery. Získané údaje môžete zo serverové GTM poslať aj do marketingových platforiem ako Google Ads alebo Meta Ads. Zdôrazňujem, že v každom prípade treba mať na zreteli aké dáta zbierate, a či máte súhlas na ich použitie!
- kvalita dát – pekným príkladom je kontrola odosielaných dát cez Facebook Conversion API. Možno si poviete, veď vo fejsbúku vidím event match quality. Áno, ale nie detailné informácie a dáta, ktoré neboli spracované kvôli nesprávnemu formátu alebo chybe.
V DASE používame modifikovaný FB Conversion API tag, ktorý ukladá do BigQuery všetky dáta odosielané do Facebooku aj s informáciou, či boli spracované alebo nie. Po prepojení s Looker Studiom je výsledkom Data Quality Report, ktorý pomáha identifikovať priestor na zlepšenie kvality dát a rýchlejšie odhalí prípadné problémy.
Záver
A to nie je zdaľeka všetko, čo môžete s pomocou BigQuery robiť. Ak si chcete skúsiť úlohu dátových vedcov a priatelíte sa s Pythonom, BigQuery má priamu integráciu s Jupyter Notebook.
Otvárajú sa vám tak možnosti exploratívnej analýzy, pokročilej analytiky alebo aplikácií strojového učenia. Kvôli posledne spomenutému nemusíte dokonca použiť ani Jupyter Notebook. Niektoré modely strojového učenia sú totiž dostupné priamo v BigQuery prostredníctvom SQL. Ale to je už iný príbeh.
Ako sa vraví, nič nie je zadarmo. Ani BigQuery. Bude vás stáť minimálne čas a úsilie, ktoré investujete. Odmenou vám bude viac dát, na základe ktorých môžete robiť informovanejšie rozhodnutia.
PS: o platbách za BigQuery sa viac dočítate v článku Koľko stojí Google Cloud.