Jak analyzovat uživatelské chování v GA4 a BigQuery

Možná již sledujete cesty uživatelů pomocí modulu Explore v nástroji GA4. Pojďme to zkusit pomocí BigQuery.

Na co to je

Tento dotaz vám ukáže posloupnost událostí, které daný uživatel vytvořil na vašich webových stránkách.

Možná chcete zjistit, jak nakupují nejcennější zákazníci ve srovnání s nově získanou skupinou zákazníků s nízkou útratou. Nebo můžete zjišťovat, jaký obsah slouží jako vstupní brána k nákupu. Možnosti jsou neomezené.

Jak to funguje

Než začneme, je důležité vědět, jaké Client ID chceme sledovat. To je v BigQuery označeno jako user_pseudo_id. V zájmu zjednodušení jej lze nalézt jako proměnnou na začátku dotazu.

Dotaz rozdělí pole timestamp na datum a čas. Poté z vnořené tabulky zjistí dimenzi page_location.

Dále je třeba vybrat dimenze zdroje, média a kampaně související s událostmi a uživateli.

declare cid string;

set cid = '1103212246.1623307268'; -- Insert Client ID you want to track

select
    extract (date from timestamp_micros (event_timestamp) ) as date,
    extract (time from timestamp_micros (event_timestamp) ) as time,
    event_name,
    (select value.string_value from unnest (event_params) where key = 'page_location') as page,
    concat(traffic_source.source, ' / ', traffic_source.medium) as user_source_medium,
    traffic_source.name as user_campaign_name,
    concat ( (select value.string_value from unnest (event_params) where key = 'source'), ' / ', (select value.string_value from unnest (event_params) where key = 'medium') ) as event_source_medium,
    (select value.string_value from unnest (event_params) where key = 'campaign') as event_campaign
from `projectId.analytics_123456789.events_*` -- Change this to your source table
where user_pseudo_id = cid
order by event_timestamp asc

Záměrně jsem do tohoto dotazu přidal rozměry pro uživatele i události, protože nám to pomůže pochopit rozdíl v atribuci na úrovni eventu a uživatele v GA4.

Dotaz rovněž ukazuje, jak dobrý je datový model založený na událostech. Pomocí několika řádků kódu zjistíte, kolik kampaní oslovilo zákazníka během nastaveného období.

Poznámka k atribuci

Universal Analytics používá model last-touch non-direct atribuce. GA4 využívá stejný model, ale jen v některých případech. Doporučuji pročíst si článek o atribuci od Witolda Wrodarczyka.

Postupně můžete vysledovat rozdíly v atribuci mezi UA a GA4. Budou patrné zejména ve standardních reportech.

Čím více budete používat BigQuery pro tvorbu vlastních reportů, tím lépe pro vás. Vyplatí se to.

Upozornění

  • Nezaměňujte Client ID a User ID. Client ID se výrazně spoléhá na soubory cookie v prohlížeči, zatímco User ID využívá vámi nastavené prostředky identifikace. Vyzkoušejte, který identifikátor se pro vaši analýzu hodí lépe.
  • Věnujte nějaký čas hledání reprezentativních uživatelů pro analyzovaný segment.
  • Využijte tento report jako podklad pro další kvantitativníkvalitativní výzkum.

Tohle je jen začátek

Chcete další kouzla s BigQuery?
Vytvoříme pro vás propracovaný datový model, který pokryje všechny vaše potřeby v oblasti reportingu!

Napište nám

Ozveme se do 24 hodin.

Jiří Šantora
Jiří Šantora

Datový inženýr

Jirka využívá rozsáhlých zkušeností z datového inženýrství a stavění datových modelů při psaní o BigQuery a novinkách ve světě datové analytiky.