Long-form

Jak funguje paměť AI agentů Surya

Detailní pohled na pětivrstvou architekturu, ontologii 146 PPC konceptů, Bayesovské váhy a autodream konsolidaci. Asi 12 minut čtení.

Problém: studený start

Generický „AI asistent" v Excelu nebo ChatGPT nemá žádný kontext. Pokaždé, když se ho zeptáte na klienta, musíte ho znovu vysvětlovat — kdo to je, co prodává, jaké jsou cíle, co minulý měsíc nezafungovalo. Po 5 klientech přestáváte chtít říkat, že máte „AI nástroj".

Surya řeší tento problém pětivrstvou architekturou paměti, která si pamatuje, kontextualizuje a sama se zlepšuje.

L1 · Core Memory

Vždy v promptu každého agenta. Klient (CK Velký Orient — cestovní kancelář, vertikála cestování), cíle (PNO 15 %, ROAS 6.7), strategie (focus na Asii Q3, Balkán Q2), guardrails (brand kampaně neměnit, budget +20 % týdně max).

Když systém detekuje kontradikci („minulý týden jste schválil −30 % budget na brand, ale guardrail říká neměnit"), předloží ji k prošetření.

L2 · Epizodická paměť

Každá schválená nebo zamítnutá změna, A/B test, anomálie a vaše poznámka jsou indexované vektorem. Klíčové: vaše „to ne" má 3× větší váhu než automatická data.

Příklad: před 6 týdny jste zamítli návrh „přechod na tCPA u brand search" s důvodem „málo konverzí". Když týden po týden začne agent přemýšlet o stejném návrhu, projde nejdřív přes recall a najde tu epizodu — návrh nikdy znovu neproběhne.

L3 · Vzory & ontologie

Bayesovské pravidlo: tCPA pod 30 konverzí zvyšuje CPA o 20–40 %. Důvěra: 87 % (12 případů potvrzeno, 1 vyvrácen). Ontologie 146 PPC konceptů s CZ + EN aliasy — agent ví, že „CTR" a „míra prokliku" jsou totéž, „brand search" zahrnuje „brandové dotazy", atd.

L4 · Znalostní graf (Memgraph)

Multi-hop dotazy přes vztahy, ne jen vektory. Příklad: „Co se stalo, když jsme v Q4 zvýšili budget brandovek?" → agent prochází graf budget↑ → brand_search → Q4 → outcome a najde 3 kauzální řetězce s průměrným dopadem ROAS +0.42.

L5 · Autodream

Po každé akci proběhne mikro-autodream: revize core memory, dedup epizod. Jednou týdně full run: zastaralé vzory degraduje (decay 180 dní), potvrzené posiluje, kontroluje reálný stav Google Ads vs. to, co si systém pamatuje.

Praxe: typický run

Daily monitor v 06:00 spustí agenta na klientovi CK Velký Orient. Agent načte L1 (cíle, guardrails), recall L2 pro relevantní epizody (5 schválených změn za poslední 2 týdny), L3 pro vzory (3 aktivní pravidla pro sezónu), L4 pro causal context. Analyzuje včerejší MTD spend. Nachází: brand search nad +20 % budget guardrail. Návrh: pauznout dočasně.

Před vytvořením návrhu agent prochází preflight validaci — ověří v L4 grafu, že brand pause v dubnu má v historii negativní outcome (ROAS klesá o 35 %). Návrh se nevytvoří. Místo toho agent zapíše do L2 epizodu „attempted brand pause, blocked by L4 causal" a do L3 posílí vzor „brand pause v dubnu = bad".

Tipy pro uživatele

  1. Pište poznámky v UI. Vaše „to ne" má 3× váhu, vaše vysvětlení proč je zlato pro budoucí runy.
  2. Nastavte brand termy explicitně. Ontologie z toho vychází. Bez toho agent může omylem optimalizovat brand jako generic.
  3. Reviewujte autodream digest. Týdenní e-mail ukáže, jaké vzory se posílily/oslabily. Můžete intervenovat.

Otázky?

Architektura paměti je nejhlubší část Surya. Rád si o ní povím víc.