Módszertan

Hogyan méri az Intendity az AI-keresési láthatóságot.

A teljes módszertan a dashboard minden metrikája mögött. Prompt-végrehajtás, megemlítés-érzékelés, láthatósági pontozás, share of voice, hivatkozási lefedettség. És a mérés korlátai, explicit módon meghatározva.

Mérési filozófia

Egyetlen válasz anekdota. Sok válasz jel.

A generatív modellek tervszerűen nem determinisztikusak. Ugyanaz a prompt, kétszer feltéve ugyanabban a percben, eltérő márkákat, eltérő keretezést, eltérő hivatkozásokat adhat vissza. Bármely mérési keretrendszer, amely egyetlen választ kezeli alapigazságként, félrevezet.

Az Intendity az AI-láthatóságot sok végrehajtáson átívelő eloszlásként kezeli. A dashboard minden metrikája összesítés a (prompt × modell × régió) mátrixon egy adott napon. Egy napi 64-es láthatósági pont azt jelenti: az elmúlt 24 órában az összes nyomon követett modellen futtatott összes prompt közül a márka a 64%-ukban volt nevesítve. A varianciát az átlag nyeli el; a hetek alatti trend mutatja a valódi jelet.

Ezért egy érdemi AEO-program napi automatizálást igényel. A manuális ellenőrzések alulmintavételeznek; a kis prompt-készletek alullefedik a vásárlói utat; az egymodelles ellenőrzések elmulasztják a módot, ahogyan a válaszok szolgáltatók között váltakoznak.

Mit rögzítünk futtatásonként

Hat strukturált jel (prompt × modell) végrehajtásonként.

Minden futtatás egy sort produkál a runs táblában (nyers modell-válasz, állapot, modellverzió, régió) és egy sort a mentions táblában (az alább elemzett elemzett kimenet). Mindkettő örökre megmarad Pro csomagokon.

  • Megemlítési státusz

    Hogy a nyomon követett márka nevesítve volt-e a válaszban. Logikai érték. A megemlítési arány számításainak alapja.

  • Pozíció

    Hol jelenik meg a márka a válaszban. Az először nevesített márka horgonyozza a mérlegelési készletet; a later megemlítések különbözőképpen súlyozódnak a leszármazott metrikáknál.

  • Hangulat + pontszám

    Pozitív, semleges vagy negatív besorolás 0–100-as pontszámmal. Rögzíti, hogy a magas megemlítési arány jó hír-e vagy márkabiztonság probléma.

  • Hivatkozott források

    Minden URL, amelyet a modell inline hivatkozott. Wikipedia, Reddit szálak, szakmai sajtó, listák, saját oldalak. A hivatkozási lefedettség elemzés alapja.

  • Versenytársi megemlítések

    Minden más nevesített márka ugyanabban a válaszban, pozíciójukkal és hangulatukkal. A share of voice alapja.

  • Kontextus-kivonat

    A márka megemlítését körülvevő pontos 1-2 mondat, szó szerint. Hallucinációs érzékeléshez és minőségi felülvizsgálathoz használva.

A futtatási metaadatok (modellverzió, régió, időbélyeg, böngészési mód jelzője) külön rögzítve vannak, így a történelmi összehasonlítások egyenértékűek maradnak a modellfrissítések között.

Megemlítés-érzékelés

LLM-alapú parser bizalmi pontozással.

A naív string-match megközelítés a megemlítés-érzékeléshez három beviteli osztálynál törik meg: kétértelmű márkanevek, amelyek átfednek az angollal (egy „Apex" nevű márka, amely nem kapcsolódó szöveggel egyezik), aliasok („Acme Corp" vs „Acme"), és közvetett hivatkozások („az európai vezető vállalati CRM" egy konkrét márkára mutat annak megnevezése nélkül).

Az Intendity parsere LLM-alapú. Minden futtatásnál a nyers modell-válasz plusz a márka regisztrált neve, aliasai, domainje és kategória-kontextusa a parsernek kerülnek, amely strukturált kimenetet produkál: meg volt-e nevezve a márka, hol, milyen versenytársak mellett, milyen hangulatban, milyen forrásokat hivatkozva, milyen bizalommal.

A bizalmi pontszámok 0–100. Egy 80 feletti pontszám egyértelmű, nevesített megemlítést jelez. Az 50 és 80 közötti pontszámok általában alias vagy közvetett hivatkozási eseteket tükröznek. Az 50 alatti pontszámok felülvizsgálatra jelölve és az alapértelmezett metrika-számításokból kizárva vannak. A haladó felhasználók módosíthatják a küszöböt vagy felszínre hozhatják az alacsony bizalmú halmazt.

A kézzel kódolt baseline-ekkel való egyezés meghaladja a 90%-ot a mért prompt-készleteken. Az élső esetek – különösen a közvetett hivatkozások és a rövid kétértelmű márkanevek – aktív fejlesztési terület.

Pontozási képletek

Három metrika, mindegyik meghatározva.

A dashboard minden metrikája közzé van téve. Nincsenek fekete dobozok.

Láthatósági pontszám

0–100-as napi összesítés. Megemlítési arány az összes (prompt × modell × régió) végrehajtáson a 24 órás ablakban.

visibility_score(nap) = 100 × mentioned_runs(nap) / total_runs(nap)

Share of voice

A márka megemlítései osztva az összes megemlítéssel a nevesített versenytársi halmazban, ugyanabban a prompt-készletben és időablakban. Megmutatja, hogy a láthatóság-növekedés kategória-növekedésből vagy konkrét versenytársak kiszorításából ered-e.

share_of_voice = brand_mentions / (brand_mentions + sum(competitor_mentions))

Hivatkozási lefedettség

A modell által a kategória prompt-készletéhez hivatkozott URL-ek közül az a százalék, ahol a márkának érdemi pozicionált jelenléte van (nevesítve a cikkben, profilírozva, összehasonlítási táblázatban felsorolva). Vezető mutató: a magas hivatkozási lefedettség ma magasabb megemlítési arányt jelez előre a következő negyedévben.

citation_coverage = positioned_source_urls / total_cited_source_urls
Futtatási kadencia és frissesség

Napi automatizálás, igény szerinti újrafuttatások, verziórögzítés.

A Pro fiókok alapértelmezés szerint minden engedélyezett promptot minden engedélyezett modellen minden nap futtatnak. A manuális igény szerinti futtatások korlátozás nélküliek. Az ingyenes fiókok manuálisan futtatnak napi korláttal; az eredmények továbbra is megmaradnak, de az előzmények 3 napos ablakra vannak csonkítva.

Minden futtatás rögzíti a szolgáltató által visszaadott modellverzió-karakterláncot. Amikor az OpenAI szállít egy új GPT-t, az Anthropic szállít egy új Claude-ot, vagy a Google forgatja a Gemini Pro mutatót, a változás látható a futtatási táblában és a trendvonalak az átmeneteken is értelmezhetők maradnak.

A régió alapértelmezés szerint a márka elsődleges piaca. A multi-régió nyomon követés Pron támogatott és javasolt minden márkánál, amely egynél több országban működik – az AI-válaszok nyelvenként és locale-onként változnak, sokszor drámaian.

Egy valódi minta

Hogyan néz ki 360 valódi megemlítés.

Számok egy közelmúltbeli futtatási hétből a legkorábbi tesztfiókjainkon (2 fiók, 6 márka, vegyes kategóriák – román helyi szolgáltatások és koreai bőrápolás). Kis minta, szándékosan torzított kategória-mix. Azért mutatjuk, mert az alternatíva – homályos „bízz bennünk" módszertani oldalak – rosszabb. Ezek nem ipari benchmark-ok. Bizonyítékok arra, hogy a rendszer a fentebb leírt alakú strukturált adatokat produkál.

  • Megemlítések a mintában
    360

    Egyetlen közelmúltbeli héten.

  • Megemlítési arány
    33%

    A márka ≈minden 3. futtatásból 1-ben volt nevesítve.

  • 1. pozíció részaránya
    35%

    A márkát nevesítő futtatások 35%-ában a márka volt az első helyen.

  • Rögzített forráshivatkozások
    297

    A 36 futtatáson át, ahol a modell URL-eket hivatkozott inline.

  • Különböző hivatkozott domainek
    100

    Hosszú farok ebben a mintában; termelési prompt-készletekben koncentráltabb.

Egy nagyobb, szándékosan megtervezett kutatási projekt egyetlen meghatározott kategórián (~30 prompt × 4 modell × 14 nap) folyamatban van; az eredmények közzétételre kerülnek a /hu/blog oldalon, amikor elkészül.

Korlátok és ismert torzítások

Amit ez a módszertan nem tesz.

Explicit módon meghatározva, mert az alternatíva az lenne, hogy a vásárlók később fedezik fel:

  • Mintaméret. Egy 10 prompt × 4 modell × 1 régió prompt-készlet 40 futtatást/nap produkál. Ez elegendő a trend nyomon követéséhez, nem elegendő kis különbségek érzékeléséhez. Stratégiai döntésekhez 30+ prompt-készletek ajánlottak.
  • Közvetett hivatkozások. Azok a válaszok, amelyek leírnak egy márkát anélkül, hogy megnevezik ("az ágazat vezető vállalati platformja"), részben rögzítve vannak az LLM-parser által alacsonyabb bizalommal. A tisztán közvetett megemlítések alulszámolt szélső esetek maradnak.
  • Szolgáltatói oldali variancia. A szolgáltatói API-válaszok alkalmanként különböznek a fogyasztói alkalmazásban látható válaszoktól (különböző alapértékek, különböző rangsorolási jelek). Az Intendity a szolgáltatói API-kat használja; az abszolút számok eltérhetnek attól, amit egy vásárló manuálisan ellenőriz az alkalmazásban, bár a trendek korrelálnak.
  • Nincs ok-okozati attribúció. Egy ajánlás, amelyet az 1. héten szállítunk, és egy megemlítési arány, amely a 4. héten emelkedik, korreláció, nem bizonyíték. Egyszerre több változó mozdul el. Az adatokat mi hozzuk felszínre; az attribúció a program felelősének ítélete.
  • A hallucinációs javítás forráspályán történik. Az Intendity nem kéri a modellt, hogy felejtse el a rossz információkat. Felszínre hozzuk azt a forráspályán lévő elemet, amelyre a modell támaszkodik (egy elavult Wikipedia bekezdés, egy elavult értékelési szál), és ajánljuk a forráspályán lévő javítást. A forrásfrissítések az újracrawlást követő 1–6 héten belül terjednek át a modell válaszaira.

Alkalmazd a módszertant.

Futtasd az első márkádat és öt perc alatt nézd meg a láthatóságot, a share of voice-t és a hivatkozási lefedettséget valódi promptokon.