A 2022-es év egyik leggyakrabban visszatérő kérdésköre az indexeltség volt. Megannyi lelkes ügyfél vagy szorgos szakértő szeretné megtippelni, mi is jár a Google fejében akkor, amikor úgy dönt, hogy a magyar nyelvű Google Search Console Oldalak jelentésében egy-egy aloldal a Kizárva csoportba kerül, miért is oda osztotta be a robot a rangsoroltatni vágyott aloldalt?
“Hiszen ha kizárta, annak biztos kell legyen valami oka. Sőt, tovább megyek, ha minden okot megfejtünk, ami miatt a Google kizárja az aloldalainkat, elérhetjük azt is, hogy az egész oldalt beindexelje és mindenünk feljöjjön” - Marketinges Gusztáv, 2022 február.
Gusztávnak - akinek nyilvánvalóan megváltoztattuk a nevét - szerencsére nincs igaza, mert az indexeltségből kizárt aloldalak jelenléte természetes és a Google alapvetően minőségi találati listára való törekvése miatt következményszerű. Fontos itt megemlíteni a rossz magyar fordítást is, ugyanis a Kizárva fogalom magyar nyelven valamilyen elbírálás következményét jelentené, azonban ebben a szekcióban találhatóak a felfedezett, de még nem feltérképezett oldalak, amelyekről még el sem dőlt, hogy indexelésre kerülnek-e. Tehát röviden, elképzelhető hogy csak várnod kell egy "kizárt" oldalnál az indexelésre. De ne lőjük le az összes poént, kezdjük el az alapoknál.
Google Search Console - mi az, mire való?
A Google Search Console (továbbiakban: GSC) egyszerűen megfogalmazva valami olyasmi, mint az ügyfélkapu. Ezen keresztül értesíti a webmestereket a Nagy Testvér mindenről, ami érint egy weboldalt. Szándékosan írtunk webmestert, hiszen sokan csak összekötik a webáruházat a GSC-vel, de nem szeretnék megismerni vagy értelmezni a jelentéseket, csak továbbítják olvasás nélkül a webáruház szolgáltatónak. Legyél te is webmester, hiszen a jelentések javarészt neked szólnak!
Tapasztalataink szerint az Unas rendszerben működő webshopok kevesebb mint fele használja jelenleg, ami egy elég jó arány, mert az e-kereskedelmen kívül ennél jóval kevesebbet tapasztalunk.
Minden olyan információ, ami az oldal organikus látogatottságának elemzéséhez szükséges - átlagos helyezés, átkattintási arány, megjelenési és kattintási számok - benne vannak, csak annyi a feladat vele, hogy helyesen értelmezze a felhasználó. Előbbieken felül sok egyéb területet lefed, de a téma szempontjából az Oldalak jelentés fontos, ami a bal oldali menüsávon található. Ez a jelentés enged betekintést Google Index-be is, aminek segítségével a weboldalad minden URL-jére rálátásod lehet.
Google Index - mi az és miért fontos számodra?
A Google Index egy gigantikus adatbázis, ami az arra érdemes összes létező URL-t listázza nagyon sok rájuk vonatkozó adat mellett. Ezt az adatbázist felfedező és/vagy feltérképező robotok (ún. crawler-ek) bővítik, amik minden nap minden percében az interneten linkek segítségével járják a különböző weboldalakat új URL-ek után kutatva.
Ebből az adatbázisból a vizsgált weboldalra vonatkozó adatok a GSC Oldalak menüpontja alatt érhetők el. Ez a jelentés elmondja, hogy a Google rendszerében egy adott URL listázva van-e, azt indexelte-e már vagy csak felfedezte a robot, kevésbé jó esetben kizárta-e a rangsorolásból. A Webhelytérképek menüpont alatt beküldheted a saját webhelytérképedet, ami megkönnyíti a felfedező és feltérképező robotok dolgát.
Oldalak jelentés (leánykori nevén Lefedettség)
A jelentés két nagy részre osztja a felfedezett URL-eket: Indexelt és Nem indexelt.
Indexelt csoportba kerülnek a különböző olyan aloldalak, amiket a Google rangsorolásra alkalmasnak talált, ide tartozik minden, amit az organikus találati listában meg fognak találni a látogatók.
Nem indexelt csoport:
- Szerverhiba (5xx)
- Átirányítási hiba
- Az URL-t a robots.txt letiltotta
- A beküldött URL jelölése „noindex”
- Lágy 404-es hiba
- Jogosulatlan kérelem miatt letiltva (401)
- Nem található (404)
- Tiltott hozzáférés miatt letiltva (403)
- A beküldött URL le lett tiltva más 4xx hiba miatt
- Oldaleltávolítási eszköz által letiltva
- Feltérképezve – jelenleg nincs indexelve
- Felfedezve – jelenleg nincs indexelve
- Alternatív oldal megfelelő kanonikus címkével
- Párhuzamos oldal felhasználó által választott gyűjtőoldal nélkül
- Párhuzamos oldal; a Google a felhasználó által megjelölt gyűjtőoldaltól eltérőt választott
Fenti kizárásokhoz a Google súgója ad pontos magyarázatokat, ráadásul elérhető magyar nyelven. Így ha ezek a jelzések szerepelnek, akkor a súgó lesz a segítségedre.
Ezek mellett persze még szoktak előjönni hipotézisek: a webáruház szolgáltató meggátolja az indexelést, mert nincs pénze szerverre, a Google nem szereti az oldalt, ok nélkül büntet vagy épp valaki meghackelte a SEO-t. Valljuk be, hogy ezek komolytalan gondolatok, az esetek mindegyikében megvan a pontos oka az indexeltség mértékének.
Mit mond a Nagy Testvér?
Csak egy mondatot idézzünk itt a fent említett súgóból:
"100%-os lefedettség: Ne várja, hogy a webhelye összes URL-jét indexeljük."
Az ügynökségi tapasztalatok szerint az utolsó 5 pont az, amikben mindenki valamilyen huncutságot sejt és szeretné azt megfejteni:
Feltérképezve/Felfedezve - jelenleg nincs indexelve
Talán nem kell túlmagyarázni ezt a két esetet, bár a visszajelzések alapján a legtöbb webáruház üzemeltető nem érti. Egyszerű magyarázat: minden rendben van, csak a Google még nem indexelte ezeket az oldalakat vagy eleve nem döntött még, hogy egyáltalán indexelni fogja-e őket.
Párhuzamos oldalak kérdése
Korábban sokat lehetett hallani arról, hogy valami duplikált tartalom, amit majd jól megbüntet a Google. Manapság inkább párhuzamos oldalakról beszélünk, amelyek tartalmilag nagyon hasonlóak egymáshoz. Az Unas rendszerben megfelelően kezelve vannak ezek, illetve számos beállítási lehetőséged van ezek finomhangolására.
Például összevont (ezáltal hasonló szövegezésű) termékek esetén több párhuzamos oldalad van, ilyen esetben a gyűjtőoldal (canonical) az alaptípus lesz. Termékvélemények esetén attól függően is szabályozható ez, hogy van-e vélemény egy termékhez vagy nincs. Logikus, hogy ha valamihez nincs vélemény, akkor a sok egyforma véleményírás oldalt nincs értelme a Google elé tárni indexelésre. Nézz be a SEO beállításokhoz a webshopodban és válaszd ki a neked legmegfelelőbb opciót, de azt érdemes tudni, hogy az alapbeállítások általában megfelelőek. Csak akkor változtass rajtuk, ha pontosan tudod, mint csinálsz.
Értem, de azért csak legyen indexelve!
Sajnos ez nem ilyen egyszerű és nem is megoldható, hiszen az elején Marketinges Gusztáv tévedett. Ahhoz, hogy értsük, miért is van így, összefüggéseiben kell látnunk a Google célját, működését, a monetizációs lehetőségeit és azt, hogy mi mibe kerül a rendszernek.
A Google célja és működése: a világ összes hirdetési bevételét a lehető legkisebb költség árán megkeresni úgy, hogy közben mindenki azt hiszi, ő a jó szándékú szomorú szamaritánus, aki ingyen adja a találati listát a csillogó szemű felhasználóknak.
- Sokan azt gondolják, hogy a Google a határtalan tudás ingyenes forrása és egész nap azért dolgozik, hogy a látogatókat nagy szeretettel kiszolgálja.
- A kereskedő vagy szolgáltató azt gondolja, hogy egy ingyenes találati lista, aminek néha fizet a hirdetési rendszerén keresztül, hogy legyen még több fizető ügyfele, de ugyebár az ingyenes listán elvárhatja tőle, hogy az utolsó égig érő vascsicsergőt is indexelje be, hiába a kutya nem keresi. Jobb esetben még első helyen is hozza a látogatók számára.
- Amit valójában a Google csinál az az, hogy eléri kiskorunktól kezdve, hogy a két fenti személy teljesen, feltétel és kérdés nélkül így lássa a rendszert, miközben egy óriási pénzgyárat üzemeltet, amiben szoftver termékeket és adatot ad el cégeknek felhasználásra vagy hirdetési lehetőséget azoknak, akik több látogatónak több terméket akarnak eladni.
Crawl budget, avagy a feltérképezési költségkeret
Miből van a Google-nek bevétele? A hirdetésekből és a szoftvercsaládok havidíjából. Mik a költségei? A humán erőforrás, programozók, marketingesek, rendszergazdák és nem utolsó sorban a végtelen mennyiségű szerverkapacitás, számítási igény a weboldalak feltérképezésére és azok indexben tartására.
Nem kell közgazdásznak lenned, hogy összerakd, hol is tud a Google a legkönnyebben óriásit spórolni, főleg annak tudatában, hogy rögtön két legyet is üt egy csapásra: a szerveren, egész pontosan a tárterületen, vagyis a Google Index kapacitásain, ami egyenes úton - nem meglepően - számítási költségeket jelent, ami mind villamos energiával hajtott szervereken történik.
Manapság költségekben nem kis fegyvertény, hogy kevesebb szervert kell venni és kisebb a villanyszámla egy ingyenes találati lista kiszolgálása során azáltal, hogy eldönti jó előre, mi kerül indexbe és mi nem, vagyis mit mutat meg a látogatóknak és mit nem. Ez teljesen racionális hozzáállás a költségei optimalizálásához.
Ehhez egy feltérképezési költségkeretet (Crawl Budget) állapít meg az egyes oldalakhoz. Ez az érték azt mutatja, hogy mennyire érdemli meg a ráfordítást a Google szempontjából az adott oldal. Persze a pontos okokat a Google szereti titokban tartani, cserébe végtelenül ködös utalást tesz arra, hogy minden aloldal legyen minőségi, szolgálja ki a látogatót és nyújtson jó felhasználói élményt.
Miért is lenne másképp, mikor ugyanaz a LED fényforrás vagy bundazsák minimum 200 másik webshopban megkapható? Az kerül indexbe, ami érdemes arra, hogy a látogató elé kerüljön, hiszen ha a Google nem a legjobbat mutatja meg a találati lista legelején, akkor a látogató sem a Google-ben fog keresni. Ennél fogva a www.sokadikbabawebshop.hu termékei hátrányból fognak indulni, lévén ezer konkurens közül sokan lesznek nála jobbak.
Mit tehetsz ellene?
A Google évek óta arra optimalizál, hogy a minőségi tartalmat helyezze előtérbe. Minden algoritmus frissítés és egyéb változtatás arról szól, hogy a weboldalak mind belső, mind külső SEO faktorait tekintve minőségiek legyenek. A belsőt a szokás és a szakmai elvárások szerint osszuk két részre, míg a külső jeleket - bár kevésbé kell indexelés témájában megemlíteni -, pár gondolat erejéig összefoglalom.
Technikai értelembe véve belső minőségi mutatók a Google robot számára
- Az oldal legyen feltérképezhető, vagyis minden olyan aloldalt, amit szeretnél rangsoroltatni, tarts "index, follow" meta tag alatt.
- Ami biztosan nem érdekes a Google számára, tedd "noindex"-re.
- A lehetőségekhez mérten törekedj ún. lapos hierarchiára, vagyis ne legyen 17. mélységig kategorizálva az összes termék, hiszen az olyan szerteágazó struktúrát alkot, amiben a Google robot nehezebben tájékozódik.
- Használd a lehető legtöbb belső linket ahhoz, hogy a főoldaltól 5 kattintásnyi mélységben lévő aloldalak is könnyen elérhetőek legyenek.
- Külső linkek ne csak a főoldaladra mutassanak, hanem a legfontosabb kategóriákra és kulcstermékekre is.
Fentieknél számolj azzal, hogy ha például naponta 50-100 feltérképezést indít a Google a webshopon, akkor egy nagyon mély kategorizáltsággal és n+1 alkategóriával nagyon jó eséllyel indulsz a “hogyan ne találja meg a Google a termékeimet” versenyen. Egy robot sem járkál a végtelenségig az oldalon és a rendelkezésre álló idő alatt a lehető legtöbb hasznos, rangsorolásra alkalmas aloldalt kell megtalálnia. Ha ezt nem teszed nekik lehetővé egy lapos szerkezettel és sok, egyértelmű tartalmi kapcsolódást jelölő belső linkkel, akkor hiába várod, hogy az oldal egy kielégítő lefedettséggel kerüljön be a Google indexbe.
Tartalmi szempontok szerint az aloldalak akkor hasznosak és alkalmasak arra, hogy a Google felhozza a találati listán, ha:
- Megfelelnek annak a minimum feltételnek, hogy jó minőségű, egyedi tartalommal vannak ellátva.
- Az aloldal szövege megfelel a látogató elvárásainak, vagyis kiszolgálja a keresési vágyat. Minden keresési kifejezés (kulcsszó) egy problématudatot és vágyat fed le, amire ha megfelelő szöveget adsz válaszul, a Google indexbe helyezi és felhozza a találati listára.
Nem, nem elég kategória vagy termékszövegnek 3 mondat vagy a nagykertől kapott szöveg.
Fontos, hogy nem összekeverendő ez azzal, hogy például termékek színváltozatai esetén bátran alkalmazható ugyanaz a termékszöveg a különböző színekhez vagy méretekhez. Különben szegény cipő és papucs webshopok minden pénzüket olyan termékszövegekre költenék, amik 3-4 hónap alatt kifutnak.
Itt említsük meg a mesterséges intelligencia által írt szövegeket is. Jó ha tudod ezzel kapcsolatban, hogy a Google gőzerővel azon dolgozik, hogy ezeket a szövegeket felismerje, sőt már szabadalmaztatott is egy AI szövegfelismerő algoritmust. Nem titkolt szándéka, hogy az organikus találatoknál figyelembe vegye, hogy a szöveges tartalmat ember írta valódi tájékoztatás céljából vagy valami más van a háttérben.
Hitelességi, vagyis oldalon kívüli mutatóit tekintve a megszokott feltételeknek kell megfelelni minimum kategória szinten:
- Mutasson az oldalra természetes vagy annak tűnő link más weboldalakról.
- Ne használj nagy volumenű linképítési technikát, például ún. PBN-ről (private blog network) származó linkeket havi 30-50 vagy még nagyobb számosságban. Persze lehet reménykedni benne, hogy a világ legdrágább keresőmotorját a magyarországi zug-linképítő majd átveri, csak egy idő után mindig rá kell jönni, hogy a Mikulás nem létezik.
- Lehetőleg az oldal linkeltsége, vagyis a bejövő linkek ne korlátozódjanak 1-1 témára, mert könnyen félreérthetővé válik a Google számára, ha egy weboldal termékcsoportjainak a döntő részére nem mutat külső link. Ha egyaránt mindenhova mutatnak, de vannak benne hangsúlyosabb területek, az sokkal hihetőbb, mint ha csak 2-3 kategória kap linkeket.
Mit ne tegyél ellene?
GSC-ben ne küldözgesd be naponta tizenhat alkalommal azokat az aloldalakat, amiket indexbe akarsz helyezni. A Google indexbe fogja rakni sokszor, ezzel nincs is gond, de amikor majd 2 hét múlva kiveszi és ezt a macska-egér játékot végzi az ember hónapokig, akkor annyi energia fog elmenni feleslegesen, hogy annyiból higgadtan le lehetett volna szövegezni az aloldalt minőségben.
SEO szentháromság
A SEO 3 terület együttes minőségi megfelelése: jó technika, jó tartalom és jó linkek, amik hitelessé teszik az oldalt. Ahhoz, hogy a rangsorban fent legyen egy aloldal:
- Kell jó minőségű weboldal motor, ez fogja a rangsorolás elméleti hátterét megteremteni, hiszen rossz weboldallal nem lehet haladni.
- Kell jó minőségű szöveges tartalom, ami a rangsorolás tárgya lesz. Ha nincs szöveges tartalom, akkor mi jöjjön fel a találati listán és mit tartson indexben a Google? A lelkesedést nem fogja.
- Meg kell indokolni megfelelő mutatókkal a hitelességet, ezek az oldalra mutató linkek. Ha nem hiteles az oldal, mert nem tették azzá más weboldalak hivatkozásokkal, akkor azt fogja a Google választani, amire több külső link mutat és legalább olyan jó technikai vagy tartalmi mutatóit tekintve.