21728
•
12 perces olvasás
•
Az indexelési problémák érvényteleníthetik a keresőoptimalizálási erőfeszítéseit – lehet, hogy egy oldal tökéletesen optimalizált és nagyszerű felhasználói élményt nyújt, de semmit sem ér, ha a Google nem látja. Az indexeletlen oldalak nem kerülnek be a SERP-be, és nem hoznak forgalmat és konverziókat.
Ellenkező esetben, ha a Google időnként olyan oldalt lát és indexel, amelyet nem indexeltek, akkor fennáll a személyes adatok kiszivárgásának, a rossz minőségű tartalom miatti Google-büntetésnek és egyéb, aligha kielégítő következményeknek a kockázata.
Ebben az útmutatóban megosztom, hogy milyen típusú indexelési problémák léteznek, és hogyan lehet ezeket kijavítani, hogy ne okozzanak hirtelen rangsorolást. Először azonban nézzük meg, hogyan ellenőrizheti, hogy van-e indexelési probléma a webhelyén.
A Google Search Console alapszintű, de még mindig elegendő megértést adhat webhelyének indexelési problémáiról. Ezek megtekintéséhez tekintse meg az Index > Oldalak jelentést.
Azok az oldalak, amelyeket bármilyen okból nem indexeltek, egy, a Nem indexelt szakasz alá kerülnek. Azok az oldalak, amelyek indexelve vannak, de még mindig problémákkal küzdenek, és figyelmet igényelnek, az oldal alján, az Oldal megjelenésének javítása részben találhatók:
A probléma további kivizsgálásához kattintson a hibasorra, majd az ellenőrizni kívánt URL melletti lencse ikonra:
A Search Console megmutatja a részleteket, és segít azonosítani, mi a probléma az oldallal.
Ha mélyebbre kell ásnia magát, és javaslatokat kell kapnia arra vonatkozóan, hogy mit kell javítania ahhoz, hogy az oldal hangja legyen, tekintse meg a WebSite Auditor Indexelés és feltérképezés szakaszát:
A WebSite Auditor letöltéseAz eszköz összegyűjti az összes hibás URL-t, így nem kell manuálisan ellenőriznie minden oldalt külön-külön.
Nos, most elkészültünk a „hol találok” résszel. Most itt az ideje, hogy megvizsgálja, milyen típusú indexelési problémákat találhat, és hogyan javíthatja ki azokat, hogy webhelye továbbra is feltérképezhető és indexelhető legyen.
A nem található (404) vagy a hibás URL valószínűleg az egyik leggyakoribb indexelési probléma. Egy oldalnak számos okból lehet 404-es állapotkódja. Tegyük fel, hogy törölte az URL-t, de nem távolította el az oldalt a webhelytérképről, hibásan írta be az URL-t stb.
Ahogy a Google mondja, a 404-esek önmagukban nem rontják a webhely teljesítményét mindaddig, amíg el nem küldik ezeket az URL-eket (vagyis azokat, amelyek indexelését kifejezetten kérte a Google-tól).
Ha 404-es URL-eket lát az indexelési jelentésekben, a következő lehetőségek közül választhat, hogyan lehet kijavítani őket, ha nem volt szándékuk:
Vegye figyelembe, hogy a GSC nem különbözteti meg a 404-et (nem található) a 410-estől (eltűnt), és a 404-es jelentés alá sorolja őket. Ezek korábban különböző típusú válaszkódok voltak: a 404 azt jelentette, hogy „nem található, de később megtalálható”, míg a 410-es a „nem található, és nem lesz olyan, amilyennek végleg elment” volt.
Ami ma illeti, a Google azt mondja, hogy a 404-et és a 410-et is ugyanúgy kezelik, így valószínűleg nem kell aggódnia, ha a 404-es jelentésben talál egy 410-es oldalt. Az egyetlen dolog, amit javaslok, hogy állítson be egyéni 404-es oldalt az üres 410-es oldal helyett, hogy megtakarítsa a forgalmat, és megakadályozza, hogy a felhasználók visszaugráljanak webhelyéről.
Sok keresőoptimalizálónak és webhelytulajdonosnak megvan a szokása, hogy a 404-eseket a kezdőlapra irányítja, de az igazság az, hogy ez nem a legjobb gyakorlat. Ez zavaró a Google számára, és puha 404-es problémákat eredményez. Nos, nézzük mik is ezek a puha 404-esek.
A lágy 404-es problémák akkor fordulnak elő, ha egy oldal 200-as OK-választ kap, de a Google nem találja meg a tartalmát, és 404-esnek tekinti. A lágy 404-es problémák számos okból előfordulhatnak, és előfordulhat, hogy némelyik nem is Öntől függ, például hibák a felhasználók böngészőjében. Íme néhány további ok:
Hiányzó szerveroldali include fájl
Megszakadt a kapcsolat az adatbázissal
Egy üres belső keresési eredményoldal
Töltetlen vagy más módon hiányzó JavaScript-fájl
Túl kevés a tartalom
Oldal álcázása
Ezeket a problémákat valójában nem olyan nehéz megoldani. Íme néhány gyakori forgatókönyv:
Ha a tartalom elköltözött, és az oldal valójában 200 OK, de üres, akkor állítson be egy 301-es átirányítást az új címre;
Ha a törölt tartalomnak nincs alternatívája, jelölje meg 404-esként, és távolítsa el a webhelytérképről;
Ha az oldalnak léteznie kell, akkor adjon hozzá némi tartalmat, és ellenőrizze, hogy minden szkript renderelve és megfelelően jelenik-e meg (nem blokkolja a robots.txt, a böngészők támogatják stb.);
Ha a hiba azért történik, mert a szerver leállt, amikor a Googlebot megpróbálja lekérni az oldalt, ellenőrizze, hogy a szerver megfelelően működik-e. Ha igen, kérje az oldal újraindexelését.
401-es hiba akkor fordul elő, amikor a Googlebot olyan oldalt próbál elérni, amelyhez engedély szükséges, és a szervere letiltja a Googlebotot ebben.
Ha szeretné indexelni az oldalt, adja meg a Googlebotnak a megfelelő engedélyt, vagy távolítsa el az engedélyezési kérelmet.
Ez a fajta hiba akkor fordul elő, ha a felhasználói ügynök megadta az oldalra való belépéshez szükséges hitelesítési adatokat (bejelentkezés, jelszó), de nem kapott hozzáférést ehhez. A Googlebot azonban soha nem ad hitelesítési adatokat, így a szerver 403-at ad vissza a kívánt oldal helyett.
Ha egy oldalt tévedésből blokkoltak, és valóban indexelnie kell, engedélyezze a hozzáférést a be nem jelentkezett felhasználóknak, vagy kifejezetten engedélyezze a Googlebot számára, hogy belépjen az oldalra, hogy elolvassa és indexelje azt.
Amint az a névből is kiderül, ez a hiba akkor fordul elő, ha kifejezetten kéri a Google-t, hogy indexeljen egy oldalt (azaz adja hozzá a webhelytérképhez vagy manuálisan kéri indexelést), de az oldal egy noindex címkével rendelkezik.
A javítás meglehetősen egyszerű – távolítsa el a noindex címkét, hogy a Google hozzáférhessen az oldalhoz.
Ha letilt egy oldalt a robots.txt segítségével, akkor a Google nem fogja feltérképezni. Távolítsa el a korlátozásokat az oldal indexeléséhez.
Megjegyzés: A Robots.txt nem garantálja, hogy az oldal nem lesz indexelve. Ezért a Google Search Console néha ehhez hasonlót jeleníthet meg:
Az ehhez hasonló problémák több problémát okozhatnak, mint az indexeletlen oldalak, mivel a Google hozzáférhet és felfedheti azokat az információkat, amelyeknek soha nem volt szándékuk, hogy megjelenjenek a SERP-ekben (például kosarak, személyes adatok stb.).
Ha ilyen problémával találkozik, döntse el, hogy szüksége van-e az oldal indexelésére vagy sem. Ha igen, távolítsa el az URL-t a robots.txt fájlból. Ha nem, távolítsa el a robots.txt fájlból is, de alkalmazza a noindex címkét, vagy korlátozza a hozzáférést a nem jogosult felhasználók számára. Ha új korlátozásokat alkalmaz, megkérheti a Google-t, hogy távolítsa el az oldalt az indexből a GSC-n keresztül ( Index > Eltávolítások > Új kérelem).
Ez egy másik típusú probléma, amely rosszabbul ronthatja webhelye teljesítményét, mint az indexeletlen oldalak. A Google nem részesíti előnyben az üres oldalakat, és valószínűleg rontja a pozícióit, mivel az üres oldalak a spam jellegű webhelyek és a rossz minőségű tartalom jelei.
Ha azt észleli, hogy egyes oldalai tartalomállapot nélkül indexeltek, manuálisan ellenőrizze az URL-t, hogy megtudja az okot. Például:
Lehet, hogy az oldal túl kevés tartalommal rendelkezik;
Előfordulhat, hogy az oldal megjelenítést blokkoló tartalommal rendelkezik, amely nem töltődik be megfelelően;
A tartalom álcázott.
A látottaktól függően tegyen intézkedéseket.
Például, ha az oldal túl üres, adjon hozzá további tartalmat. Itt ellenőrizheti SERP versenytársait, és követheti bevált gyakorlataikat a WebSite Auditor tartalomszerkesztő részének segítségével.
A WebSite Auditor letöltéseHa gyanítja, hogy az érintett oldalon valamilyen megjelenítést blokkoló tartalom található, ellenőrizze a harmadik féltől származó szkripteket használó felugró ablakokat, és győződjön meg arról, hogy megfelelően működnek, és valóban olvashatók-e a Google számára. Összességében a Google-nak ugyanúgy kell látnia az oldalak tartalmát, ahogyan azt a felhasználók látják.
Ha az oldal tartalma álcázott, ellenőrizze, hogy minden szkript vagy kép elérhető-e a Google számára.
A SEO közösség sokat beszélt az URL-átirányításokról. Ennek ellenére a keresőoptimalizálók folyamatosan követnek el hibákat, amelyek átirányítási hibákhoz és hibás indexelésekhez vezetnek. Íme néhány gyakori ok, amiért a Google nem tudja megfelelően olvasni az átirányításokat:
Az átirányítási lánc túl hosszú
Az átirányítás végtelen átirányítási ciklust eredményez (átirányítási hurok)
Az átirányítási URL meghaladja a maximális URL-hosszt (2 MB Google Chrome esetén)
Az átirányítási lánc rossz vagy üres URL-t tartalmaz
Az átirányítási hibák kijavításának egyetlen módja egy kifejezés: az átirányítások helyes beállítása. Kerülje el a hosszú átirányítási láncokat, amelyek csak a SEO feltérképezési költségkeretét pazarolják, és kiürítik a linklevet, ügyeljen arra, hogy ne legyenek 404-es vagy 410-es URL-ek a láncban, és mindig irányítsa át az URL-eket a releváns oldalakra.
Szerverhibák fordulhatnak elő, mert előfordulhat, hogy a szerver összeomlott, lejárt, vagy leállt, amikor a Googlebot megjelent.
Itt először ellenőrizni kell az érintett URL-t. Nyissa meg az URL-ellenőrzés eszközt a GSC-ben, és nézze meg, hogy továbbra is hibát jelez-e. Ha rendben van, akkor az egyetlen dolog, amit tehet, az újraindexelés kérése.
Ha továbbra is fennáll a hiba, a hiba jellegétől függően a következő lehetőségek közül választhat:
Csökkentse a túlzott oldalbetöltést dinamikus oldalkérések esetén
Győződjön meg arról, hogy webhelye tárhelyszervere nincs leállítva, nincs túlterhelve vagy nincs rosszul beállítva
Ellenőrizze, hogy nem blokkolja-e véletlenül a Google-t
A webhely feltérképezését és indexelését okosan irányíthatja
Miután mindent kijavított, kérjen újraindexelést, hogy a Google gyorsabban lekérje az oldalt.
A felhasználó által kiválasztott gyűjtőfájl nélküli másolás gyakori probléma az olyan többnyelvű és/vagy e-kereskedelmi webhelyeken, amelyeken sok azonos vagy nagyon hasonló tartalmú oldal található, amelyeket különböző célokra terveztek. Ebben az esetben meg kell jelölnie egy oldalt gyűjtőként, hogy elkerülje az ismétlődő tartalommal kapcsolatos problémákat.
Ez egy érdekes dolog. Előfordulhat, hogy egy bizonyos oldalt gyűjtőként jelölt meg, de a Google úgy döntött, hogy az oldal másik verzióját választja gyűjtőként, így inkább indexeli.
Az ilyen hibák kijavításának legegyszerűbb módja, ha egy gyűjtőcímkét helyez el a Google által kiválasztott oldalra, hogy a jövőben ne keverje össze. Ha meg szeretné tartani a gyűjtőoldalt a kiválasztott oldalon, átirányíthatja a Google által kiválasztott oldalt a kívánt URL-re.
A Google nem indexel egy oldalt, mert az egy gyűjtőoldal másolata. Csak hagyd úgy ahogy van.
Ha egy oldal Felfedezett állapotú, akkor a Google már felfedezte, de még nem térképezte fel és nem indexelte. Itt csak annyit tehet, hogy kétség esetén ellenőrizze az oldal indexelési utasításait. Ha minden rendben van (azaz ahogy gondoltad), akkor hagyd, hogy a Google végezze el a többit később.
Logikusan ez a leírás azt jelenti, hogy a Google feltérképezte az oldalát, de nem indexelte. Az oldal indexelve lesz, ha az indexelési utasítások nem állítják ennek ellenkezőjét. Nem kell újraindexelést kérnie – a Googlebot tudatában van annak, hogy az oldal indexelésre vár.
A Google Search Console sokat segíthet az indexelési problémák észlelésében és kijavításában. De túl jó lenne, ha nem lenne de. A helyzet az, hogy a Search Console csak akkor jelenít meg problémákat, ha a Google megpróbál lekérni egy oldalt, de ez bármilyen okból meghiúsul. Ha egy ilyen oldalt még a Google sem fedez fel, akkor a GSC-ben nem fog megjelenni az indexelési probléma. Bár a kérdés fontos lehet, és valójában sok is lehet.
A WebSite Auditor segíthet megtalálni és kijavítani az ehhez hasonló problémákat. Nyissa meg a Webhelyszerkezet > Oldalak menüpontot, és engedélyezze a Gyorsítótár dátuma a Google-ban oszlopot a kívánt munkaterületen.
A WebSite Auditor letöltéseEzzel láthatja azt a dátumot, amikor egy oldal gyorsítótárba került a Google-ban.
Most nézze meg a gyorsítótár dátumát.
A WebSite Auditor letöltéseHa a dátum valamivel túl távoli (több mint egy éve), vagy egyáltalán hiányzik – akkor a Google valószínűleg nem tudja, hogy az oldal létezik. És ki kell derítened, hogy miért.
Először nézze meg a Hivatkozások az oldalra oszlopot ugyanazon a munkaterületen. Ha nincsenek linkek, ez azt jelenti, hogy ez egy árva oldal, és a Google nem találja meg a webhely feltérképezésével. Ha szeretné az oldalt indexelni, akkor hivatkozzon rá a releváns és forgalomban gazdag oldalakról.
Tekintse meg a Robotokra vonatkozó utasítások oszlopot is, és ásson mélyebbre a Nem engedélyezettként megjelölt oldalakon. Előfordulhat, hogy tévedésből letiltotta az indexelni kívánt oldalakat.
A vizualizáció egy további hasznos modul az indexelési problémák megtalálásához
A WebSite Auditor letöltéseItt könnyen észreveheti az árva oldalakat (amelyek nem kapcsolódnak más oldalakhoz), a törött oldalakat (pirossal kiemelve) és a hosszú átirányítási láncokat, amelyek szintén okai lehetnek annak, hogy egyes oldalak nem kerülnek indexelésre.
Miután észlelte és kijavította az összes problémát, kérje meg az eszközt, hogy hozzon létre egy új webhelytérképet (és szükség esetén egy robots.txt fájlt), amelyet továbbküld a Google-nak, hogy megtalálja az összes szükséges oldalt.
A WebSite Auditor letöltéseHa rögzített URL-címekre van szüksége a mielőbbi indexeléshez, manuálisan is kérheti az újraindexelést a Google Search Console-ban.
Rendszeresen ellenőrizze az oldalak indexelését, mivel hibák bármikor előfordulhatnak. És bármilyen okból: a tárhelyszolgáltatói problémáktól a Google-hibákig és a Google-frissítésekig, amelyek befolyásolhatják a Google algoritmusainak kezelését.
Melyek az indexelési problémák, amelyekkel leggyakrabban találkozik? Ossza meg tapasztalatait Facebook SEO közösségünkben.