„Google“ darbuotojas Johnas Muelleris neseniai atsakė į klausimą apie „Google Search Console“ praneštas fantomines noindex klaidas. Muelleris tvirtino, kad šie pranešimai gali būti tikri.
Noindex „Google Search Console“.
„Noindex“ robotų direktyva yra viena iš nedaugelio komandų, kurių „Google“ turi paklusti. Tai vienas iš nedaugelio būdų, kaip svetainės savininkas gali valdyti „Googlebot“, „Google“ indeksuotoją.
Tačiau neretai paieškos pultas praneša, kad negali indeksuoti puslapio dėl „noindex“ direktyvos, kuri, atrodo, neturi „noindex“ direktyvos, bent jau nė vienos, kuri nematoma HTML kode.
Kai „Google Search Console“ (GSC) praneša, kad pateiktas URL pažymėtas kaip „noindex“, ji praneša apie iš pažiūros prieštaringą situaciją:
- Svetainė paprašė „Google“ indeksuoti puslapį per svetainės schemos įrašą.
- Puslapis atsiuntė „Google“ signalą jo neindeksuoti (per „noindex“ direktyvą).
Tai paini „Search Console“ žinutė, kad puslapis neleidžia „Google“ indeksuoti jo, kai leidėjas ar SEO negali pastebėti, kad tai vyksta kodo lygiu.
Asmuo, uždavęs klausimą, paskelbė „Bluesky“:
„Pastaruosius 4 mėnesius svetainėje buvo aptikta noindex klaida („robotų“ metažymoje), kuri atsisako dingti iš „Search Console“. Niekur svetainėje nėra nei robots.txt „noindex“. Mes jau išnagrinėjome tai… Kas gali sukelti šią klaidą?
„Noindex“ rodo tik „Google“.
„Google“ atstovas Johnas Muelleris atsakė į klausimą ir pasidalijo, kad puslapiuose, kuriuos jis nagrinėjo, „Google“ visada buvo rodoma „noindex“, kur tokie dalykai vyksta.
Muelleris atsakė:
„Anksčiau mačiau atvejų, kai iš tikrųjų buvo neindeksas, tik kartais rodomas tik „Google“ (kuris vis tiek gali būti labai sunku derinti). Tačiau nedvejodami atsiųskite man keletą URL pavyzdžių.
Nors Muelleris nepaaiškino, kas gali nutikti, yra būdų, kaip išspręsti šią problemą, kad išsiaiškintumėte, kas vyksta.
Kaip pašalinti „Phantom Noindex“ klaidas
Gali būti, kad kažkur yra kodas, dėl kurio „noindex“ rodomas tik „Google“. Pavyzdžiui, galėjo atsitikti taip, kad puslapis vienu metu turėjo neindeksą, o serverio talpykla (pvz., talpyklos papildinys) arba CDN (pvz., „Cloudflare“) nuo to laiko talpydavo HTTP antraštes, o tai savo ruožtu sukeltų seną noindex antraštę, kuri būtų rodoma „Googlebot“ (nes jis dažnai lankosi svetainėje), o svetainės savininkui teikiama nauja versija.
Patikrinti HTTP antraštę lengva, yra daug HTTP antraštės tikrintuvų, tokių kaip šis KeyCDN arba šis SecurityHeaders.com.
520 serverio antraštės atsako kodas yra tas, kurį siunčia „Cloudflare“, kai blokuoja vartotojo agentą.
Ekrano kopija: 520 „Cloudflare“ atsako kodas

Žemiau yra 200 serverio atsako kodo, sugeneruoto „Cloudflare“, ekrano kopija:
Ekrano kopija: 200 serverio atsako kodo

Patikrinau tą patį URL naudodamas du skirtingus antraštės tikrintuvus: vienas antraštės tikrintuvas grąžino aa 520 (užblokuotas) serverio atsakymo kodą, o kitas antraštės tikrintuvas siuntė 200 (OK) atsakymo kodą. Tai rodo, kaip skirtingai „Cloudflare“ gali reaguoti į kažką panašaus į antraštės tikrintuvą. Idealiu atveju pabandykite patikrinti naudodami keletą antraščių tikrintuvų, kad sužinotumėte, ar yra nuoseklus 520 atsakymas iš „Cloudflare“.
Tais atvejais, kai tinklalapyje tik „Google“ rodomas kažkas, ko kitu atveju nemato kažkas, žiūrintis kodą, turite priversti „Google“ peržiūrėti puslapį už jus naudodami tikrą „Google“ tikrinimo programą ir iš „Google“ IP adreso. Norėdami tai padaryti, įmeskite URL į „Google“ turtingų rezultatų testą. „Google“ išsiųs tikrintuvą iš „Google“ IP adreso ir, jei serveryje (arba CDN) yra kažkas, kas rodo „noindex“, tai jį užfiksuos. Be struktūrinių duomenų, „Rich Results“ testas taip pat pateiks HTTP atsakymą ir tinklalapio momentinę nuotrauką, kurioje tiksliai parodys, ką serveris rodo „Google“.
Kai paleidžiate URL naudodami „Google Rich Results Test“, užklausa:
- Kilęs iš „Google“ duomenų centrų: robotas naudoja tikrąjį „Google“ IP adresą.
- Išlaiko atvirkštinius DNS patikrinimus: jei serveris, saugos papildinys arba CDN patikrins IP, jis bus grąžintas į googlebot.com arba google.com.
Jei puslapį blokuoja „noindex“, įrankis negalės pateikti jokių struktūrinių duomenų rezultatų. Turėtų būti pateikta būsena „Puslapis netinkamas“ arba „Tikrinimas nepavyko“. Jei tai matote, spustelėkite nuorodą „Peržiūrėti išsamią informaciją“ arba išplėskite klaidos skyrių. Ji turėtų rodyti kažką panašaus į „robotų metažymą: noindex“ arba „noindex“, aptiktą metažymoje „robotai“.
Šis metodas nesiunčia „GoogleBot“ vartotojo agento, jis naudoja „Google-InspectionTool/1.0“ vartotojo agento eilutę. Tai reiškia, kad jei serverio blokas yra pagal IP adresą, šis metodas jį sugaus.
Kitas aspektas, kurį reikia patikrinti, yra situacija, kai nesąžininga „noindex“ žyma yra specialiai parašyta, kad blokuotų „GoogleBot“, vis tiek galite suklastoti (mėgdžioti) „GoogleBot“ naudotojo agento eilutę naudodami „Google“ skirtą „Chrome“ skirtą „User Agent Switcher“ plėtinį arba sukonfigūruoti programą, pvz., „Screaming Frog“, kad ji identifikuotų save su „GoogleBot“ naudotojo priemone ir turėtų ją sugauti.
Ekrano kopija: „Chrome“ naudotojo agento perjungiklis

„Phantom Noindex“ klaidos „Search Console“.
Tokias klaidas diagnozuoti gali būti sunku, tačiau prieš pakeldami rankas reikia šiek tiek laiko, kad pamatytumėte, ar kuris nors iš čia aprašytų veiksmų padės nustatyti paslėptą šios problemos priežastį.
Teminis vaizdas, sukurtas „Shutterstock“ / „AYO Production“.



