
„Google“ darbuotojas Johnas Muelleris atsakė į klausimą apie „Search Console“ ir 404 klaidų ataskaitų teikimą, teigdamas, kad pakartotinis puslapių su 404 būsenos kodu tikrinimas yra teigiamas signalas.
404 Būsenos kodas
404 būsenos kodas, dažnai vadinamas klaidos kodu, ilgą laiką supainiojo daugelį svetainių savininkų ir SEO, nes žodis „klaida“ reiškia, kad kažkas sugedo ir turi būti taisoma. Tačiau taip nėra.
404 yra tiesiog būsenos kodas, kurį serveris siunčia atsakydamas į naršyklės užklausą dėl puslapio. 404 yra pranešimas, pranešantis, kad prašomas puslapis nerastas. Vienintelis klaida yra pati užklausa, nes puslapis neegzistuoja.
Nors paprastai vadinama 404 klaida, techniškai formalus pavadinimas yra 404 nerasta. Šis pavadinimas tiksliai atspindi 404 būsenos kodo reikšmę: prašomas puslapis nerastas.
Oficialaus žiniatinklio standarto, skirto 4o4 būsenos kodui, ekrano kopija

„Google“ nuolat tikrina 404 puslapius
Kažkas „Reddit“ paskelbė, kad „Google Search Console“ nuolat praneša, kad nebeegzistuojantys puslapiai vis randami naudojant svetainės schemos duomenis, nepaisant to, kad svetainės schemoje trūkstamų puslapių sąrašas neberodomas.
Asmuo teigia, kad „Search Console“ tikrina trūkstamus puslapius, bet iš tikrųjų juos tikrina „Googlebot“; „Search Console“ tik praneša apie nepavykusius tikrinimus.
Jie nerimauja dėl išeikvoto tikrinimo biudžeto ir nori sužinoti, ar vietoj to turėtų siųsti 410 atsakymo kodą.
Jie rašė:
„Google Search Console“ vis dar tikrina daugybę neegzistuojančių puslapių, kurie pateikia 404. Puslapio tikrinimo įrankyje ir tikrinimo statistikoje nurodoma, kad jie „atrasta per“ mano puslapio-sitemap.xml.
Problema:
Kai dabar atidarau tikrąjį puslapį-sitemap.xml naršyklėje, jame nėra nė vieno iš tų 404 URL.
Svetainės schemoje yra tik 21 geras, gyvas puslapis.
…Nenoriu ištrinti ar nustoti teikti svetainės schemą, nes ji švari ir nurodo tik gerus puslapius. Tačiau šie pakartotiniai tikrinimai eikvoja tikrinimo biudžetą.
Ar kas nors anksčiau susidūrė su tuo?
Ar „Google“ galiausiai sustoja pati?
Ar turėčiau pakeisti 404s į 410 Gone?
O gal yra kitas būdas pasakyti GSC: „Ei, tai dingo amžiams“?
Apie „Google“ 404 puslapių tikrinimą
„Google“ jau seniai naudojasi 404 puslapių tikrinimu tik tuo atveju, jei tie puslapiai būtų netyčia pašalinti ir atkurti. Kaip pamatysite akimirksniu, „Google“ darbuotojas Johnas Muelleris tvirtai nurodo, kad pakartotinis 404 puslapių tikrinimas rodo, kad „Google“ sistemos gali vertinti turinį teigiamai.
Apie 404 puslapis nerastas atsakymas
Oficialus žiniatinklio standartinis 404 būsenos kodo apibrėžimas yra tas, kad prašomas šaltinis nerastas, ir tai yra, nieko daugiau. Šis atsakymas nereiškia, kad puslapis niekada negrįžta. Tai tiesiog reiškia, kad prašomas puslapis nerastas.
Apie 410 atsakymų
Oficialus žiniatinklio standartas 410 būsenos kodui yra tas, kad puslapio nebėra, o būsena, kurios nėra, greičiausiai yra visam laikui. Atsakymo tikslas – pranešti, kad išteklių tyčia dingo ir kad visos nuorodos į tuos išteklius turėtų būti pašalintos.
„Google“ iš esmės tvarko 404 ir 410 tą patį
Techniškai, jei tinklalapis visam laikui išnyksta ir niekada negrįžta, 410 yra teisingas serverio pranešimas, kurį reikia siųsti atsakant į užklausas dėl trūkstamo puslapio. Praktiškai „Google“ 410 atsakymą traktuoja beveik taip pat, kaip ir 404 serverio atsakymą. Panašiai kaip elgiamasi su 404 atsakymais, „Google“ tikrinimo programos vis tiek gali grįžti patikrinti, ar 410 atsakymų puslapio nebėra.
„Google“ darbuotojai nuolat teigė, kad 410 serverio atsakas yra šiek tiek greitesnis, kai išvalo puslapį iš „Google“ indekso.
„Google“ patvirtina faktus apie 404 ir 410 atsakymų kodus
„Google“ atstovas Muelleris atsakė trumpu, bet daug informacijos turinčiu atsakymu, kuriame paaiškino, kad „Search Console“ pranešta 404 problema nėra problema, kurią reikia išspręsti, kad 410 atsakymo siuntimas neturės įtakos „Search Console 404“ ataskaitoms ir kad URL gausa šioje ataskaitoje gali būti vertinama teigiamai.
Muelleris atsakė:
„Tai nesukelia problemų, todėl tiesiog leisčiau jiems būti. Jie bus tikrinami dar ilgai, o 410 to nepakeis. Tam tikra prasme tai reiškia, kad „Google” būtų gerai, jei iš jūsų svetainės paimtų daugiau turinio.”
Nesusipratimai apie 4XX serverio atsakymus
Diskusija „Reddit“ tęsėsi. R/SEO subreddit moderatorius teigė, kad priežastis, dėl kurios „Search Console“ praneša, kad ji aptiko URL svetainės schemoje, yra ta, kad „Googlebot“ iš pradžių rado URL, o tai skamba pagrįstai.
Moderatorius suklydo paaiškindamas, ką reiškia 404 atsakymo kodas.
Moderatorius neteisingai paaiškino:
„404 iš esmės reiškia – puslapis sugedęs, mes netrukus jį pataisysime, patikrinkite dar kartą: tai ir daro „Google“ – tikrina, ar ištaisėte.
Moderatorius savo atsakyme daro dvi klaidas.
1. 404 Reiškia, kad puslapis nerastas
Būsenos kodas 404 reiškia tik tai, kad puslapis nerastas, taškas. Netikite manimi? Čia yra oficialus 404 būsenos kodo žiniatinklio standartas:
„Būsenos kodas 404 (Nerastas) rodo, kad pradinis serveris nerado dabartinės tikslinio ištekliaus atvaizdavimo arba nenori atskleisti, kad toks yra. 404 būsenos kodas nenurodo, ar šis atstovavimo trūkumas yra laikinas ar nuolatinis…“
2. 404 nėra klaida, kurią reikia taisyti
Žmonės dažniausiai vadina 404 būsenos kodą kaip atsaką į klaidą. Klaidos priežastis yra ta, kad naršyklė arba tikrinimo programa paprašė URL, kuris neegzistuoja, o tai reiškia, kad užklausa buvo klaida, o ne tai, kad puslapį reikia taisyti, kaip primygtinai reikalavo moderatorius, sakydamas „404 iš esmės reiškia – puslapis neveikia“, o tai yra 100 % neteisinga.
Be to, „Reddit“ moderatorius neteisingai tvirtino, kad „Google“ „patikrina, ar tai ištaisėte“. „Google“ vėl tikrina, ar puslapis nedingo netyčia, tačiau tai nereiškia, kad 404 yra kažkas, ką reikia taisyti. Manoma, kad dažniausiai puslapis išnyksta dėl priežasties, todėl „Google“ rekomenduoja tuo metu pateikti 404 atsakymo kodą.
Tai nėra nauja
Tai nėra „Reddit“ moderatoriaus informacija pasenusi problema. Taip visada buvo „Google“, kuri paprastai laikosi oficialių žiniatinklio standartų.
„Google“ atstovas Mattas Cuttsas 2014 m. vaizdo įraše paaiškino, kaip „Google“ tvarko 404 ir kodėl:
„Paaiškėjo, kad žiniatinklio valdytojai gana dažnai šauna sau į koją. Dingsta puslapiai, žmonės netinkamai sukonfigūruoja svetaines, neveikia svetainės, žmonės netyčia blokuoja „Googlebot“, žmonės netyčia blokuoja įprastus vartotojus. Taigi, jei pažvelgsite į visą žiniatinklį, tikrinimo komanda turi būti suprojektuota taip, kad būtų atspari tam.
Taigi su 404… mes ketiname apsaugoti šį puslapį dvidešimt keturias valandas tikrinimo sistemoje. Taigi mes tarsi laukiame ir sakome, gal tai buvo trumpalaikis 404. Galbūt tai tikrai nebuvo skirta kaip puslapis nerastas. Taigi nuskaitymo sistemoje jis bus apsaugotas dvidešimt keturias valandas.
…Dabar nesupraskite to per daug neteisingai, mes vis tiek grįšime, patikrinsime ir įsitikinsime, ar tų puslapių tikrai nebeliko, o gal jie vėl atgijo.
…Ir taigi, jei puslapio nebėra, galima pateikti 404. Jei žinote, kad jis iš tikrųjų dingo, galite pateikti 410.
Tačiau savo tikrinimo sistemą kursime taip, kad ji būtų tvirta. Bet jei jūsų svetainė sugenda, į jus įsilaužta ar pan., stengiamės užtikrinti, kad vis tiek rastume gerą turinį, kai tik jis bus pasiekiamas.
The Takeaways
- „Googlebot“ 404 puslapių tikrinimas gali būti vertinamas kaip teigiamas signalas, kad „Google“ patinka jūsų turinys.
- 404 būsenos kodai nereiškia, kad puslapis yra klaidingas; tai reiškia, kad puslapis nerastas.
- 404 būsenos kodai nereiškia, kad kažką reikia taisyti. Tai tik reiškia, kad prašomas puslapis nerastas.
- Pateikiant 404 atsakymo kodą nėra nieko blogo; Google rekomenduoja.
- „Search Console“ rodo 404 atsakymus, kad svetainės savininkas galėtų nuspręsti, ar tie puslapiai yra tyčia, ar ne.
Teminis vaizdas, kurį sukūrė Shutterstock / Jack_the_sparow


