
„Google“ darbuotojai Gary Illyes ir Martin Splitt naudojo podcast'o „Search Off the Record“ epizodą, norėdami sužinoti, kaip „Google“ tikrinimo programa tvarko HTML. Pokalbis atskleidė skirtumus tarp to, kaip naršyklės ir „Googlebot“ apdoroja tą patį puslapį.
Diskusija apėmė išteklių patarimus, metaduomenų išdėstymą ir HTML patvirtinimą. Kai kurie Illyes paaiškinimai ginčija prielaidas, kurie techniniai pakeitimai padeda ieškoti.
Kodėl išteklių patarimai nepadeda „Googlebot“.
Naršyklės našumo funkcijos, pvz dns-prefetch, preload, prefetchir preconnect išspręsti delsos problemas, kurių „Google“ infrastruktūra neturi.
Illyesas teigė, kad „Google“ DNS skyrai nereikia pagalbos, kurią bando teikti dauguma svetainių.
Jis pareiškė:
„Tai labai naudinga, jei, pavyzdžiui, DNS išankstiniam iškvietimui atlikti turite kaip prastą internetą. Mūsų atveju mums to nereikia, nes galime labai greitai kalbėtis su visais pakopiniais DNS serveriais.”
Jis pridūrė, kad „Google“ talpykloje saugo puslapio išteklius atskirai ir negauna jų realiuoju laiku, kaip tai daro naršyklė. Illyesas teigė, kad „Google“ tai daro, kad sumažintų pralaidumą ir serverio apkrovą svetainėse, kurias tikrina.
Illyes pasakė:
„Tas pats su išankstiniu įkėlimu. Jei nesame sinchroniški, mums nereikia ypač klausytis ir žiūrėti į išankstinį įkėlimą.”
„Google“ naudoja Speculation Rules API, kad pagreitintų „Chrome“ naudotojų paieškos rezultatų paspaudimus. Ši sistema veikia, nes ji veikia naršyklės lygiu, kur svarbus delsimas tarp vartotojo ir serverio. „Googlebot“ veikia „Google“ infrastruktūroje, kur tų kliūčių nėra.
Ir Illyes, ir Splitt buvo aišku, kad šios užuominos vis dar padeda vartotojams. Greitesnis puslapių įkėlimas pagerina išlaikymą ir konversiją. Skirtumas yra tas, kad šie pakeitimai daro įtaką naršyklės funkcijoms, o ne tikrinimui ar indeksavimui.
Metaduomenys priklauso galvoje
Splittas pasidalijo atveju, kai specifikacijas atitinkanti scenarijaus žyma galvoje įterpė iframe, o tai suaktyvino naršyklės galvutės uždarymą. Tai įstūmė „hreflang“ nuorodų žymas į kūną, kur Splittas teigė, kad „Google“ sistemos teisingai jas ignoravo.
Illyesas paaiškino, kodėl „Google“ tai griežtai laikosi. A meta name="robots" žyma, pagal HTML gyvenimo standartą, gali būti rodoma tik galvoje. Tas pats galioja ir rel=canonical nuorodos elementai.
Jis pasakė:
„Norėčiau ginčytis, kad labai pavojinga turėti nuorodų elementus, pernešančius metaduomenis kūne.
Jo samprotavimas yra toks, kad jei „Google“ priimtų kanonines žymas, būtų galima užgrobti šio puslapio kanonines žymas ir pašalinti jį iš paieškos rezultatų įterpiant žymėjimą.
Illyesas anksčiau teikė gaires dėl HTML analizavimo ir rel-canonical diegimo, patardamas kanoninėse žymose nurodyti visą URL kelią, kad būtų išvengta analizatoriaus dviprasmiškumo. Tai ta pati mintis, aiškus išdėstymas galvoje pašalina spėliones.
HTML galiojimas nėra lygus reitingo pranašumui
Illyesas tiesiogiai pasakė, kodėl galiojantis HTML negali būti reitingavimo signalas. Galiojimas kaip dvejetainis, tai reiškia, kad jis galioja arba jo nėra, tarp jų nėra vietos. Illyesas sakė, kad sunku padaryti ką nors prasmingo naudojant išlaikymo / nesėkmės metriką.
„Labai sunku pasakyti, kad kažkas yra arti galiojimo. Ir tada, pavyzdžiui, ką jūs ten darote, kai kažkas yra arti galiojimo.”
Jis pateikė pavyzdį, kad dėl trūkstamos uždarymo žymos puslapio HTML yra techniškai neteisingas, tačiau, kaip sakė Illyes, „vartotojui tai nieko nepakeis“.
Splittas sutiko ir pažymėjo, kad semantinis žymėjimas, pvz., tinkama antraščių hierarchija ir HTML5 struktūriniai elementai, taip pat neturi prasmingo svorio paieškos sistemoms, nors yra naudingas prieinamumui ir naudotojų patirčiai.
Kodėl tai svarbu
Techniniai auditai gali pažymėti išteklių užuominų galimybes ir HTML patvirtinimo klaidas. Žinodami, kurie iš jų turi įtakos „Google“ tikrintuvui, o kurie – naršyklėms, galite lengviau nustatyti, ką taisyti.
Kai „hreflang“ žymos, kanoninės nuorodos ar metarobotų direktyvos neveikia taip, kaip tikėtasi, pirmiausia reikia patikrinti, ar naršyklei išanalizavus puslapį, jos nepatenka į turinį. Žyma, kuri šaltinio HTML atrodo teisinga, gali atsidurti netinkamoje vietoje, jei scenarijus arba „iframe“ suaktyvina išankstinį galvos uždarymą.
Rogeris Montti apžvelgė atnaujintas „Google“ tikrinimo programos talpyklos gaires, kuriose rekomenduojamos ETag antraštės, kad būtų sumažintas nereikalingas tikrinimas. Šios gairės atitinka tai, ką Illyes aprašė šiame epizode.
Žvilgsnis į priekį
Splittas paminėjo, kad kliento užuominos buvo pradinė tema, kurią jis norėjo aptarti, ir kad HTML analizės diskusija buvo pagrindas būsimam epizodui. Jei toks epizodas įvyktų, jis gali apimti tai, kaip „Googlebot“ tvarko naujesnę versiją Accept-CH ir Sec-CH-UA antraštės, kurios pakeičia tradicines vartotojo agentų eilutes.
Visą pokalbį galima rasti „YouTube“ ir „Apple Podcasts“.



