
Neseniai „Google“ atlikta podcast'as atkreipė dėmesį į tai, kad svetainės tampa didesnės nei bet kada anksčiau. „Google“ darbuotojai Gary Illyes ir Martin Splitt paaiškino, kad mintis, kad svetainės tampa „didesnės“ yra blogas dalykas, nebūtinai yra tiesa. Leidėjams ir SEO specialistams svarbu tai, kad puslapio svoris nėra patikima metrika, nes „perteklinio“ svorio priežastis gali būti naudinga.
Puslapio dydis priklauso nuo to, kas matuojama
„Google“ darbuotojas Martinas Splittas paaiškino, kad tai, ką daugelis žmonių laiko puslapio dydžiu, priklauso nuo to, kas matuojama.
- Ar tai matuojama tik HTML?
- Arba jūs kalbate apie bendrą puslapio dydį, įskaitant vaizdus, CSS ir „JavaScript“?
Tai svarbus skirtumas. Pavyzdžiui, daugelis SEO darbuotojų išsigando, kai išgirdo, kad „Googlebot“ apriboja savo puslapio tikrinimą iki tik 2 megabaitų HTML kiekviename puslapyje. Norėdami tai pažvelgti į perspektyvą, du megabaitai HTML prilygsta maždaug dviem milijonams simbolių (raidžių, skaičių ir simbolių). Tai prilygsta vienam HTML puslapiui su tiek pat raidžių skaičiumi kaip dviejose Hario Poterio knygose.
Tačiau kai įtraukiate CSS, vaizdus ir JavaScript kartu su HTML, dabar vyksta kitoks pokalbis, susijęs su puslapio sparta naudotojams, o ne „Googlebot“ tikrintuvui.
Martinas aptarė straipsnį apie HTTPArchive žiniatinklio almanachą, kuris yra svetainių tendencijų santrauka. Atrodė, kad straipsnyje maišomi skirtingi puslapių svorio tipai, o tai kelia painiavą, nes yra bent dvi puslapio svorio versijos.
Jis pažymėjo:
„Žiūrėkite, čia aš ne taip aiškiai suprantu jų puslapio svorio apibrėžimą.
…jie turi pastraipą, kurioje jie bando paaiškinti, ką jie turi omenyje sakydami puslapio svorį. …Aš nesuprantu šių dalykų skirtumų. Taigi jie sako, kad puslapio svoris (taip pat vadinamas puslapio dydžiu) yra bendras duomenų kiekis, matuojamas kilobaitais arba megabaitais, kuriuos vartotojas turi atsisiųsti, kad peržiūrėtų konkretų puslapį. Mano knygoje yra vaizdų ir dar daugiau, nes turiu atsisiųsti, kad pamatyčiau.
Štai kodėl nustebau išgirdęs, kad 2015 m. tai buvo 845 kilobaitai. Tai mane nustebino. …Nes aš manyčiau, kad su vaizdais tai būtų daugiau nei 800 kilobaitų.
… 2025 m. liepos mėn. tas pats puslapis dabar yra 2,3 megabaitų.
Duomenys suglaudinami
Bet tai tik vienas iš būdų suprasti puslapio dydį. Kitas būdas atsižvelgti į puslapio dydį yra sutelkti dėmesį į tai, kas perduodama per tinklą, o tai gali būti mažesnė dėl suspaudimo. Suspaudimas yra serverio pusėje esantis algoritmas, kuris sumažina failo, kuris siunčiamas iš serverio ir atsisiunčiamas naršyklės, dydį. Dauguma serverių naudoja glaudinimo algoritmą, vadinamą Brotli.
Martinas Splittas paaiškina:
„Aš užduodu šį klausimą viešai, kad skirtingi žmonės labai skirtingai suprato puslapio dydį. Priklausomai nuo sluoksnio, kurį žiūrite, tai taip pat tampa painu.
nes yra ir suspaudimas.…Taigi kai kurie žmonės galvoja, ah, bet ši svetainė į mano diską atsisiunčia 10 megabaitų.
Ir aš kaip, taip. … bet galbūt, jei pažvelgtumėte į tai, kas iš tikrųjų eina per laidą, galite pastebėti, kad tai yra penki ar šeši megabaitai, o ne visi 10 megabaitų. Nes galite suspausti dalykus tinklo lygiu, o tada išskleisti juos kliento lygyje…
Techniškai Martino pavyzdyje puslapio dydis iš tikrųjų yra penki ar šeši megabaitai dėl suspaudimo, todėl jį galima atsisiųsti greičiau. Tačiau iš vartotojo pusės tie penki ar šeši megabaitai išspaudžiami ir vėl virsta dešimčia megabaitų, kurie užima tiek vietos vartotojo telefone, darbalaukyje ar bet kur.
Ir tai sukelia dviprasmiškumą. Ar jūsų tinklalapis yra dešimties ar penkių megabaitų?
Tai iliustruoja platesnę problemą: skirtingi žmonės kalba apie skirtingus dalykus, kai kalba apie puslapio dydį.
Netgi plačiai naudojami apibrėžimai nevisiškai išsprendžia dviprasmybės. Puslapio svoris apibūdinamas kaip „bendras duomenų kiekis kilobaitais arba megabaitais, kuriuos vartotojas turi atsisiųsti“, tačiau, kaip paaiškėja diskusijoje, nėra vieno aiškaus apibrėžimo.
Martinas tvirtina:
„Kai klausiate žmonių, ką jie galvoja, ar tai didelis, ar ne, pradedate gauti labai skirtingus atsakymus, priklausomai nuo to, kaip jie galvoja apie puslapio dydį. Ir nėra vieno tikro jo apibrėžimo.
Ką apie žymėjimo ir turinio santykį?
Vienas iš įdomiausių podcast'o skirtumų yra tas, kad didelis puslapis nebūtinai yra neefektyvus. Pavyzdžiui, 15 MB HTML dokumentas laikomas priimtinu, nes „dauguma iš šių 15 megabaitų iš tikrųjų yra naudingas turinys“. Dydis atspindi pristatomą vertę.
Priešingai, kas būtų, jei turinio ir žymėjimo santykis būtų atvirkščiai, kai turinio buvo šiek tiek, bet didžioji puslapio svorio dalis buvo žymėjimas.
Martinas aptarė santykio pavyzdį:
„…o jei žymėjimas yra vienintelė pridėtinė? Ir aš turiu galvoje, ką jūs turite galvoje? Tai kaip, gerai, žinote, jei tai yra penki megabaitai, bet labai mažai turinio, ar tai blogai? Ar tai blogiau, kaip šiuo atveju, 15 megabaitų.
Ir aš manau, kad tai sudėtinga, nes tada patenkame į šią keistą turinio ir žymėjimo santykio teritoriją. Taip.
Ir aš pasakiau: na, bet kas, jei didžioji dalis yra žymėjimas, kuris yra kokios nors trečiosios šalies įrankio ar kokios nors paslaugos metaduomenys, arba dėl reguliavimo priežasčių, licencijavimo priežasčių ar bet ko. Tada tai yra naudingas turinys, bet nebūtinai galutiniam vartotojui, bet jūs vis tiek turite jį turėti.
Būtų keista sakyti, kad tai yra blogiau nei puslapis, kuriame daugiausia yra turinio.
Tai, ką Martinas daro čia, perkelia puslapio svorio idėją nuo neapdoroto dydžio prie to, ką iš tikrųjų atspindi duomenys.
Kodėl į puslapius įtraukiami duomenys, kurių vartotojai niekada nemato
Pagrindinis puslapio svorio padidėjimas yra turinys, kurio vartotojai niekada nemato.
Gary Illyes nurodo struktūrinius duomenis kaip turinio, skirto specialiai mašinoms, o ne vartotojams, pavyzdį. Nors tai gali būti naudinga paieškos sistemoms, ji taip pat padidina bendrą puslapio dydį. Jei leidėjas į savo puslapį prideda daug struktūrinių duomenų, kad galėtų pasinaudoti visomis galimomis parinktimis, tai padidins puslapio dydį, net jei vartotojas to niekada nematys.
Tai atkreipia dėmesį į struktūrinę žiniatinklio tikrovę: puslapiai nėra sukurti tik žmonėms. Jie taip pat skirti paieškos sistemoms, įrankiams, AI agentams ir kitoms sistemoms, kurios visos prideda savo reikalavimus prie tinklalapio svorio.
Kai pridėtinės išlaidos yra pateisinamos
Ne visas naudotojams skirtas turinys yra nereikalingas.
Martinas kalbėjo apie tai, kaip žymėjimas gali apimti „metaduomenis“ arba įrankį, reguliavimo ar licencijavimo tikslą, sukuriant tam tikrą pilką zoną. Net jei papildomi duomenys tiesiogiai nepagerina vartotojo patirties, jie atlieka tam tikrą tikslą, įskaitant padėti vartotojui rasti puslapį per paieškos variklį.
Martinas siekė, kad šie svarstymai dėl puslapio svorio apsunkina bandymus pažymėti puslapio svorį kaip gerą, jei jis yra mažesnis už šią ribą, arba blogą, jei puslapio svoris jį viršija.
Kodėl turinio ir metaduomenų atskyrimas neveikia
Vienas iš galimų sprendimų, kurį aptarė Gary Illyes, yra žmonėms skirto turinio atskyrimas nuo mašinos duomenų. Nors Gary konkrečiai nepaminėjo pasiūlymo LLMs.txt, tai, ką jis aptarė, yra panašus į jį, nes jis pateikia turinį mašinai, atėmus visas kitas pridėtines išlaidas, susijusias su vartotojui skirtu turiniu.
Tai, ką jis iš tikrųjų aptarė, buvo būdas atskirti visus mašinoje esančius duomenis nuo to, ką vartotojas atsisiųs, taip teoriškai sumažinant vartotojo tinklalapio versiją.
Gary greitai atmeta šią idėją kaip „utopišką“, nes visada atsiras minios šiukšlių siuntėjų, kurie ras būdą, kaip tuo pasinaudoti.
Jis paaiškino:
„Tačiau, deja, tai yra utopinis dalykas, nes ne visi internete žaidžia gražiai.
Žinome, su kiek šlamšto turime susidoroti. Savo tinklaraštyje mes kažkur sakome, kad per dieną sugauname 40 milijardų URL, tai yra šlamštas arba koks nors beprotiškas skaičius, tiksliai nepamenu, bet tai kažkoks beprotiškas skaičius ir tikrai milijardai. Tai tik padidins el. pašto šiukšlių kiekį, kurį gauna paieškos sistemos, o kiti įrenginiai, galbūt, kaip aš statyčiau 1 USD ir 5 centus, o tai iš tikrųjų padidins nepageidaujamo pašto, kurį sunaudoja paieškos varikliai, LLM ir kiti, kiekį.
Gary taip pat teigė, kad „Google“ patirtis rodo, kad istoriškai, kai turite skirtingų tipų turinį, visada bus skirtumų tarp šių dviejų tipų. Jis panaudojo pavyzdį, kai svetainėse buvo puslapiai mobiliesiems ir staliniams kompiuteriams, kai abi turinio versijos paprastai buvo skirtingos, o tai savo ruožtu sukėlė problemų dėl paieškos ir naudojimo, kai svetainė reitinguoja tinklalapį pagal vienos puslapio versijos turinį, tada vartotoją siunčia į kitą puslapio versiją, kurioje to turinio nėra.
Nors jis to aiškiai nepaminėjo, šis „Google“ patirties paaiškinimas gali paaiškinti, kodėl „Google“ nepriims LLMS.txt.
Dėl to paieškos sistemos dažniausiai apsistojo prie vieno dokumento modelio, net jei jis ir neefektyvus.
Svetainės dydis ir puslapio dydis yra tikras pasaulis
Diskusija galiausiai ginčija pradinę problemos koncepciją, kad sunkūs tinklalapiai yra blogi.
Gary pastebi:
„Pirmasis klausimas – ar tinklalapiai storėja? Manau, kad šis klausimas net nėra prasmingas.
Nes svetainės kontekste nesvarbu, ar ji stora. Vieno puslapio kontekste – taip.
Tačiau svetainės kontekste tai tikrai nesvarbu.
Taigi dabar Gary ir Martin pakeičia dėmesį į tinklalapius, kurie tampa vis sunkesni – tai prasmingesnis būdas pažvelgti į tinklalapių ir svetainių raidą.
Tai perkelia diskusiją nuo abstrakčios idėjos prie kažko labiau išmatuojamo ir veiksmingesnio.
Sunkesni puslapiai vis dar reikalauja realių išlaidų
Net esant greitesniems ryšiams ir geresnei infrastruktūrai, didesni puslapiai vis tiek turi pasekmių, o mažesni puslapiai turi teigiamą naudą.
Martinas paaiškina:
„Manau, kad mes eikvojame daug išteklių. Turiu galvoje, mes tai turėjome kitame epizode, kuriame sakėme, kad žinome, kad yra tyrimų, rodančių, kad greitesnės svetainės turi geresnį išlaikymą ir geresnius konversijų rodiklius. Taip. Ir greitis iš dalies priklauso nuo dydžio. Nes kuo daugiau duomenų siunčiu, tuo ilgiau užtrunka, kol tinklas iš tikrųjų perduos tuos duomenis ir tuo ilgiau užtrunka, kol įrenginys ir procesorius iš tikrųjų apdoroja.
Žvelgiant iš platesnės perspektyvos, problema yra ne tik našumas, bet ir efektyvumas. Kaip sako Illyes, „mes eikvojame daug išteklių“.
Žiniatinklis gali tapti sunkesnis, tačiau svarbiau yra kodėl. Puslapiuose yra ne tik naudotojams skirtas turinys, o nuo dizaino pasirinkimo priklauso ir jų dydis, ir poveikis.
Teminis vaizdas, kurį sukūrė Shutterstock / May_Chanikran
