
Šiandienos klausime „Ask An SEO“ atsakome į klausimą:
“Ayra SEO, ar turėčiau naudoti žurnalo failo duomenis ir ką tai gali pasakyti, kad įrankiai negali?“
Kas yra žurnalo failai
Iš esmės žurnalo failai yra neapdorotas sąveikos su svetaine įrašas. Apie juos praneša svetainės serveris ir paprastai apima informaciją apie vartotojus ir robotus, puslapius, su kuriais jie sąveikauja, ir kada.
Paprastai žurnalo failuose bus tam tikra informacija, pvz., asmens arba roboto, kuris sąveikavo su svetaine, IP adresas, vartotojo agentas (ty „Googlebot“ arba naršyklė, jei tai žmogus), sąveikos laikas, URL ir serverio atsakymo kodas, pateiktas URL.
Žurnalo pavyzdys:
6.249.65.1 - - (19/Feb/2026:14:32:10 +0000) "GET /category/shoes/running-shoes/ HTTP/1.1" 200 15432 "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 14_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/121.0.0.0 Safari/537.36"
- 6.249.65.1 – Tai yra vartotojo agento, kuris pateko į svetainę, IP adresas.
- 19/Feb/2026:14:32:10 +0000 – Tai hito laiko žyma.
- GET /kategorija/batai/bėgimo bateliai/ HTTP/1.1 – HTTP metodas, prašomas URL ir protokolo versija.
- 200 – HTTP būsenos kodas.
- 15432 – Atsakymo dydis baitais.
- Mozilla/5.0 („Macintosh“; Intel Mac OS X 14_2) AppleWebKit/537.36 (KHTML, kaip „Gecko“) Chrome/121.0.0.0 Safari/537.36 – Vartotojo agentas (ty robotas arba naršyklė, kuri paprašė failo)
Kam gali būti naudojami žurnalo failai
Žurnalo failai yra tiksliausias įrašas apie tai, kaip vartotojas ar robotas naršė jūsų svetainėje. Jie dažnai laikomi autoritetingiausiu sąveikos su jūsų svetaine įrašu, nors CDN talpyklos ir infrastruktūros konfigūracija gali turėti įtakos išsamumui.
Ką tikrina paieškos sistemos
Vienas iš svarbiausių SEO žurnalo failų naudojimo būdų yra suprasti, kokius mūsų svetainės puslapius tikrina paieškos sistemų robotai.
Žurnalo failai leidžia matyti, kurie puslapiai tikrinami ir kokiu dažnumu. Jie gali padėti mums patikrinti, ar svarbūs puslapiai tikrinami ir ar dažnai besikeičiantys puslapiai tikrinami dažniau, palyginti su statiniais.
Žurnalo failus galima naudoti norint patikrinti, ar yra tikrinimo atliekų, ty puslapiai, kurių nenorite tikrinti, arba su bet kokiu tikru dažnumu, užtrunka tikrinimo laiką, kai svetainėje apsilanko robotas. Pavyzdžiui, žiūrėdami į žurnalo failus galite nustatyti, kad parametrizuoti URL arba puslapiai su puslapiais per daug tikrinami, palyginti su pagrindiniais puslapiais.
Ši informacija gali būti labai svarbi nustatant puslapio aptikimo ir tikrinimo problemas.
Tikrasis tikrinimo biudžeto paskirstymas
Žurnalo failo analizė gali suteikti teisingą tikrinimo biudžeto vaizdą. Tai gali padėti nustatyti, kurios svetainės skiltys sulaukia daugiausia dėmesio, o kurios yra nepaisomos robotų.
Tai gali būti labai svarbu norint pamatyti, ar svetainėje yra prastai susietų puslapių, ar jiems suteikiamas mažesnis tikrinimo prioritetas nei toms svetainės skyriams, kurios yra mažesnės.
Žurnalo failai taip pat gali būti naudingi atlikus itin techninius SEO darbus. Pavyzdžiui, kai svetainė buvo perkelta, žurnalo failų peržiūra gali padėti nustatyti, kaip greitai aptinkami svetainės pakeitimai.
Naudodami žurnalo failus taip pat galima nustatyti, ar svetainės struktūros pakeitimai iš tikrųjų padėjo optimizuoti tikrinimą.
Atliekant SEO eksperimentus, būtina žinoti, ar eksperimente esantis puslapis buvo aptiktas robotų, ar ne, nes tai gali nustatyti, ar jie matė testavimo patirtį. Žurnalo failai gali suteikti tokią įžvalgą.
Nuskaitymo elgsena techninių problemų metu
Žurnalo failai taip pat gali būti naudingi nustatant technines svetainės problemas. Pavyzdžiui, yra atvejų, kai būsenos kodas, apie kurį praneša tikrinimo įrankis, nebūtinai bus būsenos kodas, kurį robotas gaus, kai pateks į puslapį. Tokiu atveju žurnalo failai būtų vienintelis būdas tai tiksliai nustatyti.
Žurnalo failai leis jums pamatyti, ar robotai patiria laikinų svetainės gedimų, bet ir per kiek laiko jie vėl susidurs su tais pačiais tinkamos būsenos puslapiais, kai problema bus išspręsta.
Boto patvirtinimas
Viena labai naudinga žurnalo failų analizės funkcija yra atskirti tikrus robotus ir suklastotus robotus. Taip galite nustatyti, ar robotai pasiekia jūsų svetainę prisidengdami, kad yra iš „Google“ ar „Microsoft“, bet iš tikrųjų yra kitos įmonės. Tai svarbu, nes robotai gali apeiti jūsų svetainės saugos priemones, teigdami, kad yra „Googlebot“, o iš tikrųjų jie nori atlikti nešvankius jūsų svetainėje veiksmus, pvz., išgryninti duomenis.
Naudojant žurnalo failus, galima nustatyti IP diapazoną, iš kurio atėjo robotas, ir patikrinti jį pagal žinomus teisėtų robotų, pvz., Googlebot, IP diapazonus. Tai gali padėti IT komandoms užtikrinti svetainės saugumą, netyčia neužblokuojant tikrų paieškos robotų, kuriems reikalinga prieiga prie svetainės, kad SEO būtų veiksmingas.
Našlaičių puslapių atradimas
Žurnalo failus galima naudoti vidiniams puslapiams, kurių įrankiai neaptiko, identifikuoti. Pavyzdžiui, „Googlebot“ gali žinoti apie puslapį per išorinę nuorodą, o tikrinimo įrankis galėtų jį aptikti tik per vidines nuorodas arba svetainių schemas.
Žurnalo failų peržiūra gali būti naudinga nustatant našlaičių svetainės puslapius, apie kuriuos tiesiog nežinojote. Tai taip pat labai naudinga nustatant pasenusius URL, kurie nebeturėtų būti pasiekiami svetainėje, bet vis tiek gali būti tikrinami. Pavyzdžiui, netinkamai perkelti HTTP URL arba padomeniai.
Kokie kiti įrankiai negali mums pasakyti, ką gali padaryti žurnalo failai
Jei šiuo metu nenaudojate žurnalo failų, galbūt naudojate kitus SEO įrankius, kad galėtumėte susipažinti su žurnalo failų teikiama įžvalga.
„Analytics“ programinė įranga
„Analytics“ programinė įranga, pvz., „Google Analytics“, gali parodyti, kokie puslapiai yra svetainėje, net jei robotai nebūtinai gali juos pasiekti.
„Analytics“ platformose taip pat pateikiama daug informacijos apie vartotojų elgesį svetainėje. Jie gali suteikti konteksto, kurie puslapiai yra svarbiausi komerciniams tikslams, o kurie nenašūs.
Tačiau jie nerodo informacijos apie ne naudotojų elgesį. Tiesą sakant, dauguma analizės programų yra skirtos filtruoti robotų elgseną ir užtikrinti, kad pateikti duomenys atspindėtų tik žmones.
Nors jie yra naudingi nustatant vartotojų kelionę, jie nerodo robotų kelionės. Neįmanoma nustatyti, kurią puslapių seką paieškos robotas aplankė ir kaip dažnai.
„Google Search Console“ / „Bing“ žiniatinklio valdytojo įrankiai
Paieškos sistemų paieškos pultai dažnai pateiks svetainės techninės būklės apžvalgą, pvz., aptikimo problemas ir tai, kada puslapiai buvo paskutinį kartą tikrinti. Tačiau tikrinimo statistika yra apibendrinta ir atrenkami didelių svetainių našumo duomenys. Tai reiškia, kad jums gali nepavykti gauti informacijos apie konkrečius jus dominančius puslapius.
Jie taip pat pateikia tik informaciją apie savo robotus. Tai reiškia, kad gali būti sunku sujungti robotų tikrinimo informaciją ir iš tikrųjų pamatyti robotų elgesį iš įmonių, kurios nesiūlo tokio įrankio kaip paieškos konsolė.
Tinklalapių tikrintuvai
Svetainės tikrinimo programinė įranga gali padėti imituoti, kaip paieškos robotas gali sąveikauti su jūsų svetaine, įskaitant tai, ką jis gali techniškai pasiekti ir ko ne. Tačiau jie nerodo, ką robotas iš tikrųjų pasiekia. Jie gali suteikti informacijos apie tai, ar teoriškai puslapį galėtų nuskaityti paieškos robotas, bet nepateikia jokių realaus laiko ar istorinių duomenų apie tai, ar robotas pasiekė puslapį, kada ir kaip dažnai.
Tinklalapių tikrinimo programos taip pat imituoja robotų elgesį tokiomis sąlygomis, kurias nustatote, o nebūtinai tomis, su kuriomis iš tikrųjų susiduria paieškos robotai. Pavyzdžiui, be žurnalo failų sunku nustatyti, kaip paieškos robotai naršė svetainėje DDoS atakos ar serverio gedimo metu.
Kodėl negalite naudoti žurnalo failų
Yra daug priežasčių, kodėl SEO gali nenaudoti žurnalo failų.
Sunku juos gauti
Dažnai žurnalo failus pasiekti nėra paprasta. Jums gali tekti pasikalbėti su savo kūrimo komanda. Priklausomai nuo to, ar ta komanda yra įmonės viduje, ar ne, tai tiesiogine prasme gali reikšti bandymą susekti, kas pirmiausia turi prieigą prie žurnalo failų.
Komandoms, dirbančioms agentūroje, įmonėms, kurios turi perduoti potencialiai neskelbtiną informaciją už organizacijos ribų, yra dar sudėtingiau. Žurnalo failuose gali būti asmenį identifikuojančios informacijos, pavyzdžiui, IP adresų. Tiems, kuriems taikomos tokios taisyklės kaip BDAR, gali kilti problemų dėl šių failų siuntimo trečiajai šaliai. Gali prireikti išvalyti duomenis prieš jais bendrinant. Tai gali būti materialinės laiko ir išteklių sąnaudos, kurių klientas gali nenorėti išleisti tiesiog bendrindamas savo žurnalo failus su savo SEO agentūra.
Vartotojo sąsajos poreikiai
Kai turėsite prieigą prie žurnalo failų, ne viskas vyksta sklandžiai. Turėsite suprasti, į ką žiūrite. Žurnalo failai neapdorota forma yra tiesiog tekstiniai failai, kuriuose yra eilutė po duomenų eilutės.
Tai nėra kažkas, ką būtų lengva išanalizuoti. Norint iš tikrųjų suprasti žurnalo failus, paprastai reikia investuoti į programą, kuri padėtų juos iššifruoti. Jų kaina gali svyruoti priklausomai nuo to, ar tai programos, skirtos leisti failą paleisti ad hoc pagrindu, ar sujungiate žurnalo failus, kad jie nuolat būtų transliuojami į programą.
Sandėliavimo reikalavimai
Taip pat reikia saugoti žurnalo failus. Be to, kad jie yra saugūs dėl pirmiau minėtų priežasčių, pvz., GDPR, juos gali būti labai sunku laikyti ilgą laiką dėl to, kaip greitai jie auga.
Didelėje el. prekybos svetainėje žurnalo failai gali pasiekti šimtus gigabaitų per mėnesį. Tokiais atvejais jų saugojimas tampa techninės infrastruktūros problema. Tai gali padėti failų suglaudinimas. Tačiau atsižvelgiant į tai, kad su paieškos robotais susijusioms problemoms diagnozuoti gali prireikti kelių mėnesių duomenų arba juos reikia palyginti ilgą laiką, šie failai gali tapti per dideli, kad juos būtų galima ekonomiškai saugoti.
Suvokiamas techninis sudėtingumas
Kai turėsite iššifruojamo formato žurnalo failus, išvalytus ir paruoštus naudoti, iš tikrųjų turite žinoti, ką su jais daryti.
Daugelis SEO turi didelių kliūčių naudoti žurnalo failus vien dėl to, kad jie atrodo pernelyg techniški naudoti. Galų gale, jie yra tik informacijos apie svetainės hitus eilutės. Tai gali jaustis pribloškianti.
Ar SEO turėtų naudoti žurnalo failus?
Taip, jei gali.
Kaip minėta pirmiau, yra daug priežasčių, kodėl jums gali nepavykti gauti savo žurnalo failų ir paversti juos tinkamu naudoti duomenų šaltiniu. Tačiau kai tik galėsite, tai atvers visiškai naują supratimo apie jūsų svetainės techninę būklę ir robotų sąveiką su ja.
Bus padaryta atradimų, kurių tiesiog neįmanoma pasiekti be žurnalo failo duomenų. Šiuo metu naudojami įrankiai gali padėti jums pasiekti tikslą. Tačiau jie niekada nepateiks viso vaizdo.
Daugiau išteklių:
Teminis vaizdas: Paul Poetry / Search Engine Journal
