
Naujasis „Chrome“ „Lighthouse Agentic Browsing“ auditas skirtas jūsų .txt failą kaip žymėjimo dokumentą. Jei faile llms.txt nenaudojama žymėjimo nuorodos sintaksė, jums nepavyks atlikti patikrinimo, net jei kiekviena failo nuoroda yra tiksli ir veikia. Atlikau auditą svetainėje nohacks.co. Praėjo du iš šešių auditų. Trys grįžo netaikoma. Vienas nepavyko: llms.txt auditas su pažodine klaida „Atrodo, kad faile nėra jokių nuorodų.” Pataisyta buvo penki simboliai vienoje nuorodoje. Failas vis dar pateikiamas kaip paprastas tekstas. Pasikeitė tik audito rezultatas.
„Lighthouse 13.3.0“ kartu su našumu, prieinamumu, SEO ir geriausiomis praktikomis pristatė kategoriją „Agentinis naršymas“. Šeši auditai numatytame rinkinyje: prieinamumo medžio formavimas (agent-accessibility-tree), kaupiamasis išdėstymo poslinkis (cumulative-layout-shift), llms.txt aptinkamumas (llms-txt) ir tris WebMCP patikras (webmcp-registered-tools, webmcp-form-coverage, webmcp-schema-validity). Kategorija pateikia dalinį išlaikymo koeficientą, o ne balą nuo 0 iki 100, nes agentinio žiniatinklio standartai vis dar keičiasi.
1 iš 6 auditų nepavyko svetainėje Nohacks.co
Atlikau auditą per Lighthouse CLI: npx lighthouse@latest https://nohacks.co --only-categories=agentic-browsing. Grįžo šeši auditai. Trys grįžo netaikomi, visi WebMCP: webmcp-registered-tools, webmcp-form-coverageir webmcp-schema-validity. Švyturys nesuteikia jokios priežasties netinkamam rezultatui, jis tiesiog pažymi auditą ir juda toliau. nohacks.co atskleidžia WebMCP, bet tik eksperimentiniu reikalavimu navigator.modelContext API (du žodyno įrankiai, du – agento-naršyklės katalogui), be deklaratyvių formos komentarų. Nuskaitymas buvo atliktas naudojant numatytąją be galvutę „Chrome 150“ be WebMCP vėliavėlės, todėl netaikytinas sprendimas gali reikšti, kad svetainė neatskleidžia nieko, ką šie auditai atpažįsta, arba kad nuskaitymo aplinkoje tuo metu nebuvo aktyvios WebMCP API. Švyturys nesako, kuris. Du auditai buvo sėkmingai atlikti: agent-accessibility-tree pranešė „Visi auditai praėjo“ patvirtinantis, kad semantinė HTML ir ARIA struktūra yra pakankamai gerai suformuota, kad agentai galėtų naršyti, ir cumulative-layout-shift grįžo prie nulio.
Vienas auditas nepavyko: llms-txt. Pažodinis klaidos pranešimas iš „Lighthouse“ buvo toks:
Atrodo, kad faile nėra jokių nuorodų.
Kategorijos balas buvo 0,67. Tai buvo pirmoji staigmena. Failas adresu nohacks.co/llms.txt turi daug nuorodų. Naršymo keliai į straipsnius, epizodus, svečius, žodynėlį. RSS kanalo URL. Garso failo URL šablonai. Failas yra daugiau nei penki kilobaitai struktūrinio turinio. Taigi kodėl „Lighthouse“ nepranešė apie nulį nuorodų?
Švyturys Parses .txt Kaip Markdown ir atmeta paprasto teksto nuorodas
Failo plėtinys yra .txtbet „Lighthouse“ analizuoja turinį kaip žymėjimą ir reikalauja žymėjimo nuorodos sintaksės, kad bet koks tekstas būtų skaičiuojamas kaip nuoroda. Failas pavadintas llms.txt. HTTP serveris grąžina jį su a text/plain MIME tipas. Atidarykite jį naršyklėje ir pamatysite paprastą tekstą. Tačiau llms.txt specifikacija llmstxt.org apibrėžia formatą kaip žymėjimo dokumentą. Specifikacija yra aiški: „Kiekvienoje skiltyje yra nuorodų sąrašas su žyma. Kiekviename sąrašo elemente yra nuoroda, po kurios yra pasirenkamos pastabos apie nuorodą, atskirtos nuo nuorodos dvitaškiu.” Švyturio analizatorius tai griežtai įgyvendina. Kiekviena nuoroda turi būti užkoduota kaip žymėjimo nuorodos sintaksė, (text)(url)su laužtiniais skliaustais aplink nuorodos tekstą ir skliausteliuose aplink URL.
Mano faile buvo naudojamas natūralesnis paprasto teksto formatas:
- Homepage: / - Publication masthead, cornerstone series, latest articles and episodes
- Articles: /blog - All articles on AXO, the agentic web, and AI agents
- Episode: /episode/(slug) - Full show notes, transcript, audio player
Tos pačios paskirties vietos. Tie patys aprašymai. Ta pati informacija. Švyturio analizatorius neregistruoja tų eilučių kaip nuorodų. Visame faile jis užregistruotas tiksliai nuliui. Auditas nepavyksta.
Failas su a .txt pratęsimas, patiekiamas su a text/plain MIME tipas, kurio auditas nepavyksta, nebent jis suformatuotas kaip žymėjimas. Tai neatitikimas, dėl kurio audito lygmuo turės būti sąžiningesnis. Pratęsimas sako vieną dalyką. MIME tipas sako vieną dalyką. Analizatorius yra tiesos šaltinis, o analizatorius reikalauja sumažinimo.
Pataisymas yra 5 simboliai vienoje nuorodoje
Apvyniokite kiekvieną nuorodos tikslą žymėjimo skliausteliuose-paren sintaksėje, (text)(url)ir pakeiskite - skyriklis prieš kiekvieną aprašymą su : . Penki simboliai vienoje nuorodoje. Mechaninis konvertavimas, kartojamas visame faile.
- (Homepage)(/): Publication masthead, cornerstone series, latest articles and episodes
- (Articles)(/blog): All articles on AXO, the agentic web, and AI agents
- (Episode)(/episode/(slug)): Full show notes, transcript, audio player
Padariau redagavimą. Pakartotinai atliko auditą. Rezultatas sumažėjo nuo 0,67 iki 1,0. Audito pavadinimas apverstas „llms.txt neatitinka rekomendacijų“ į „llms.txt atitinka rekomendacijas“. Vėlesnėje ataskaitoje nėra jokių detalių elementų. Švarus leidimas.
Failas vis dar teikiamas kaip text/plain. Failo plėtinys vis dar yra .txt. Failo turinys išlieka toks pat. Pakeistas tik nuorodos kodavimas.
Švyturys matuoja analizuojamų nuorodų sintaksę, o ne failo kokybę
Auditas patikrina, ar failą galima mechaniškai išanalizuoti. Ji netikrina, ar failas naudingai apibūdina jūsų svetainę. Abu skaitymai yra teisingi tuo pačiu metu.
Pirmasis skaitymas: auditas matuoja kažką tikro. Markdown nuorodos sintaksė yra mechaniškai analizuojama. Paprasto teksto aprašomosios eilutės nėra. Jei dirbtinio intelekto agentas (arba agentas „Lighthouse“ analizatorius) turi programiškai išgauti nuorodas iš failo, reikalingas žymėjimo formatas. Auditas yra teisingas, nes failo prieš pataisymą nepavyko išanalizuoti nuorodoms naudojant standartinius įrankius. Konvertavimas į žymėjimo nuorodos sintaksę pašalina tikrą sąveikos spragą.
Antrasis skaitymas: formato atitiktis nėra tas pats, kas failo kokybė. Apgalvotai parašytas, tikslus, išsamus llms.txt, kuriame naudojami paprasto teksto aprašai, šio patikrinimo nepavyksta. Plonas, automatiškai sugeneruotas llms.txt su žymėjimo nuorodos sintaksė perduodamas. Auditas negali pasakyti skirtumo tarp šių dviejų. „WordPress“ papildinys AIOSEO, kurį naudoja daugiau nei 3 milijonai svetainių pagal savo WordPress.org sąrašą, pagal numatytuosius nustatymus generuoja llms.txt failus su žymėjimo nuorodos sintaksė, kaip numatyta Glenn Gabe, ir paties papildinio dokumentacija patvirtina. Šie automatiškai sugeneruoti failai naudoja žymėjimo nuorodos sintaksę, nes tai generatorius skleidžia. Dauguma jų tikriausiai praeina šį auditą. Daugumai rankomis kurtų, savininko žinomų llms.txt failų tikriausiai nepavyks.
Verta pagalvoti apie šią spragą prieš vertinant, kad auditas buvo sėkmingas/nepavykęs, kaip įvertinimą, kaip iš tikrųjų jūsų svetainė yra paruošta agentams. Auditas tikrina, ar failą galima išanalizuoti. Tai netikrina, ar jūsų failas yra naudingas.
Ar jums turėtų rūpėti „Lighthouse Agentic Browsing“ Llms.txt patikra?
Taip, bet siaurai. Švyturys gali pasakyti, ar jūsų llms.txt galima išanalizuoti kaip žymėjimą. Jis negali pasakyti, ar failas sąžiningai apibūdina jūsų svetainę. Tas čekis yra tavo. Atidarykite „Chrome DevTools“, spustelėkite skirtuką Švyturys, patikrinkite, ar pažymėta „Agentic Browsing“ kategorija, ir paleiskite „Analyze“ savo URL. Auditas trunka mažiau nei minutę. Jei tai nepavyksta dėl nuorodų nebuvimo klaidos, tai yra penki simboliai vienai nuorodai ir penkios minutės redagavimo. Jei tai praeina, sunkesnis klausimas yra tas, kurio Švyturys negali užduoti. Ar failas buvo automatiškai sugeneruotas naudojant papildinį, kurio nesukonfigūravote, ar pats jį parašėte, ir ar jame aprašoma, kas iš tikrųjų yra jūsų svetainė?
Pirmoji mašinų architektūra Konstrukcijos ramstis slypi po visu tuo: duomenų modeliais prieš puslapių išdėstymą, pateikimo nepriklausomybę, turinį, kuris nepriklauso nuo kliento pusės „JavaScript“ arba žmogaus ekrano numatytųjų nustatymų, kad būtų galima nuskaityti mašininiu būdu. llms.txt auditas yra siauras šio sluoksnio patikrinimas. Didesnis struktūrinis klausimas, ar jūsų mašininiu būdu nuskaitomas paviršius tiksliai apibūdina jūsų svetainę, turite paleisti jūs.
Daugiau išteklių:
Šis įrašas iš pradžių buvo paskelbtas No Hacks.
Teminis vaizdas: Darko 1981/Shutterstock


