
„Google“ Johnas Muelleris atsakė į klausimą apie llms.txt, susijusį su kopijų turiniu, teigdamas, kad nėra prasmės, kad į jį bus žiūrima kaip į kopijų turinį, tačiau jis taip pat pareiškė, kad gali būti prasminga imtis priemonių, kad būtų išvengta indeksavimo.
Llms.txt
LLMS.TXT yra pasiūlymas sukurti naują turinio formato standartą, kurį didelių kalbų modeliai gali naudoti norėdamas gauti pagrindinį tinklalapio turinį, nereikia spręsti kitų duomenų, tokių kaip reklama, navigacija ir visa kita, kas nėra pagrindinis turinys. Tai siūlo žiniatinklio leidėjams galimybę pateikti kuruojamą, žymos formatą svarbiausio turinio versiją. LLMS.TXT failas yra svetainės šaknies lygyje (pavyzdys.com/llms.txt).
Priešingai nei kai kurie teiginiai, pateikti apie llms.txt, robotams.txt jokiu būdu nėra panašus. „Robots.txt“ tikslas yra kontroliuoti robotų elgesį, o LLMS.TXT tikslas yra pateikti turinį dideliems kalbų modeliams.
Ar „Google“ peržiūrės llms.txt kaip dublikatų turinį?
Kažkas iš „Bluesky“ paklausė, ar „Google“ gali pamatyti LLMS.TXT kaip dublikatų turinį, o tai yra geras klausimas. Gali atsitikti taip, kad kažkas, esantis ne svetainėje, gali susieti su llms.txt ir kad „Google“ gali pradėti išjungti tą turinį, o ne su HTML turiniu ar be jo.
Tai yra klausimas:
„Ar„ Google “peržiūrės llms.txt failus kaip kopijų turinį? Atrodo, kad tai padaryti yra griežta, atsižvelgiant į tai, kad jie žino, kad taip nėra ir kam jis skirtas.
Ar turėčiau pridėti „noindex“ antraštę, skirtą llms.txt, skirta „GoogleBot“? “
„Google“ Johnas Muelleris atsakė:
„Turinys būtų tik tuo atveju, jei turinys būtų toks pat kaip HTML puslapis, kuris neturėtų prasmės (darant prielaidą, kad pats failas būtų naudingas).
Beje, naudojant „Noindex“, jis gali būti prasmingas, nes svetainės gali susieti su ja ir kitaip gali būti indeksuojama, o tai vartotojams būtų keista “.
„Noindex“ llms.txt
LLMS.TXT naudojimas „Noindex“ antraštei yra gera idėja, nes ji neleis turiniui įvesti „Google“ rodyklės. Naudojant robotus.txt užblokuoti „Google“ blokuoti, nėra būtina, nes tai tik užkirs kelią „Google“ nuo failo nuskaitymo, kuris neleis pamatyti „Noindex“.
Pateiktas „Shutterstock“/„Krakenimages.com“ vaizdas




