
„Microsoft“ pasidalijo naujomis gairėmis dėl pasikartojančio turinio, skirto AI pagrįstai paieškai.
„Bing“ žiniatinklio valdytojo tinklaraščio įraše aptariamas, kuris URL naudojamas kaip AI atsakymų „šaltinio puslapis“, kai yra keli panašūs URL.
„Microsoft“ aprašo, kaip „beveik pasikartojantys“ puslapiai gali būti sugrupuoti dirbtinio intelekto sistemoms ir kaip šis grupavimas gali paveikti, kuris URL bus įtrauktas į AI santraukas.
Kaip AI sistemos tvarko dublikatus
Fabrice'as Canelis ir Krishna Madhavan, pagrindiniai „Microsoft AI“ produktų vadovai, rašė:
„LLM sugrupuoja beveik pasikartojančius URL adresus į vieną grupę ir pasirenka vieną puslapį, kuris reprezentuoja rinkinį. Jei skirtumai tarp puslapių yra minimalūs, modelis gali pasirinkti pasenusią versiją arba ne tą, kurią norėjote pabrėžti.”
Jei kelis puslapius galima pakeisti, reprezentacinis puslapis gali būti senesnis kampanijos URL, parametro versija arba regioninis puslapis, kurio neketinote reklamuoti.
„Microsoft“ taip pat pažymi, kad daugelis LLM patirties yra pagrįstos paieškos indeksais. Jei indeksas yra užterštas dublikatais, tas pats dviprasmiškumas gali pasirodyti AI atsakymuose.
Kaip dublikatai gali sumažinti AI matomumą
„Microsoft“ pateikia keletą būdų, kaip dubliavimas gali trukdyti.
Vienas iš jų yra ketinimų aiškumas. Jei keli puslapiai apima tą pačią temą su beveik identiškais egzemplioriais, pavadinimais ir metaduomenimis, sunkiau nustatyti, kuris URL geriausiai atitinka užklausą. Net kai indeksuojamas „teisingas“ puslapis, signalai padalijami panašiai.
Kitas yra atstovavimas. Jei puslapiai yra sugrupuoti, jūs efektyviai konkuruojate su savimi dėl to, kuri versija tinka grupei.
„Microsoft“ taip pat nubrėžia ribą tarp tikrojo puslapio diferenciacijos ir kosmetinių variantų. Puslapių rinkinys gali būti prasmingas, kai kiekvienas iš jų patenkina tam tikrą poreikį. Tačiau kai puslapiai skiriasi tik nedideliais pakeitimais, juose gali nepakakti unikalių signalų, kad dirbtinio intelekto sistemos galėtų juos traktuoti kaip atskirus kandidatus.
Galiausiai „Microsoft“ susieja dubliavimą su atnaujinimo delsa. Jei tikrinimo programos praleidžia laiko pakartotinai apsilankydami pertekliniuose URL, jums iš tikrųjų rūpimo puslapio pakeitimai gali užtrukti ilgiau, kol jie bus rodomi sistemose, kurios remiasi naujais indekso signalais.
Susiję: „Google“ gali matyti tinklalapius kaip dublikatus, jei URL adresai yra per panašūs
Pasikartojančio turinio kategorijos „Microsoft“ akcentai
Rekomendacijose nurodomi keli pakartotiniai pažeidėjai.
Sindikacija yra viena. Kai tas pats straipsnis rodomas visose svetainėse, dėl identiškų kopijų gali būti sunkiau identifikuoti originalą. „Microsoft“ rekomenduoja paprašyti partnerių naudoti kanonines žymas, nukreipiančias į pradinį URL, ir, jei įmanoma, naudoti ištraukas, o ne visą pakartotinį spausdinimą.
Kampanijos puslapiai yra kas kita. Jei kuriate kelias versijas, kurių tikslas yra tas pats ir kurios skiriasi tik nežymiai, „Microsoft“ rekomenduoja pasirinkti pagrindinį puslapį, kuriame renkamos nuorodos ir įtraukimas, tada naudoti kanonines variantų žymas ir sujungti senesnius puslapius, kurie nebetarnauja tam tikro tikslo.
Lokalizacija atsiranda taip pat. Beveik identiški regioniniai puslapiai gali atrodyti kaip pasikartojantys, nebent juose yra reikšmingų skirtumų. „Microsoft“ siūlo lokalizuoti naudojant iš tikrųjų svarbius pakeitimus, tokius kaip terminija, pavyzdžiai, taisyklės ar produkto informacija.
Tada atsiranda techninių dublikatų. Rekomendacijose pateikiamos dažniausios priežastys, pvz., URL parametrai, HTTP ir HTTPS versijos, didžiųjų ir mažųjų raidžių URL, pasvirieji brūkšniai, spausdintuvui pritaikytos versijos ir viešai pasiekiami sustojimo puslapiai.
Taip pat žr: Microsoft paaiškina, kaip optimizuoti turinį dirbtinio intelekto paieškos matomumui
„IndexNow“ vaidmuo
„Microsoft“ nurodo „IndexNow“ kaip būdą sutrumpinti valymo ciklą sujungus URL.
Kai sujungiate puslapius, keičiate kanoninius elementus arba pašalinate pasikartojančius duomenis, „IndexNow“ gali padėti dalyvaujančioms paieškos sistemoms greičiau atrasti tuos pakeitimus. „Microsoft“ susieja šį greitesnį aptikimą su mažiau pasenusių URL rezultatuose ir rečiau atvejų, kai senesnis dublikatas tampa puslapiu, kuris naudojamas AI atsakymuose.
„Microsoft“ pagrindinis principas
Canel ir Madhavan rašė:
„Kai sumažinate persidengiančių puslapių skaičių ir leidžiate vienai autoritetingai versijai perduoti jūsų signalus, paieškos varikliai gali patikimiau suprasti jūsų ketinimus ir pasirinkti tinkamą URL, kuris atspindėtų jūsų turinį.
Pranešimas pirmiausia yra konsolidavimas, antra – techniniai signalai. „Canonicals“, peradresavimai, „hreflang“ ir „IndexNow“ padeda, tačiau jie geriausiai veikia, kai neturite daug beveik identiškų puslapių.
Kodėl tai svarbu
Pasikartojantis turinys savaime nėra bausmė. Neigiama pusė yra silpnesnis matomumas, kai signalai praskiedžiami, o tikslas neaiškus.
Sindikuoti straipsniai gali ir toliau viršyti originalą, jei trūksta kanoninių straipsnių arba jie nenuoseklūs. Kampanijos variantai gali kanibalizuoti vienas kitą, jei „skirtumai“ dažniausiai yra kosmetiniai. Regioniniai puslapiai gali būti sujungti, jei jie aiškiai neatitinka skirtingų poreikių.
Įprasti auditai gali padėti anksti pastebėti sutapimą. „Microsoft“ nurodo „Bing Webmaster Tools“ kaip būdą nustatyti modelius, tokius kaip identiški pavadinimai ir kiti dubliavimo rodikliai.
Žvilgsnis į priekį
Kadangi AI atsakymai tampa vis dažnesniu įėjimo tašku, „kuris URL atstovauja šiai temai“ problemą tampa sunkiau ignoruoti.
Beveik pasikartojančių kopijų išvalymas gali turėti įtakos, kuri jūsų turinio versija bus paskelbta, kai AI sistemai reikia vieno puslapio atsakymui pagrįsti.



