
Aštrių akių paieškos rinkodaros specialistas nustatė priežastį, kodėl „Google“ AI apžvalgos rodė šlamšto tinklalapius. Naujausioje memorandumo nuomonėje „Google“ antimonopolinėje byloje buvo ištrauka, kurioje pateikiama mintis, kodėl taip atsitiko, ir spėliojama, kaip ji atspindi „Google“ perėjimą nuo nuorodų kaip ryškų reitingo veiksnį.
Ryanas Jonesas, „Serprecon“ („LinkedIn“ profilio) įkūrėjas, atkreipė dėmesį į naujausios memorandumo nuomonės ištrauką, kurioje parodyta, kaip „Google“ remiasi savo „Dvynių“ modeliais.
Generacinių AI atsakymų įžeminimas
Ištrauka yra skyriuje apie atsakymų pagrindimą su paieškos duomenimis. Paprastai teisinga manyti, kad nuorodos vaidina svarbų vaidmenį reitinguojant tinklalapius, kuriuos AI modelis gauna iš paieškos užklausos į vidinę paieškos variklį. Taigi, kai kas nors užduoda „Google“ AI apžvalgą, sistema užklauso „Google“ paiešką ir sukuria šių paieškos rezultatų santrauką.
Bet, matyt, ne taip veikia „Google“. „Google“ turi atskirą algoritmą, kuris gauna mažiau žiniatinklio dokumentų ir tai daro greičiau.
Ištrauka rašoma:
„Norėdami pagrįsti savo„ Dvynių “modelius,„ Google “naudoja patentuotą technologiją, vadinamą„ FastSearch “. Mažesnis nei visiškai reitingo žiniatinklio rezultatai. “
Ryanas Jonesas pasidalino šiomis įžvalgomis:
„Tai yra įdomu ir patvirtina tai, ką daugelis iš mūsų galvojo, ir tai, ką mes matėme ankstyvaisiais bandymais. Ką tai reiškia? Tai reiškia, kad„ Google “įžeminimas nenaudoja to paties paieškos algoritmo. Jiems reikia, kad jis būtų greitesnis, tačiau jiems taip pat nerūpi tiek daug signalų. Jiems tiesiog reikia teksto, kuriame būtų atsarginė dalis, ką jie sako.
… Tikriausiai taip pat yra daugybė šlamšto ir kokybės signalų, kurie taip pat nėra apskaičiuojami „FastSearch“. Tai paaiškintų, kaip/kodėl ankstyvosiose versijose pamatėme kai kurias „Spammy“ svetaines ir netgi nubaustas svetaines, rodomas AI apžvalgose. “
Toliau jis dalijasi savo nuomone, kad nuorodos čia nevaidina tam tikro vaidmens, nes įžeminimas naudoja semantinį aktualumą.
Kas yra „FastSearch“?
Kitur memorandume dalijamasi, kad „FastSearch“ generuoja ribotus paieškos rezultatus:
„„ FastSearch “yra technologija, kuri greitai sukuria ribotus ekologiškų paieškos rezultatus tam tikrais naudojimo atvejais, tokiais kaip LLMS įžeminimas, ir daugiausia gaunama iš retaupto modelio.“
Dabar kyla klausimas, koks yra rango modelis?
Memorandume paaiškinta, kad „RankeMbed“ yra giluminio mokymosi modelis. Paprastai tariant, giluminio mokymosi modelis nustato modelius masiniuose duomenų rinkiniuose ir, pavyzdžiui, gali nustatyti semantines reikšmes ir ryšius. Tai nieko nesupranta taip, kaip tai daro žmogus; Tai iš esmės nustato modelius ir koreliacijas.
Memorandume yra ištrauka, paaiškinanti:
„Kitame spektro gale yra novatoriški giluminio mokymosi modeliai, kurie yra mašinų mokymosi modeliai, kurie pastebi sudėtingus modelius dideliuose duomenų rinkiniuose.… (Allan).
… „Google“ sukūrė įvairius „aukščiausio lygio“ signalus, kurie įveda į galutinį tinklalapio balą. Id. 2793: 5–2794: 9 (Allan) (aptariamas RDXD-20.018). Tarp „Google“ aukščiausio lygio signalų yra tie, kurie mato tinklalapio kokybę ir populiarumą. Id.; RDX0041 esant -001.
Signalai, sukurti naudojant giluminio mokymosi modelius, tokius kaip „RankeMbed“, taip pat yra vieni iš „Google“ aukščiausio lygio signalų. “
Vartotojo pusės duomenys
„RankeMbed“ naudoja „vartotojo pusės“ duomenis. Memorandume skyriuje apie tai, kokius duomenis, kuriuos „Google“ turėtų pateikti konkurentams, apibūdina „RankeMbed“ (kuris „FastSearch“ remiasi) tokiu būdu:
„Vartotojo pusės duomenys, naudojami mokyti, kurti ar valdyti retaupto modelį (-us);
Kitur jis dalijasi:
„Vėlesnėje ir vėlesnėje jo kartojime„ Rankembedbert “reitinguojami modeliai, kurie remiasi dviem pagrindiniais duomenų šaltiniais: _____% 70 dienų paieškos žurnalų ir balų, kuriuos sukuria žmonių vertintojai, ir naudojami„ Google “, kad įvertintų ekologiškos paieškos rezultatų kokybę“.
Tada:
„Pats rango modelis yra AI pagrįsta giluminio mokymosi sistema, turinti stiprią supratimą apie gamtos kalbą. Tai leidžia modeliui efektyviau nustatyti geriausius dokumentus, net jei užklausa trūksta tam tikrų terminų. PXR0171 ties -086 („ Įterpimo pagrindu pagrįstas gavimas yra veiksmingas semantiniame dokumentų ir užklausų derinime “);
… „RankeMbed“ yra mokomas 1/100 duomenų, naudojamų ankstesnių reitingų modeliams treniruotis, tačiau pateikiami aukštesnės kokybės paieškos rezultatai.
… RANEMPED ypač padėjo „Google“ patobulinti atsakymus į ilgalaikių klausimų užklausas.
… Tarp pagrindinių mokymo duomenų yra informacija apie užklausą, įskaitant svarbiausius terminus, kuriuos „Google“ išvedė iš užklausos, ir gaunami tinklalapiai.
… Duomenys, kuriais grindžiami rango modeliai, yra paspaudimo ir užklausos duomenų derinys ir žmonių vertintojų tinklalapių balai.
… Rankembedbertas turi būti perkvalifikuotas, kad atspindėtų naujus duomenis … “
Nauja AI paieškos perspektyva
Ar tiesa, kad nuorodos vaidina svarbų vaidmenį renkantis AI apžvalgų tinklalapius? „Google“ „FastSearch“ teikia pirmenybę greičiui. Ryanas Jonesas teorizuoja, kad tai gali reikšti, kad „Google“ naudoja kelis indeksus, o vieną – „FastSearch“, sudarytą iš svetainių, kurios paprastai lankosi. Tai gali atspindėti „FastSearch“ reitinguotos dalies, kuri, kaip teigiama, yra „paspaudimo ir užklausos duomenų“ ir „Human Rater“ duomenų derinys.
Kalbant apie žmogaus vertintojų duomenis, turint milijardus ar trilijonus indekso puslapių, vertintojams neįmanoma rankiniu būdu įvertinti daugiau nei mažą dalį. Taigi darytina išvada, kad žmogaus vertintojų duomenys naudojami norint pateikti kokybės pažymėtus mokymo pavyzdžius. Pažymėti duomenys yra pavyzdžiai, kad modelis yra mokomas, kad modeliai, būdingi aukštos kokybės ar žemos kokybės puslapio identifikavimui, gali būti akivaizdesni.
Taip pat žiūrėkite: „Google“ dalijasi vertingu SEO pasirodymu apie kokybės vertintojų gaires
Teminis „Shutterstock“/„Cookie Studio“ vaizdas

