
„Google“ Gary Illyesas atsakė į klausimus per neseniai vykusį „Search Central Live Deep Dive Azijoje“ apie tai, ar jie naudoja naują kelių vektorių gavimą, naudodamiesi fiksuotų dimensijų kodavimo metodais (MUVERA) gavimo metodu, taip pat, ar jie naudoja „Graph Foundation“ modelius.
Judėti
„Google“ neseniai paskelbė „Muvera“ tinklaraščio įraše ir tyrimo dokumente: metodas, kuris pagerina gavimą paverčiant sudėtingą kelių vektorių paiešką greito vieno vektoriaus paieška. Jis suspaudžia žetonų įterptuvių rinkinius į fiksuotų dimensijų vektorius, kurie tiksliai apytiksliai atitinka jų pradinį panašumą. Tai leidžia naudoti optimizuotus vieno vektoriaus paieškos metodus, kad greitai surastų gerus kandidatus, tada iš naujo juos paleiskite, naudodamas tikslų kelių vektorių panašumą. Palyginti su senesnėmis sistemomis, tokiomis kaip „Plaid“, „Muvera“ yra greitesnė, gauna mažiau kandidatų ir vis dar pagerina atšaukimą, todėl tai yra praktiškas sprendimas didelio masto gavimo.
Svarbiausi MUVERA punktai yra šie:
- „Muvera“ kelis vektorių rinkinius paverčia fiksuotais vektoriais, naudojant fiksuotus matmenų kodavimus (FDES), kurie yra kelių vektorių vaizdai daugialypių vektorių rinkinių.
- Šie FDES (fiksuotų matmenų kodavimai) atitinka originalius daugiaktoriaus palyginimus pakankamai artimai, kad palaikytų tikslų gavimo.
- „MUVERA REATrival“ naudoja MIPS (maksimali vidinio produkto paieška) – nusistovėjusią paieškos techniką, naudojamą paieškoje, todėl jį lengviau diegti mastu.
- Rezultatas: Naudojant greitą vieno vektoriaus paiešką (MIPS), kad greitai susiaurintumėte greičiausias atitikmenis, „Muvera“ iš naujo juos renka naudodama „Chamfer“ panašumą, išsamesnį kelių vektorių palyginimo metodą. Šis paskutinis žingsnis atkuria visą kelių vektorių gavimo tikslumą, todėl jūs gaunate ir greitį, ir tikslumą.
- „Muvera“ sugeba rasti daugiau tiksliai svarbių dokumentų, kurių apdorojimo laikas yra mažesnis nei moderniausio gavimo bazinė linija (pledas), su kuriuo buvo lyginama.
„Google“ patvirtina, kad jie naudoja MUVERA
José Manuel Morgal („LinkedIn“ profilis) savo klausimą susiejo su „Google“ Gary Illyes ir jo reakcija buvo juokaudami paklausti, kas yra Muvera, ir tada jis patvirtino, kad jie naudoja jos versiją:
Taip klausimas ir atsakymą apibūdino José:
„„ Google Research “apie„ Muvera “paskelbtas straipsnis ir yra susijęs dokumentas. Ar jis šiuo metu gaminamas ieškant?
Jo atsakymas buvo paklausti manęs, kas buvo Haha, ir tada jis pakomentavo, kad jie naudoja kažką panašaus į Muverą, tačiau jie to nevaržo. “
Ar „Google“ naudoja „Graph Foundation“ modelius (GFMS)?
Neseniai „Google“ paskelbė tinklaraščio pranešimą apie AI proveržį, vadinamą „Graph Foundation“ modeliu.
„Google“ grafiko fondo modelis (GFM) yra AI tipas, kuris mokosi iš reliacinių duomenų bazių, paversdamas jas grafikais, kur eilutės tampa mazgais, o jungtys tarp lentelių tampa kraštais.
Skirtingai nuo senesnių modelių (mašinų mokymosi modelių ir grafikų nervų tinklų (GNN)), kurie veikia tik viename duomenų rinkinyje, GFM gali tvarkyti naujas duomenų bazes su skirtingomis struktūromis ir funkcijomis, nesikreipdami į naujus duomenis. GFM naudoja didelį AI modelį, kad sužinotumėte, kaip duomenų taškai yra susiję su lentelėmis. Tai leidžia GFM rasti modelių, kurių praleidžia reguliarūs modeliai, ir jie atlieka daug geriau atlikdami užduotis, pavyzdžiui, aptikti šlamštą „Google“ mastelio sistemose. GFMS yra didelis žingsnis į priekį, nes jie suteikia pagrindinio modelio lankstumo sudėtingiems struktūrizuotiems duomenims.
Graph Foundation modeliai yra pastebimas pasiekimas, nes jų patobulinimai nėra laipsniški. Tai yra didelės tvarkos pagerėjimas, o vidutiniškai tiksliai padidėja nuo 3x iki 40x.
Toliau José paklausė „Illyes“, ar „Google“ naudoja „Graph Foundation“ modelius ir Gary vėl juokaudamas, nežinojo, apie ką kalba José.
Jis susiejo klausimą ir atsakymą:
„„ Google Research “apie„ Graph Foundation “modelius duomenims paskelbtas straipsnis. Šį kartą nėra su ja susijusio popieriaus. Ar jis šiuo metu gaminamas ieškant?
Jo atsakymas buvo toks pat kaip ir anksčiau, paklausdamas, kokie yra „Graph Foundation“ modeliai, ir jis manė, kad jis nebuvo gaminamas. Jis nežinojo, nes nėra susijusio popieriaus, ir, kita vertus, jis pakomentavo mane, kad nekontroliuoja to, kas paskelbta „Google Research“ tinklaraštyje. “
Gary išreiškė savo nuomonę, kad „Graph Foundation“ modelis šiuo metu nebuvo naudojamas paieškoje. Šiuo metu tai yra geriausia mūsų turima informacija.
Taip pat žiūrėkite: Naujasis „Google“ grafiko fondo modelis pagerina tikslumą iki 40x
Ar GFM yra paruoštas diegimui iš mastelio?
Oficialiojo grafiko fondo modelio pranešime teigiama, kad jis buvo išbandytas atliekant vidinę užduotį, šlamšto aptikimą ADS, o tai tvirtai rodo, kad buvo naudojamos tikrosios vidinės sistemos ir duomenys, o ne tik akademiniai etalonai ar modeliavimas.
Štai ką „Google“ pranešimas susijęs:
„Veikimas„ Google “skalėje reiškia milijardų mazgų ir kraštų grafikų apdorojimą, kai mūsų„ Jax “aplinka ir keičiamas TPU infrastruktūra ypač šviečia. Tokie duomenų kiekiai yra pritaikyti mokymo bendroms modeliams, todėl mes nustatėme savo GFM į keletą vidinių klasifikavimo užduočių, tokių kaip šlamšto aptikimas, kuriame nėra. iš skirtingų lentelių, todėl praleiskite kontekstą, kuris gali būti naudingas tikslioms prognozėms.
Takeaways
„Google“ atstovas Gary Illyesas patvirtino, kad „Google“ naudojama „Muvera“ forma. Atrodė, kad jo atsakymas apie GFM buvo išreikštas nuomone, todėl jis yra šiek tiek ne toks aiškus, nes tai susiję, kaip Gary sako, kad, jo manymu, jis nėra gaminamas.
Pateiktas „Shutterstock“/„Krakenimages.com“ vaizdas




