
„Google“ vyriausiasis mokslininkas Jeffas Deanas teigė, kad dėl mažos „Flash“ delsos ir kainos „Google“ gali vykdyti paieškos AI dideliu mastu. Jis pridūrė, kad gavimas yra dizaino pasirinkimas, o ne apribojimas.
Interviu „Latent Space“ tinklalaidėje Deanas paaiškino, kodėl „Flash“ tapo paieškos gamybos lygiu. Jis taip pat išdėstė, kodėl dujotiekis, siaurinantis žiniatinklį iki kelių dokumentų, greičiausiai išliks.
Gruodžio mėnesį „Google“ pradėjo diegti „Gemini 3 Flash“ kaip numatytąjį AI režimą. Deano interviu paaiškinama šio sprendimo priežastis.
Kodėl „Flash“ yra gamybos pakopa
Deanas delsą pavadino kritiniu apribojimu paleisti AI paieškoje. Modeliams atliekant ilgesnes ir sudėtingesnes užduotis, greitis tampa kliūtimi.
„Atrodo labai svarbu turėti mažo delsos laiko sistemas, kurios gali tai padaryti, o blykstė yra viena kryptis, vienas iš būdų tai padaryti.
Podcast'ų rengėjai atkreipė dėmesį į „Flash“ dominavimą tokiose paslaugose kaip „Gmail“ ir „YouTube“. Deanas teigė, kad paieška yra šios plėtros dalis, nes „Flash“ naudojimas auga AI režime ir AI apžvalgose.
Blykstė gali būti naudojama tokiu mastu dėl distiliavimo. Kiekvienos kartos „Flash“ paveldi ankstesnės kartos „Pro“ lygio našumą, todėl ji tampa vis efektyvesnė ir nepabrangsta.
„Jau kelioms Dvynių kartoms pavyko sukurti naujos kartos „flash“ versiją, tokią pat gerą ar net žymiai geresnę nei ankstesnės kartos profesionalas.
Tai yra mechanizmas, kuris daro architektūrą tvarią. „Google“ pateikia pažangius modelius, skirtus galimybių plėtrai, tada distiliuoja šias galimybes į „Flash“, kad būtų galima įdiegti gamyboje. „Flash“ yra „Google“ lygis, sukurtas veikti paieškos mastu.
Išieškojimas per įsiminimą
Be Flash vaidmens paieškoje, Deanas aprašė dizaino filosofiją, pagal kurią išorinis turinys yra svarbiausias šių modelių veikimas. Modeliai neturėtų eikvoti pajėgumų saugodami faktus, kuriuos jie gali gauti.
„Tai, kad modelis skiria brangią parametrų erdvę, kad prisimintų neaiškius faktus, kuriuos būtų galima ieškoti, iš tikrųjų nėra geriausias tos parametrų erdvės panaudojimas.
Paieškos iš išorinių šaltinių yra pagrindinė galimybė, o ne išeitis. Modelis viską apžiūri ir apdoroja rezultatus, o ne viską nešioja viduje.
Kodėl tikėtina, kad etapinis paieška išlieka
AI paieška negali skaityti viso žiniatinklio vienu metu. Dabartiniai dėmesio mechanizmai yra kvadratiniai, o tai reiškia, kad skaičiavimo sąnaudos sparčiai auga, didėjant konteksto ilgiui. Deanas sakė: „Milijonas žetonų tarsi pastūmėja tai, ką tu gali padaryti“. Naudojant esamus metodus, neįmanoma padidinti iki milijardo ar trilijono.
Ilgalaikė Deano vizija yra modeliai, kurie sukuria „iliuziją“ apie trilijonus žetonų. Norint tai pasiekti, reikia naujų metodų, o ne tik tai, kas egzistuoja šiandien. Iki tol AI paieška greičiausiai ir toliau susiaurins platų kandidatų sąrašą iki kelių dokumentų, prieš pateikdama atsakymą.
Kodėl tai svarbu
Modelis, skaitantis jūsų turinį AI režimu, kaskart tobulėja. Tačiau jis yra optimizuotas greičiui, o ne samprotavimų gyliui, ir sukurtas tam, kad gautų turinį, o ne įsimintų. Būti randamam naudojant esamus „Google“ paieškos ir reitingavimo signalus yra kelias į AI paieškos rezultatus.
Stebėjome kiekvieną modelio keitimą AI režimu ir AI apžvalgomis nuo tada, kai „Google“ pradėjo dirbtinio intelekto režimą su Gemini 2.0. Išleidimo dieną „Google“ pristatė „Gemini 3“ į AI režimą, o po mėnesio pradėjo diegti „Gemini 3 Flash“ kaip numatytąją. Visai neseniai Gemini 3 tapo numatytuoju AI apžvalgų visame pasaulyje.
Kiekviena modelio karta seka tą patį ciklą. Pasienio pajėgumai, tada distiliavimas į „Flash“ gamybai. Deanas pristatė tai kaip architektūrą, kurią „Google“ tikisi išlaikyti paieškos mastu, o ne kaip laikiną atsarginį variantą.
Žvilgsnis į priekį
Remiantis Deano pastabomis, etapinis paieška greičiausiai išliks tol, kol dėmesio mechanizmai peržengs kvadratines ribas. „Google“ investicijos į „Flash“ rodo, kad bendrovė tikisi naudoti šią architektūrą keliose modelių kartose.
Vienas iš laikrodžio pakeitimų yra automatinis modelio pasirinkimas. „Google“ Robby Stein aprašė anksčiau minimą koncepciją, kuri apima sudėtingų užklausų nukreipimą į „Pro“, išlaikant „Flash“ kaip numatytąją.
Teminis vaizdas: Robert Way / Shutterstock


