
Atrodė, kad „Google“ AI tyrimų organizacijos „DeepMind“ generalinis direktorius Demisas Hasabis antradienio vakarą siūlo, kad „Veo 3“, naujausias „Google“ vaizdo įrašų generavimo modelis, gali būti naudojamas vaizdo žaidimams.
Atsakydamas į „X“ pranešimą apie „Google“, kad „leisk man žaisti jau mano„ Veo 3 “vaizdo įrašų vaizdo žaidimą“, ir klausia: „Žaisti pasaulio modeliai wen?“ Hasabis atsakė: „Dabar tai nebūtų kažkas“.
Trečiadienio rytą Loganas Kilpatrickas, pagrindinis „Google“ AI studijos ir „Gemini“ API produktas, pateiktas atsakymo: „🤐🤐🤐🤐“
Abu „Google“ vadovų įrašai yra ne tik žaismingi pasiūlymai, o „Google“ atstovas teigė „TechCrunch“, kad šiuo metu įmonė neturėjo kuo pasidalinti. Tačiau žaidžiamų pasaulio modelių statyba nėra ribojama galimybių technologijų milžinui.
Pasaulio modeliai skiriasi nuo vaizdo įrašų generavimo modelių. Pirmasis imituoja realaus pasaulio aplinkos dinamiką, kuri leidžia agentams numatyti, kaip pasaulis vystysis reaguojant į jų veiksmus. Video gen modeliai sintezuoja realias vaizdo įrašų sekas.
„Google“ planuoja savo multimodalinį pagrindą paversti „Gemini 2.5 Pro“ pasauliniu modeliu, kuris imituoja žmogaus smegenų aspektus. Gruodį „DeepMind“ pristatė „Genie 2“ – modelį, kuris gali sukurti „begalinę“ žaidžiamų pasaulių įvairovę. Kitą mėnesį mes pranešėme, kad „Google“ sudarė naują komandą dirbti su AI modeliais, kurie gali imituoti realų pasaulį.
Kiti dirba kurdami pasaulio modelius-ypač AI „Pioneer Fei-Fei LI“. Li praėjusiais metais išėjo iš „Stealth“ su „World Labs“-startuoliu, kuris sukūrė savo AI sistemą, kuri sukuria vaizdo žaidimus panašias 3D scenas iš vieno įvaizdžio.
„Veo 3“, kuris vis dar yra viešoje peržiūra, gali sukurti vaizdo įrašus ir garso įrašus, kad galėtumėte eiti kartu su klipais – nuo kalbos iki garso takelių. Nors VEO 3 sukuria realius judesius imituodamas realaus pasaulio fiziką, tai dar nėra visai pasaulio modelis. Vietoj to, jis galėtų būti naudojamas kino pasakojimui žaidimuose, tokiuose kaip scenos, priekabos ir pasakojimo prototipų kūrimas
Modelis taip pat vis dar yra „pasyvaus išvesties“ generatyvinis modelis, ir IT (arba būsimas VEO kartas) turėtų pereiti prie aktyvesnio, interaktyvaus ir nuspėjamo treniruoklio.
Tačiau tikrasis vaizdo žaidimų gamybos iššūkis nėra tik įspūdingi vaizdai; Tai realaus laiko, nuoseklus ir kontroliuojamas modeliavimas. Štai kodėl gali būti prasminga matyti, kaip „Google“ laikosi hibridinio požiūrio, kuris ateityje pasitelkia VEO ir Genie, jei ji vykdytų vaizdo žaidimą ar žaidžiamą pasaulio plėtrą.
„Google“ galėjo konkuruoti su „Microsoft“, scenarijumi, kilimo ir tūpimo taku, „Pika“ ir galiausiai „Openai“ vaizdo įrašais sukuriančiu modeliu Sora.
Atsižvelgiant į suplanuotus „Google“ judesius pasaulio modelių erdvėje ir jos reputaciją, kai naudojama gilios kišenės ir paskirstymo raumenys „SteamRoll“ konkurentams, šioje erdvėje konkurentai būtų protingi, kad atidžiai stebėtumėte.