
AI bumas buvo sukurtas remiantis pagrindine prielaida: didesni modeliai yra galingesni, o galingiausi laimi. Dabar pramonė sužinos, kas atsitiks, jei ši prielaida pradės žlugti.
Montavimo išlaidos jau privertė vartotojus peržiūrėti mažesnius ir pigesnius modelius. Šis ekonomiškas modelių pirkimas yra naujas ir neaišku, kaip tai paveiks pramonę, tačiau tikėtina, kad poveikis bus didelis.
Viena prognozė, kurią geriausiai išdėstė Coinbase įkūrėjas Brianas Armstrongas, yra ta, kad didžioji dalis užduočių bus perkeltos į pigesnius modelius.
„Intelekto poreikis yra beveik begalinis, bet 80 % darbo krūvių bus vykdoma naudojant 99 % pigesnius modelius per 12–18 mėnesių“, – rašė Armstrongas X. „20 % darbo krūvių vis tiek veiks naujausiuose modeliuose, kur IQ didinimas yra svarbus.
Sunku pervertinti, koks reikšmingas pokytis bus AI pramonei, jei Armstrongo prognozė išsipildys.
Iki šiol dauguma dirbtinio intelekto kompanijų konkuruodavo dėl kokybės, o tai reikšdavo, kad buvo atsisakyta pažangiausio turimo modelio. Jei tuos pačius darbus būtų galima atlikti naudojant pigesnius modelius nepakenkiant kokybei, tai reikštų didžiulį dirbtinio intelekto ekonomikos pokytį. Ir kritiškai kalbant, didžioji dalis santaupų būtų gaunama iš didžiųjų laboratorijų kišenės, o tai suduotų finansinį smūgį OpenAI ir Anthropic, kai jie ruošiasi savo IPO.
Tai potencialiai seisminis pokytis pramonėje, pagrįstas vienu pagrindiniu klausimu: ar įmonės yra pasirengusios pereiti prie mažesnių modelių?
Pirmieji bandymai rodo, kad tinkamai sutvarkius sistemą, pigesni modeliai gali būti parduodami neprarandant kokybės. Neseniai atlikus legalaus AI įrankio „Harvey“ testą, bendrovė sugebėjo 3 kartus sumažinti išvadų sąnaudas, nepablogindama kokybės. Bandymas, atliktas bendradarbiaujant su išvadų platforma Fireworks AI, apjungė Claude Opus ir Fireworks GLM 5.1, o intensyviausioms užduotims buvo perkelta į Opus. Rezultatas buvo žymiai mažesnis serverio laiko ir bendrų išlaidų apkrovimas.
„Kokybė yra pirmoje vietoje, o teisinėje tai visada bus“, – „TechCrunch“ sakė „Harvey“ įkūrėjas Gabe'as Pereyra, kalbėdamas apie AI teisines paslaugas, kurias teikia jo startuolis. „Tačiau kokybės apibrėžimas keičiasi nuo paprasčiausio efektyviausio modelio naudojimo viskam iki geriausio modelio, kuris efektyviausiai gauna teisingą atsakymą.
Ši tendencija dažnai apibūdinama kaip pagrindinės laboratorijos, palyginti su Kinijos modeliais ar atviro svorio modeliais, tačiau tai praleidžia svarbesnį dalyką. Tikroji takoskyra nėra tarp patentuotų ir atvirų modelių; tai tarp didelių ir mažų modelių. Galite sutaupyti pinigų perėję iš GPT-5.5 į DeepSeek V4 Flash, bet perėjimas prie GPT-5.4-mini veikia taip pat gerai.
Vyksta aktyvus kainų karas tarp vidinių išvadų iš didelių laboratorijų ir nepriklausomai aptarnaujamų atviro svorio modelių. Didesniam klausimui dėl mažo ir didelio – visai nesvarbu, kuris mažas modelis laimės.
Visa tai gali atrodyti akivaizdu – žinoma, neturėtumėte naudoti daugiau skaičiavimo, nei reikia, – tačiau tai prieštarauja iki šiol pramonėje vyravusiam mastelio keitimo principui. Įkvėptos karčios pamokos, laboratorijos labai stengėsi treniruoti kuo daugiau skaičiavimo reikalaujančius modelius, peržengdamos AI modelių galimybes. Kai kainas stipriai subsidijavo investuotojai, klientai neturėjo jokios priežasties rinktis ką nors kita, išskyrus pažangiausią variantą.
Didėjant žetonų kainoms ir lėtėjant subsidijoms, vartotojai pirmą kartą susiduria su išlaidų spaudimu. Nežinome, ar dėl naujojo sąnaudų spaudimo įmonių naudotojai iš tikrųjų privers rinktis mažesnius modelius. Jie taip pat lengvai galėtų sutaupyti skambindami mažiau, naudodami mažiau konteksto arba tiesiog atsisakydami mažiausiai perspektyvių diegimų.
Tačiau jei paaiškės, kad daugumą diegimų taip pat galima vykdyti ir mažesniame modelyje, tai gali rimtai susilpninti augantį išvadų poreikį ir sukelti naujų klausimų, kaip pateisinti pasienio modelio mokymo išlaidas.
Kai perkate per mūsų straipsniuose pateiktas nuorodas, galime uždirbti nedidelį komisinį atlyginimą. Tai neturi įtakos mūsų redakcinei nepriklausomybei.



