AI pasaulis darosi „juodingas“

Penktadienį Claude Code kūrėjas Borisas Cherny pasirodė Meta @Scale konferencijoje ir, stebėtinai, pirmasis auditorijos klausimas buvo apie kilpas.

„Ar kilpos yra kitas ažiotažas, – paklausė klausėjas, – ar tai tikra?

Cherny atsakė pabrėžtinai: „Taip, jie tikri“.

„Prieš dvejus metus rašėme šaltinio kodą ranka. Pradėjome pereiti, kad agentai parašytų kodą. O dabar pereiname prie taško, kai agentai ragina agentus parašyti kodą”, – tęsė jis. „Kad ir koks buvo žingsnis nuo šaltinio kodo iki agentų, kilpos yra tokios pat svarbios ir toks pat didelis žingsnis.

Vėliau pokalbio metu (apie 32.00 val. aukščiau paskelbtame „YouTube“ vaizdo įraše) Cherny konkretizavo, kokias kilpas jis nuolat vykdo savo darbe. Vienas agentas nuolat ieško būdų, kaip pagerinti kodo architektūrą, o kitas ieško pasikartojančių abstrakcijų, kurias būtų galima suvienodinti. Jie pateikia ištraukimo užklausas kaip ir bet kuris kitas programuotojas, o kadangi kodas nuolat keičiasi, jie niekada nenustoja veikti.

Tai galinga idėja, ypač su tokia reikšminga figūra kaip Černis. Perėjus prie agentinio AI, dauguma vartotojų daugiausia dėmesio skyrė savo agentų valdymui: nustatykite aiškius tikslus, patikrinkite atskirus progreso vienetus ir neleiskite jiems nuklysti per toli už raginimo. Ciklas žengia žingsnį toliau, leisdamas agentų būriui nuolat dirbti fone, be galo. DI reikia labai pasitikėti, tačiau modeliams sparčiai tobulėjant, tai gali būti kitas žingsnis siekiant priversti dirbtinį intelektą atlikti tikrą darbą.

Pirmas dalykas, kurį reikia pripažinti, yra tai, kad tai nėra visiškai nauja. Rekursyvinės kilpos – funkcijos, kurios vadinasi tam, kad kartotų veiksmą, kartu su sąlyga, kuri sustabdo kilpą – yra įvadinių informatikos kursų pagrindas. Šios kilpos vadovaujasi nedeterministine logika – tai yra subagentas, kuris pasirenka, kada sustabdyti kilpą, o ne aiškią sąlygą – tačiau veikia tas pats pagrindinis metodas. Kai tik programuotojai pradėjo naudoti dirbtinį intelektą užduotims atlikti, turėjo atsirasti tam tikra rekursinio ciklo versija, kai AI prižiūri AI.

Skirtingai nuo klasikinio skaičiavimo, agentinės kilpos gali būti beprotiškai paprastos. Vienas iš populiariausių triukų yra Ralph Loop (pavadintas Ralph Wiggum), kuris iš esmės apibendrina visą modelio atliktą darbą ir klausia, ar jis pasiekė savo tikslą. Tai būdas kovoti su dirbtinio intelekto modeliais, pasiklydusiais, kai jie veikia per ilgai – iš esmės šokdinti modelį pirmyn ir atgal, kol užduotis bus baigta.

Kitas būdas mąstyti apie kilpas yra dalis bendros pastangos daugiau skaičiuoti bandymo laiką. Kaip anksčiau šį mėnesį pastebėjo OpenAI tyrinėtojas Noamas Brownas, šiuolaikiniai modeliai gali išspręsti beveik bet kokią problemą, jei skiriate pakankamai daug skaičiavimų. Tai reiškia, kad vienas iš būdų užtikrinti, kad problema būtų išspręsta, yra tiesiog skaičiuoti, kol ji bus baigta. Tai ypač pasakytina apie kopimo į kalnus problemas, tokias kaip kodo bazės tobulinimas, kai modelis gali tik palaipsniui tobulinti, kol pasiekia tam tikrą slenkstį. Arba, kaip Černio pavyzdyje, jis gali tiesiog laipsniškai tobulinti tol, kol bus skaičiuojama tam išleisti.

Jei tai skamba brangiai, turėtų. Kaip ir anksčiau, dirbtinio intelekto kilpos perjungia žetonus daug greičiau nei paprasti klausimų ir atsakymų pokalbių robotai – ir kadangi tikslas yra užtikrinti, kad ciklas veiktų visą laiką, nėra ribos, kiek galite išleisti. Tai tinka „Anthropic“, kuris galiausiai yra žetonų pardavimo verslas, tačiau visiems kitiems tai gali būti brangus būdas dirbti.

Vis dėlto, atsižvelgiant į problemą, kurią bando išspręsti agento kilpa, ir tinkamos sąrankos, leidžiančios prižiūrėti žetonų išlaidas, dreifus ir kitas klasikines AI problemas, nauda gali būti pakankamai stulbinanti, kad būtų didesnė už išlaidas.

Kai perkate per mūsų straipsniuose pateiktas nuorodas, galime uždirbti nedidelį komisinį atlyginimą. Tai neturi įtakos mūsų redakcinei nepriklausomybei.

Source link