
„OpenAI“ generalinis direktorius Samas Altmanas paskelbė „raudoną kodą“, kad sutelktų įmonės išteklius į „ChatGPT“ tobulinimą, teigiama „The Wall Street Journal“ ir „The Information“ pateiktoje vidinėje atmintinėje.
Atmintinė rodo „OpenAI“ atsaką į augančią „Google“ konkurenciją, kurios „Gemini 3“ modelis, remiantis pačios „Google“ vertinimo duomenimis ir trečiųjų šalių pirmaujančiųjų sąrašais, pralenkė „ChatGPT“ atlikus kelis etaloninius testus nuo praėjusio mėnesio pradžios.
Kas naujo
Altmanas darbuotojams pasakė, kad kasdienę „ChatGPT“ patirtį reikia tobulinti. Konkrečios sritys apima personalizavimo funkcijas, atsakymo greitį ir patikimumą bei pokalbių roboto galimybę atsakyti į platesnį klausimų spektrą.
Įmonė naudoja spalvų kodavimo sistemą prioriteto lygiams nurodyti. Šios pastangos buvo padidintos iki „raudono kodo“ virš ankstesnio „oranžinio kodo“ žymėjimo, skirto „ChatGPT“ patobulinimams.
Naujas samprotavimo modelis turėtų pasirodyti kitą savaitę, remiantis atmintinėje, nors OpenAI apie tai viešai nepaskelbė.
Pavėluoti produktai
Dėl to kelios produktų iniciatyvos atidedamos.
Reklamos integravimas, kurį „OpenAI“ išbandė „ChatGPT“ programos beta versijose, dabar yra sulaikytas, rašo „The Information“. AI agentai, skirti apsipirkti ir sveikatos priežiūrai, taip pat vėluoja, taip pat „ChatGPT Pulse“ patobulinimai.
Altmanas skatino laikinus komandos perkėlimus, kad palaikytų „ChatGPT“ plėtrą, ir kasdien skambindavo už patobulinimus atsakingiems asmenims.
Konkurencinis kontekstas
Kalbant apie techninę pusę, „Google“ „Gemini 3“ ir su jais susiję modeliai įvertino pagrindinius kriterijus. „Google“ teigia, kad „Gemini 3 Deep Think“ pralenkia ankstesnes „Humanity's Last Exam“ versijas – AI saugos tyrinėtojų sukurtą ribinio lygio etaloną ir kitus sudėtingus testus. Šie rezultatai atsispindi pačios „Google“ „Gemini 3 Pro“ etaloniniame puslapyje ir nepriklausomose lyderių lentelėse, kuriose stebimas modelio našumas.
„OpenAI“ dar nepaskelbė palyginamų viešų lyginamųjų duomenų savo kitam samprotavimo modeliui, todėl palyginimai remiasi dabartiniais GPT 5 rezultatais, o ne būsima sistema, nurodyta atmintinėje.
„Google“ taip pat toliau investuoja į generuojančius vaizdo įrankius, tokius kaip „Nano Banana“ ir „Nano Banana Pro“ vaizdų generatoriai, kurie yra greta „Gemini 3“ ir yra platesnės AI produktų asortimento dalis.
Palyginimo kontekstas
Paskutinis žmonijos egzaminas turėtų būti sunkesnis prisotintų etalonų, tokių kaip MMLU, įpėdinis. Jį prižiūri AI saugos ir masto AI centras, apžvalga pasiekiama projekto svetainėje, o rezultatai stebimi keliose pirmaujančiųjų sąrašuose, įskaitant oficialią Scale lyderių lentelę ir trečiųjų šalių prietaisų skydelius, pvz., Dirbtinę analizę.
„Google Gemini 3 Pro“ etalono dokumentacijoje nurodytas didesnis paskutinio žmonijos egzamino balas nei keliuose konkuruojančiuose modeliuose, įskaitant GPT 5. Tai yra pagrindas pranešimui, kad „Gemini 3“ „pralenkė“ ChatGPT pagal tą konkretų etaloną.
„OpenAI“ paskelbė puikių kitų savo GPT 5 serijos samprotavimo etalonų rezultatus, tačiau atrodo, kad atmintinė reaguoja į šią naujausią „Gemini 3“ našumo duomenų bangą, o ne į vieną testą.
Eismo ir naudojimo kontekstas
Nepaisant techninio spaudimo, „OpenAI“ vis dar turi didelį asistento naudojimo pranašumą.
Neseniai paskelbtame „LinkedIn“ įraše „ChatGPT“ vadovas Nickas Turley teigė, kad „ChatGPT“ yra „nr. 1 AI asistentas visame pasaulyje“, kuris sudaro „apie 70 % asistento naudojimo“ ir maždaug 10 % paieškos veiklos. Visus jo komentarus galite perskaityti čia.
Atskiros prekybos vietų, įskaitant „Financial Times“, ataskaitos rodo, kad „OpenAI“ turi daugiau nei 800 milijonų savaitinių vartotojų, kurių dauguma yra nemokamoje pakopoje, o „Gemini“ vartotojų bazė sparčiai auga nuo žemesnio taško.
Altmano atmintinėje pripažįstama naujausia „Google“ pažanga ir įspėjama apie „laikinus ekonominius priešpriešinius vėjus“, taip pat sakoma, kad „OpenAI“ „greitai vejasi“.
Pažįstamas žaidimų knyga
Pavadinimas „raudonas kodas“ atkartoja pačios „Google“ atsakymą į „ChatGPT“ prieš keletą metų.
„Google“ vadovybė paskelbė „raudoną kodą“ po „ChatGPT“ viruso paleidimo. Generalinis direktorius Sundaras Pichai nukreipė komandas į „Google Research“, „Trust and Safety“ ir kitus skyrius, kad sutelktų dėmesį į AI produktų kūrimą.
Ši skuba paskatino pagreitinti „Google“ AI produktų kūrimą, kurio kulminacija buvo Bardo pristatymas 2023 m. pradžioje ir vėlesnė jo raida į Dvynius.
Dabar vaidmenys pasikeitė. Nuolatinės „Google“ investicijos į AI infrastruktūrą sukūrė modelį, kurio rezultatai yra aukštesni nei „ChatGPT“ pagal keletą aukšto lygio etalonų, todėl „OpenAI“ savo pavyzdiniam produktui priėmė panašią reagavimo į krizę sistemą.
Įmonės atsakymas
Nickas Turley, OpenAI ChatGPT vadovas, aptarė konkurencinę aplinką naujausiuose „LinkedIn“ ir X įrašuose, kur „ChatGPT“ apibūdino kaip geriausią AI padėjėją visame pasaulyje.
„Kiekvieną savaitę pristatomi nauji produktai, o tai puiku“, – rašė jis viename iš įrašų, sakydamas, kad konkurencija verčia OpenAI judėti greičiau ir toliau tobulinti „ChatGPT“.
Jis pridūrė, kad „OpenAI“ siekia, kad „ChatGPT“ būtų „pajėgesnis“, tuo pačiu plečiant prieigą ir „intuityvesnį bei asmeniškesnį“.
OpenAI viešai nekomentavo pačios nutekintos atmintinės.
Žvilgsnis į priekį
„OpenAI“ naujo samprotavimo modelio paleidimas bus pirmasis požymis, kaip įmonė vykdo Altmano direktyvą. Reklamos ir dirbtinio intelekto agentų delsimas rodo, kad „ChatGPT“ kokybė tapo vieninteliu bendrovės artimiausio laikotarpio prioritetu, bent jau viduje.
Tikėtina, kad rinkodaros specialistams ir SEO specialistams greitesnis poveikis bus tam, kaip „ChatGPT“ tvarko sudėtingas užklausas, tyrimo užduotis ir tolesnius klausimus, kai naujasis modelis pradeda veikti. Bet kokius išmatuojamus atsakymų kokybės, greičio ar suasmeninimo pokyčius bus svarbu stebėti kartu su „Google“ nuolatiniu „Gemini 3“ diegimu.
Teminis vaizdas: Mijansk786/Shutterstock



