
„OpenAI“ teigia, kad GPT-5.5 Instant, numatytasis nemokamų „ChatGPT“ naudotojų modelis, dabar veikia panašiai kaip savo paribius mąstymo modelius sveikatos klausimais. Teiginys pagrįstas pačios bendrovės sveikatos vertinimais.
Sveikata yra viena iš kategorijų, kuriai AI generuojami atsakymai yra labai svarbūs. Pavyzdžiui, „Guardian“ tyrimas pranešė, kad kai kuriose „Google“ AI apžvalgose pateiktos netikslios medicininės rekomendacijos, o „Google“ vėliau pašalino AI apžvalgas, susijusias su tam tikromis medicininėmis užklausomis. „OpenAI“ naujinimas patenka į tą pačią didelės rizikos kategoriją, tačiau su teiginiu, kad bus pagerintas, o ne atsitrauks.
Sveikatos srities leidėjams ir SEO specialistams tai reiškia, kad didelė nemokama auditorija gali gauti medicininius atsakymus naudodami „ChatGPT“, o ne spustelėję šaltinį.
Apie ką pranešė OpenAI
„OpenAI“ atkreipia dėmesį į „HealthBench“ ir „HealthBench Professional“, klinikinės versijos, pranašumus. Jame rašoma, kad GPT-5.5 Instant balai yra aukštesni nei modelio GPT-5.3 Instant, kurį jis pakeitė.
Bendrovė taip pat pranešė, kad sumažėjo faktinių problemų tiesioginiame sraute. Joje teigiama, kad atsakymų į sveikatą, pažymėtų dėl bent vienos galimos faktinės problemos, rodiklis per du mėnesius sumažėjo 71%. Šis skaičius gaunamas iš monitorių, kuriuose OpenAI veikia gamybos sraute.
„OpenAI“ atliko trečiąjį palyginimą su gydytojais. Ji paprašė gydytojų parašyti atsakymus į reprezentatyvius sveikatos pokalbius, tada atskira gydytojų grupė palygino atsakymus su modelio atsakymais. Atlikdama šį palyginimą, grupė GPT-5.5 Instant atsakymus įvertino aukščiau nei gydytojo parašytus pagal kriterijus, įskaitant tikslumą, bendravimą ir išsamumą, iš 3500 peržiūrėtų atsakymų.
OpenAI teigia, kad modelis parodė mažiau gedimo režimų nei tiek senesni modeliai, tiek gydytojai. Jame buvo nurodyta mažiau atvejų, kai trūksta raudonos vėliavėlės arba nepavyko vartotojo paprašyti daugiau konteksto.
Kaip OpenAI jį išmatavo
„HealthBench“ yra etalonas, kurį bendrovė sukūrė su savo gydytojų tinklu, naudodama gydytojo parašytas rubrikas, o ne egzaminų stiliaus klausimus.
OpenAI teigia, kad dirba su daugiau nei 260 gydytojų 60 šalių ir kad gydytojai iki šiol peržiūrėjo daugiau nei 700 000 atsakymų pavyzdžių. Bendrovė nurodė 260 gydytojų skaičių nuo tada, kai sausio mėnesį pristatė „ChatGPT Health“. Nė vienas iš rezultatų nebuvo paskelbtas išorinei peržiūrai.
Sveikata jau yra vienas didžiausių ChatGPT naudojimo atvejų
„OpenAI“ teigė, kad daugiau nei 230 milijonų žmonių kiekvieną savaitę užduoda „ChatGPT“ sveikatos ir gerovės klausimus – tai viena iš dažniausiai pasitaikančių priežasčių, kodėl žmonės naudojasi pokalbių robotu.
Sveikata taip pat yra saugoma OpenAI politikos kategorija. Kai bendrovė pradėjo testuoti skelbimus „ChatGPT“, ji teigė, kad nerodys jų pokalbiuose apie sveikatą, psichinę sveikatą ar politiką.
Kodėl tai svarbu
Medicinos užklausos jau sulaukia daug dirbtinio intelekto atsakymų, o naujausioje „Google“ AI apžvalgų „Ahrefs“ analizėje iš visų kategorijų yra didžiausias rodiklis. Daugiau šios paklausos perkėlus į nemokamą „ChatGPT“ pakopą, leidėjams gali padidėti nulinio paspaudimo spaudimas.
Teiginius dėl tikslumo yra sunkiau įgyvendinti. „OpenAI“ atliko testus savo viduje, todėl jūs susiduriate su tuo pačiu matavimo atotrūkiu, kaip ir naudojant kitus AI sveikatos atsakymus. Bendrovė teigia, kad jos atsakymai į sveikatą pagerėjo, tačiau teiginių nepatvirtino nepriklausoma trečioji šalis.
Žvilgsnis į priekį
Įraše nenurodoma, kaip pakeitimai paveiks citatas. Jei daugiau platformų perkelia sveikatos atsakymus į nemokamas pakopas, atsakymų patikrinimas ir eismo praradimo valdymas tampa specialistų pareiga.


