
„OpenAI“ ketvirtadienį pranešė, kad jos API dabar bus įtraukta daug naujų balso žvalgybos funkcijų, skirtų padėti kūrėjams kurti programas, kurios gali kalbėti, perrašyti ir išversti pokalbius su vartotojais.
Naujasis bendrovės GPT-Realtime-2 yra dar vienas balso modelis, sukurtas siekiant sukurti tikrovišką balso modeliavimą, leidžiantį bendrauti su vartotojais. Tačiau, skirtingai nei jo pirmtakas (GPT-Realtime-1.5), šis sukurtas naudojant GPT-5 klasės argumentus, kurie, kaip teigia OpenAI, buvo sukurti sudėtingesnėms vartotojų užklausoms spręsti.
Bendrovė taip pat pristato GPT-Realtime-Translate, kuri, kaip atrodo, yra skirta teikti vertimo paslaugas realiuoju laiku, „nepakojančias“ su vartotoju pokalbio metu. Funkcija apima daugiau nei 70 įvesties kalbų (tai yra kalbų, kurias ji gali suprasti) ir 13 išvesties kalbų (kalbų, kurias ji perduoda garsiakalbiui).
Galiausiai bendrovė taip pat pristatė naują transkripcijos funkciją GPT-Realtime-Whisper, kuri suteikia vartotojams tiesioginio kalbos pakeitimo tekstu galimybes, kurios užfiksuojamos vykstant sąveikai.
„Kartu modeliai, kuriuos pristatome, perkelia realaus laiko garsą nuo paprasto skambinimo ir atsakymo prie balso sąsajų, kurios iš tikrųjų gali veikti: klausytis, samprotauti, išversti, perrašyti ir imtis veiksmų, kai vyksta pokalbis“, – teigė bendrovė.
Kam šie atnaujinimai bus naudingi? Įmonės, norinčios išplėsti klientų aptarnavimo galimybes, yra akivaizdus tikslas. Tačiau OpenAI taip pat pažymi, kad jos naujos funkcijos padės įvairiose srityse, įskaitant švietimą, žiniasklaidą, renginius ir kūrėjų platformas.
Kad ir kaip naudingos šios priemonės atrodo įmonės požiūriu, taip pat tikėtina, kad jais galima piktnaudžiauti. Bendrovė teigė, kad sukūrė apsauginius turėklus, kad jos naujomis funkcijomis nebūtų piktnaudžiaujama kuriant šlamštą, sukčiavimą ar kitas piktnaudžiavimo internete formas. Tam tikri aktyvikliai buvo įterpti į sistemą, kad „pokalbiai gali būti sustabdyti, jei bus aptikta, kad jie pažeidžia mūsų žalingo turinio gaires“, sakė OpenAI.
Techcrunch renginys
San Franciskas, Kalifornija
|
2026 m. spalio 13-15 d
Visi nauji balso modeliai įtraukti į OpenAI Realtime API. „Vertėjas“ ir „Whisper“ apmokestinamos minutėmis, o „GPT-Realtime-2“ – pagal prieigos rakto naudojimą.
Kai perkate per mūsų straipsniuose pateiktas nuorodas, galime uždirbti nedidelį komisinį atlyginimą. Tai neturi įtakos mūsų redakcinei nepriklausomybei.



