AI padėjėjai rodo reikšmingas problemas 45 % naujienų atsakymų

Remiantis Europos transliuotojų sąjungos (EBU) ir BBC tyrimu, pagrindiniai dirbtinio intelekto padėjėjai beveik pusėje įvertintų atsakymų pateikė klaidingą informaciją arba netinkamai tvarkė naujienų turinį.

Tyrimo metu buvo vertinamos nemokamos „ChatGPT“, „Copilot“, „Gemini“ ir „Perplexity“ versijos vartotojams, atsakant į naujienų klausimus 14 kalbų 22 viešosiose žiniasklaidos organizacijose 18 šalių.

EBU paskelbė apie išvadas:

„AI sisteminis naujienų iškraipymas yra nuoseklus visose kalbose ir teritorijose.

Turinys:

Ką nustatė tyrimas

Iš viso buvo įvertinti 2709 pagrindiniai atsakymai, kokybiniai pavyzdžiai taip pat buvo paimti iš pasirinktinių klausimų.

Apskritai 45 % atsakymų buvo bent viena svarbi problema, ir 81 % turėjo kažkokią problemą. Aprūpinimas buvo labiausiai paplitusi probleminė sritis, kuri turėjo įtakos 31 % reikšmingo lygio atsakymų.

Kaip pasirodė kiekvienas asistentas

Našumas skiriasi priklausomai nuo platformos. „Google Dvyniai“ parodė daugiausiai problemų: 76 % jos atsakymuose buvo didelių problemų, kurias lėmė 72 % su tiekimo problemomis.

Kiti padėjėjai buvo arba žemiau 37 % pagrindinėms problemoms apskritai ir toliau 25 % dėl tiekimo problemų.

Klaidų pavyzdžiai

Tikslumo problemos buvo pasenusios arba neteisingos informacijos.

Pavyzdžiui, keletas padėjėjų nustatė, kad popiežių Pranciškų yra dabartinis popiežius gegužės pabaigoje, nepaisant jo mirties balandžio mėnesį, o Dvyniai neteisingai apibūdino įstatymų, susijusių su vienkartiniais garais, pakeitimus.

Metodikos pastabos

Dalyviai pateikė atsakymus nuo gegužės 24 d. iki birželio 10 d., naudodami bendrą 30 pagrindinių klausimų rinkinį ir pasirenkamus vietinius klausimus.

Tyrime daugiausia dėmesio buvo skiriama nemokamoms / vartotojams skirtoms kiekvieno asistento versijoms, kad būtų atspindėtas įprastas naudojimas.

Daugelis organizacijų turėjo techninius blokus, kurie paprastai riboja asistento prieigą prie jų turinio. Tie blokai buvo pašalinti atsakymo generavimo laikotarpiui ir vėliau atkurti.

Kodėl tai svarbu

Naudojant AI pagalbininkus tyrimams ar turinio planavimui, šios išvados sustiprina poreikį patikrinti pretenzijas dėl pirminių šaltinių.

Kaip leidinys, tai gali turėti įtakos tam, kaip jūsų turinys vaizduojamas AI atsakymuose. Didelis klaidų lygis padidina riziką, kad suvestinėse, kuriose cituojamas jūsų turinys, bus rodomi neteisingai priskirti arba nepagrįsti teiginiai.

Žvilgsnis į priekį

EBU ir BBC kartu su ataskaita paskelbė naujienų vientisumą AI asistentų įrankių rinkinyje, kuriame siūlomos gairės technologijų įmonėms, žiniasklaidos organizacijoms ir tyrėjams.

Reuters praneša apie EBU nuomonę, kad didėjantis pasitikėjimas naujienų asistentais gali pakenkti visuomenės pasitikėjimui.

Kaip pasakė EBU žiniasklaidos direktorius Jeanas Philipas De Tenderis:

„Kai žmonės nežino, kuo pasitikėti, jie visiškai niekuo nepasitiki, o tai gali atgrasyti nuo demokratinio dalyvavimo.

Teminis vaizdas: Naumova Marina / Shutterstock

Source link

Susijusios istorijos

„Vibe Coding“ neatliks jūsų SEO

„Vibe Coding“ neatliks jūsų SEO

Kaip valdyti AI atsakymų tikslumą

Galbūt praleidote

„Vibe Coding“ neatliks jūsų SEO

„Vibe Coding“ neatliks jūsų SEO

„Treads“ prideda naujų paskelbimo parinkčių ir animuotų mini lipdukų

Kodėl niekada negalite priversti gydytojo jums paskambinti