Mu res gre zaupati? ChatGPT si je na testu splošnih vprašanj izmislil kar 79 % podatkov

Ga tudi vi kdaj zalotite pri neumnostih? Strokovnjaki zdaj pojasnjujejo, zakaj se to dogaja.

28. 5. 2025
ChatGPT si izmišljuje odgovore (foto: Profimedia)
ChatGPT si izmišljuje odgovore
Profimedia

Če ste se že kdaj zanašali na odgovor umetne inteligence in zaupali, da vam bo rešila dan (ali pa vsaj domačo nalogo), niste edini. Vendar pozor – novi podatki kažejo, da je še tako napredna UI lahko briljantna, a popolnoma nezanesljiva. Po poročanju New York Timesa in tudi podatkih samega OpenAI-ja, podjetja, ki stoji za slavnim ChatGPT-jem, nova generacija umetne inteligence – modela GPT o3 in o4-mini – sicer razmišlja bolj "človeško", a pri tem pogosto tudi bolj "halucinira". In tukaj ne govorimo o drobnih napakicah.

Ne spreglejte:

Ko si AI začne izmišljevati ... vse

V testih, kjer so modeli morali odgovarjati na vprašanja o znanih osebnostih, si je GPT o3 izmišljeval dejstva v kar tretjini primerov – dvakrat več kot njegov predhodnik. Še slabše se je odrezal o4-mini, ki je "haluciniral" skoraj v polovici primerov. Pri splošnih vprašanjih so številke še bolj zaskrbljujoče: do 79 % izmišljenih odgovorov!

Ali povedano drugače: če vas zanima, ali je princesa Diana kdaj vodila podkast (ni ga), vam bo ChatGPT morda samozavestno zatrdil, da je.

Zakaj prihaja do tega?

Strokovnjaki pravijo, da bolj kot je umetna inteligenca "razumska" in se trudi razmišljati kot človek, več ima prostora za napake. Takšni modeli ne ponavljajo le naučenih dejstev, ampak povezujejo, ugibajo, improvizirajo – in si včasih tudi domišljajo. OpenAI priznava, da novi modeli morda ne "halucinirajo" več zato, ker bi bili slabši, ampak ker so njihovi odgovori daljši, bolj svobodni in ... no, bolj človeški. In kot vemo – tudi ljudje kdaj blefiramo.

Hrvaški vremenoslovci objavili najnovejše napovedi za poletje 2025

Pa je to nevarno?

Ja. Ko umetna inteligenca začne ustvarjati lastna "dejstva", je meja med teorijo in izmišljotino zabrisana. In čeprav je UI resna pomočnica – pri pisanju prošenj za službo, preverjanju dejstev ali razlagi računov – si večjih napak preprosto ne moremo privoščiti. Predstavljajte si, da ste zdravnica in vam UI predlaga neresnično diagnozo. Tudi v vsakdanjih primerih – npr. če vam ChatGPT trdi, da voda vre pri 27 °C – se hitro pokaže, da ni vse zlato, kar se sveti v digitalnem svetu.

Kaj to pomeni za vas?

Preprosto: bodite previdni. Čeprav vas mika, da bi UI prevzela vso delo in razmišljanje, ji še ni mogoče povsem zaupati. Uporabljajte jo kot pomočnico, ne kot gurujko. In vedno preverite, kar vam pove. UI je lahko briljantna, a pogosto tudi (pretirano) samozavestna, ko govori – milo rečeno – neumnosti. Zato je zdrava mera skepse še vedno vaša najboljša prijateljica.

Znano je, katera 4 znamenja so najbolj trmasta in gredo vedno z glavo naravnost skozi zid