GPT-4.5, najnoviji model umjetne inteligencije iz OpenAI Labsa, prvi je koji je uspješno prošao poznati Turingov test. U nedavnoj znanstvenoj studiji, 73 sudionika % vjerovalo je da komuniciraju sa stvarnom osobom – a ne s algoritmom. No iako je ovo impresivno postignuće, ono također postavlja neka prilično zastrašujuća pitanja.
Godine 1950. Alan Turing postavio je jednostavno pitanje: može li stroj misliti? A ako baš ne misli, može li uvjeriti osobu da razmišlja? Tako je rođen poznati Turingov test – ultimativni test za umjetnu inteligenciju. Dobro, GPT-4.5 Sada je, čini se, prvi put u povijesti to uistinu izdržao. Ali prije nego što počnemo pljeskati stroju, pogledajmo što to zapravo znači – i zašto bismo mogli biti zabrinuti.
Kako je GPT-4.5 prevario čovječanstvo (ili jest)?
Znanstvenici Cameron Jones i Benjamin Bergen sa Kalifornijskog sveučilišta u San Diegu, u studiji objavljenoj na arXiv (Izvor: arxiv.org), proveo je eksperiment u kojem su sudionici u 500 tekstualnih razgovora pokušali odrediti tko je čovjek, a tko umjetna inteligencija. U svakom razgovoru komunicirali su s dva sugovornika – jednim čovjekom i jednim AI modelom – i imali su točno pet minuta da donesu odluku.
Rezultati? GPT-4.5 je uvjerio 73 ispitanika % testa da je to prava osoba – uspješnije od stvarnih ljudskih sugovornika! Ako to nije digitalno čudo, onda ne znamo što jest.
Pravi ljudi, koji su sudjelovali kao kontrolna skupina, uspješno su identificirani kao ljudi samo u 67 slučajeva %.
Koja je tajna uspjeha?
Nije se radilo samo o sirovoj procesorskoj snazi ili razumijevanju. Ključ je bio u "persona promptu" - naredbi da se GPT-4.5 ponaša kao introvertirana, pomalo cinična mlada osoba koristeći se trenutnim internetskim žargonom. A pogledajte ga ukratko – ispada da se takav lik čini sasvim uvjerljivim. Možda čak i previše.
Ostali testirani modeli prošli su puno lošije:
- LLaMa-3.1: 56 performansi %
- GPT-4o: 21 performanse %
- ELIZA (legendarni chatbot iz 60-ih): 23 performanse %
Znači li to da je GPT-4.5 uistinu inteligentan?
Ne baš. Turingov test ne mjeri svijest, razumijevanje ili duboku inteligenciju – on mjeri sposobnost oponašanja. Tako je GPT-4.5 naučio kako izgledati kao čovjek, ali ne i kako postati čovjek. Ili kako kažu znanstvenici: “Model ne zna da zna.” Ova razlika je važna. Za GPT-4.5 možemo reći da je majstor blefa, iluzionist u svijetu algoritama. Ali takvi iluzionisti, kada se koriste na pogrešan način, brzo mogu postati prevaranti.
Zašto bismo trebali biti zabrinuti zbog ovoga?
Ako umjetna inteligencija može oponašati ljude bolje od samih ljudi, što to znači za online provjeru identiteta, za odnose, za manipuliranje javnim mnijenjem? Može li umjetna inteligencija u budućnosti pisati kolumne, voditi intervjue i uvjeravati birače?
Istraživači naglašavaju da društvo treba ozbiljno razmotriti kako regulirati takve moćne modele. Trenutačno svatko može uz samo nekoliko klikova generirati uvjerljive lažne razgovore, komentare, mišljenja... i tko zna što još slijedi.
Zaključak: imamo li već AGI
GPT-4.5 nije samo još jedan pametni chatbot. To je prekretnica. To je dokaz da smo ušli u novu eru – eru u kojoj strojevi ne samo da razumiju jezik, već ga koriste s tolikom suptilnošću i kontekstom da zavaravaju čak i nas.
To je fascinantno. To je zastrašujuće. Ovo je budućnost.
A budućnost, čini se, može dobro tipkati.