GPT-4.5: tekoäly, joka huijasi ihmiset ajattelemaan, että se oli ihminen – ja Turingin testi

GPT-4.5, OpenAI Labsin uusin tekoälymalli, on ensimmäinen, joka läpäisi kuuluisan Turingin testin. Äskettäisessä tieteellisessä tutkimuksessa 73 %:n osallistujaa uskoi kommunikoivansa oikean henkilön – eikä algoritmin – kanssa. Mutta vaikka tämä on vaikuttava saavutus, se herättää myös melko pelottavia kysymyksiä.

Vuonna 1950 Alan Turing esitti yksinkertaisen kysymyksen: voiko kone ajatella? Ja jos hän ei tarkalleen ajattele, voiko hän saada ihmisen ajattelemaan? Näin syntyi kuuluisa Turingin testi – tekoälyn äärimmäinen testi. Hyvin, GPT-4.5 Nyt näyttää siltä, että ensimmäistä kertaa historiassa hän on todella kestänyt sen. Mutta ennen kuin alamme taputtaa konetta, katsotaanpa, mitä tämä itse asiassa tarkoittaa – ja miksi saatamme olla huolissamme.

Kuinka GPT-4.5 petti ihmiskuntaa (tai petti sen)?

Tutkijat Cameron Jones ja Benjamin Bergen Kalifornian yliopistosta San Diegosta arXiv-sivustolla julkaistussa tutkimuksessa (Lähde: arxiv.org), suoritti kokeen, jossa osallistujat yrittivät määrittää, kuka oli ihminen ja kuka tekoäly 500 tekstikeskustelussa. Jokaisessa keskustelussa he olivat vuorovaikutuksessa kahden keskustelukumppanin – yhden ihmisen ja yhden tekoälymallin – kanssa, ja heillä oli tasan viisi minuuttia aikaa tehdä päätös.

Tulokset? GPT-4.5 vakuutti 73 %-koehenkilöä, että se oli todellinen henkilö – onnistuneemmin kuin todelliset ihmiskeskustelukumppanit! Jos se ei ole digitaalinen ihme, emme tiedä mikä on.

Oikeita ihmisiä, jotka osallistuivat kontrolliryhmänä, tunnistettiin onnistuneesti ihmisiksi vain 67 %-tapauksessa.

Mikä on menestyksen salaisuus?

Kyse ei ollut vain raaka prosessointitehosta tai ymmärtämisestä. Avain oli "persona prompt" -komento saada GPT-4.5 käyttäytymään kuin introvertti, jokseenkin kyyninen nuori ihminen nykyisellä Internet-salakielellä. Ja katsokaa häntä pähkinänkuoressa – käy ilmi, että tällainen hahmo vaikuttaa täysin uskottavalta. Ehkä jopa liikaa.

Muut testatut mallit menestyivät paljon huonommin:

LLaMa-3.1: 56 % suorituskyky
GPT-4o: 21 %:n suorituskyky
ELIZA (legendaarinen chatbot 60-luvulta): 23 %-suorituskykyä

Tarkoittaako tämä, että GPT-4.5 on todella älykäs?

Ei aivan. Turingin testi ei mittaa tietoisuutta, ymmärrystä tai syvää älykkyyttä – se mittaa matkimiskykyä. Joten GPT-4.5 oppi kuinka näyttää ihmiseltä, mutta ei kuinka tulla ihmiseksi. Tai kuten tiedemiehet sanovat: "Malli ei tiedä tietävänsä." Tämä ero on tärkeä. Voimme sanoa, että GPT-4.5 on bluffin mestari, illusionisti algoritmien maailmassa. Mutta tällaisista illusionisteista voi nopeasti tulla petoksia, jos niitä käytetään väärin.

Tutustu myös

Tekoäly

Tämä on ChatGPT 5: nopeampi, älykkäämpi, intuitiivisempi – ja nyt jopa persoonallisempi – mutta kaikkea muuta kuin virheetön

Miksi meidän pitäisi olla huolissaan tästä?

Jos tekoäly voi jäljitellä ihmisiä paremmin kuin ihmisiä itse, mitä se tarkoittaa online-identiteetin todentamisessa, ihmissuhteissa tai yleisen mielipiteen manipuloinnissa? Voisiko tekoäly tulevaisuudessa kirjoittaa kolumneja, haastatella ja suostutella äänestäjiä?

Tutkijat korostavat, että yhteiskunnan on pohdittava vakavasti, kuinka säätelemme tällaisia tehokkaita malleja. Tällä hetkellä kuka tahansa voi luoda vakuuttavia valekeskusteluja, kommentteja, mielipiteitä... ja kuka tietää mitä muuta seuraa muutamalla napsautuksella.

Johtopäätös: Onko meillä jo AGI?

GPT-4.5 ei ole vain yksi älykäs chatbot. Se on virstanpylväs. Se on todiste siitä, että olemme siirtyneet uuteen aikakauteen – aikakauteen, jolloin koneet eivät vain ymmärrä kieltä, vaan käyttävät sitä niin hienovaraisesti ja kontekstissa, että ne huijaavat jopa meidät.

Se on kiehtovaa. Se on pelottavaa. Tämä on tulevaisuus.

Ja tulevaisuus näyttää osaavan kirjoittaa melko hyvin.