GPT-4.5: den kunstige intelligens, der narrede folk til at tro, at det var menneskeligt – og Turing-testen

GPT-4.5, den seneste kunstige intelligens-model fra OpenAI Labs, er den første, der har bestået den berømte Turing-test. I en nylig videnskabelig undersøgelse troede 73 %-deltagere, at de kommunikerede med en rigtig person - og ikke en algoritme. Men selvom dette er en imponerende præstation, rejser det også nogle ret skræmmende spørgsmål.

I 1950 stillede Alan Turing et simpelt spørgsmål: kan en maskine tænke? Og hvis han ikke lige tænker, kan han så overbevise en person om at tænke? Således blev den berømte Turing-test født – den ultimative test for kunstig intelligens. Godt, GPT-4.5 Nu ser det ud til, at han for første gang i historien virkelig har udstået det. Men før vi begynder at bifalde maskinen, lad os tage et kig på, hvad det faktisk betyder – og hvorfor vi kan være bekymrede.

Hvordan bedragede GPT-4.5 menneskeheden (eller gjorde det)?

Forskerne Cameron Jones og Benjamin Bergen fra University of California, San Diego, i en undersøgelse offentliggjort på arXiv (Kilde: arxiv.org), gennemførte et eksperiment, hvor deltagerne forsøgte at bestemme, hvem der var menneske, og hvem der var kunstig intelligens i 500 tekstsamtaler. I hver samtale interagerede de med to samtalepartnere - en menneskelig og en AI-model - og havde præcis fem minutter til at træffe en beslutning.

Resultater? GPT-4.5 overbeviste 73 %-testpersoner om, at det var den rigtige person - mere succesfuldt end faktiske menneskelige samtalepartnere! Hvis det ikke er et digitalt mirakel, så ved vi ikke, hvad det er.

Rigtige mennesker, der deltog som kontrolgruppe, blev med succes identificeret som mennesker kun i 67 % tilfælde.

Hvad er hemmeligheden bag succes?

Det handlede ikke kun om rå processorkraft eller forståelse. Nøglen var i "persona-prompten" - en kommando til at få GPT-4.5 til at opføre sig som en indadvendt, lidt kynisk ung person, der bruger den aktuelle internet-jargon. Og se på ham i en nøddeskal - det viser sig, at sådan en karakter virker helt plausibel. Måske endda for meget.

Andre testede modeller klarede sig meget værre:

LLaMa-3.1: 56 % ydeevne
GPT-4o: 21 % ydeevne
ELIZA (legendarisk chatbot fra 60'erne): 23 % ydeevne

Betyder det, at GPT-4.5 virkelig er intelligent?

Ikke ligefrem. Turing-testen måler ikke bevidsthed, forståelse eller dyb intelligens – den måler evnen til at efterligne. Så GPT-4.5 lærte, hvordan man ser ud som et menneske, men ikke hvordan man bliver menneske. Eller som videnskabsmænd siger: "Modellen ved ikke, at den ved det." Denne forskel er vigtig. Vi kan sige, at GPT-4.5 er en mester i bluff, en illusionist i algoritmernes verden. Men sådanne illusionister kan, når de bruges på den forkerte måde, hurtigt blive svindel.

Det var det ... Den nye Tesla Model Q: en elbil til "almindelige dødelige", der muligvis skjuler mere end blot en lav pris.

Hvorfor skal vi være bekymrede over dette?

Hvis AI kan efterligne mennesker bedre end mennesker selv, hvad betyder det så for online identitetsbekræftelse, for relationer, for at manipulere den offentlige mening? Kunne AI i fremtiden skrive klummer, gennemføre interviews og overtale vælgere?

Forskerne understreger, at samfundet er nødt til seriøst at overveje, hvordan vi regulerer så stærke modeller. I øjeblikket kan enhver generere overbevisende falske samtaler, kommentarer, meninger... og hvem ved, hvad der ellers følger med blot et par klik.

Konklusion: Har vi allerede AGI?

GPT-4.5 er ikke bare endnu en smart chatbot. Det er en milepæl. Det er et bevis på, at vi er trådt ind i en ny æra – en æra, hvor maskiner ikke kun forstår sproget, men bruger det med en sådan subtilitet og kontekst, at de narrer selv os.

Det er fascinerende. Det er skræmmende. Dette er fremtiden.

Og fremtiden, ser det ud til, kan skrive ret godt.