Kunstig intelligens har gått fra dvalemodus til en eksplosjon av innovasjon, fra å spille sjakk til å skape 3D-verdener. Hva er det neste store gjennombruddet? Romlig intelligens, en teknologi som ikke bare forstår bilder, men også oppfatter, genererer og handler i tredimensjonalt rom. Og dette kan være mer forstyrrende enn språkmodellene vi har blitt så vant til.
De siste årene har vi vært vitne til en virkelig boom innen kunstig intelligens (AI). Fra å spille sjakk til å generere tekst, ser det ut til at det ikke er noen grense som brukergrensesnittet ikke kan krysse. Men den virkelige revolusjonen kommer med noe som går utover bare å forstå språk og bilder. Det er kjernen i den neste teknologiske utviklingen romlig intelligens, evnen til brukergrensesnittet til å forstå, skape og bevege seg i tredimensjonalt rom. Høres det ut som science fiction? Vi er faktisk allerede på vei dit.
Hvordan kom vi hit?
La oss starte med begynnelsen: kunstig intelligens har vært i en slags «vinter» i lang tid. Men det siste tiåret har gitt utrolige fremskritt. En bom dyp læring har latt brukergrensesnittet ikke bare gjenkjenne objekter i bilder, men kan nå også lage dem, fra fotografier i Van Gogh-stil til helt nye scener. Høyre datasyn ble et av nøkkelområdene for forskning som gjorde det mulig for brukergrensesnittet å begynne å forstå og tolke verden slik mennesker ser den.
Alt dette var bare en forberedelse til det som skulle komme: overgangen til romlig intelligens.
Hva er romlig intelligens?
Romlig intelligens er evnen til kunstig intelligens til å oppfatte, forstå og handle i 3D-rom. Det er muligheten for brukergrensesnittet til ikke bare å se verden som et flatt bilde, men å oppfatte det som en tredimensjonal struktur. Dette betyr at den kan gjenkjenne hvordan objekter og hendelser befinner seg i rommet, hvordan de samhandler med hverandre, og hvordan de kan bevege seg eller endre seg over tid. Kort fortalt blir UI en slags digital «spatial» arkitekt.
På den ene siden har vi språkmodeller som GPT som utmerker seg ved tekstbehandling og generering. Romlig intelligens, derimot, fokuserer på noe helt annet: å forstå den fysiske verden. Mens språk er skapt av mennesker, er den romlige verden der uavhengig av oss. Hvis AI kan begynne å forstå verdensrommet slik vi gjør, vil vi nå et helt nytt nivå av teknologisk utvikling.
Hvorfor nå?
Teknologier som f.eks Nerf (Neural Radiance Fields), utviklet av et team av toppforskere inkludert Ben Mildenhall, viste oss at brukergrensesnittet kan gjenopprette 3D-struktur fra 2D-bilder. Og det skjer raskt – i løpet av timer på ett enkelt grafikkort. Dette er ikke lenger bare en teoretisk evne. Kombinasjonen av avanserte algoritmer, enorme mengder data og enorm datakraft har skapt det perfekte miljøet for en eksplosjon av romlig intelligens.
Hvordan vil dette forandre vår verden?
Ideen om å kunne skape hele 3D-verdener vekker naturlig assosiasjoner til spill eller virtuell virkelighet. Men nytten av romlig intelligens er betydelig bredere. Tenk deg å kunne bruke AI til å generere en hel virtuell verden for utdanning, arkitektur, medisinsk simulering eller til og med underholdning. Ved å skape verdener så realistiske at de nesten ikke kan skilles fra virkeligheten, kan det innlede et nytt medium hvor grensene mellom virkelighet og den virtuelle verden visker ut.
Og det er bare begynnelsen. Også utvidet virkelighet (AR) vil kunne få helt nye dimensjoner. I stedet for bare å se virtuelle objekter i synsfeltet ditt, vil disse objektene forstå rommet rundt deg, samhandle med det og til og med påvirke det. Tenk på det som AR på steroider. Brillene dine vil kunne vise deg hvordan du fikser bilen din, selv om du ikke har noen anelse om mekanikken – alt i sanntid, skreddersydd til ditt miljø.
Den neste grensen: roboter
Hvis du tror romlig intelligens stopper ved AR, tar du feil. Det virkelige gjennombruddet vil være i den fysiske verden, der de vil være roboter kan dra nytte av denne teknologien til å navigere og samhandle i et tredimensjonalt miljø. Fra autonome kjøretøy til roboter i fabrikker, vil evnen til å forstå 3D-rom være nøkkelen for enhver enhet som vil operere utenfor et kontrollert miljø.
Konklusjon
Romlig intelligens vil ikke bare være en ny funksjonalitet i UI-verdenen, men en ny æra. Faktisk vil denne teknologien sette scenen for en fremtid hvor grensene mellom den fysiske og digitale verdenen blir nesten usynlige. Det handler ikke bare om å lage smartere algoritmer, men om en grunnleggende endring i hvordan brukergrensesnittet oppfatter og former verden rundt seg.
Når AI forstår verdensrommet slik vi gjør, er det ingen vei tilbake.