OpenAI har tjänat upp sin vision om framtidens AI-assistent genom att tillkännage "Hennes"-liknande röstuppgraderingar för ChatGPT. Men medan tekniken går framåt, uppstår frågan om dess verkliga kapacitet begränsas medvetet.
Hur nära är vi att tekniken verkligen förstår oss? Med den nya uppgraderingen av ChatGPT utlovar OpenAI en riktig interaktiv upplevelse, men de av oss som använder det dagligen vet att potentialen fortfarande är outnyttjad. Skapar OpenAI framtidens verktyg eller håller det bara medvetet tillbaka nyckeln till ett verkligt AI-genombrott?
I måndags presenterade OpenAI en ny funktion hos sin röstassistent, som inte bara reagerar på mänskligt tal, utan också kan läsa mänskliga känslor och översätta talade ord i realtid, med en anmärkningsvärd demonstration. Möjligheten att pausa AI medan du talar och fortsätta utan att uppmana igen låter revolutionerande, vilket ger en ny dimension till interaktivitet mellan människa och maskin. Detta förhållningssätt till karaktären som spelas av Scarlett Johansson i filmen "She" är ingen tillfällighet – det är en återspegling av OpenAI:s ansträngningar att göra artificiell intelligens mer mänsklig.
Men som vanliga användare av ChatGPT vet vi att trots de uppenbara framstegen finns det fortfarande hinder som hindrar AI från att verkligen utveckla sin fulla potential. Från inkonsekvenser i svar på ologiska fel som förhindrar automatisering utan mänsklig tillsyn, verkar många av dess förmågor vara avsiktligt begränsade. Varför skulle OpenAI, som har det tekniska kunnandet och kapaciteten, hålla tillbaka utvecklingen av ett så avancerat verktyg?
I Nordamerika har ChatGPT-användare kunnat dra nytta av "Memory"-funktionen under en tid nu, som kommer ihåg allt du säger åt den att göra. Detta kan vara ett genombrott i interaktionen med AI, eftersom du kan lära den hur man tilltalar dig och svarar utifrån dina preferenser. Men ändå verkar ChatGPT leva i ett skämt - mellan utlovad användbarhet och faktisk oanvändbarhet. För att det åtminstone delvis ska fungera är det nödvändigt att använda en serie externa applikationer, vilket ifrågasätter detta verktygs autonomi och oberoende.
En av de mest frustrerande begränsningarna med att använda ChatGPT är att, trots tillgängligheten av "Memory"-funktionen i huvudmodellerna, har customGPTs - anpassade modeller för specifika ändamål - fortfarande inte denna förmåga. Detta innebär att varje customGPT fungerar i ett vakuum, utan förmåga att lära sig eller anpassa sig baserat på tidigare interaktioner. Denna begränsning minskar avsevärt deras användbarhet och autonomi, eftersom de inte kan bygga kontinuerlig kunskap eller följa långsiktiga trender i dialog. Utan minne kan customGPT dessutom inte skräddarsy sina svar efter individuella användarbehov och preferenser, vilket är avgörande för att skapa en verkligt personlig och effektiv AI-upplevelse. Ironiskt nog, medan OpenAI går framåt inom röst- och visuell teknik, förblir nyckelfunktionaliteten som skulle förvandla customGPTs till kraftfulla verktyg svårfångad, vilket lämnar användare och utvecklare i ett tillstånd av förväntan och konstant önskan om mer funktionalitet.
Den största utmaningen för utvecklingen av ChatGPT är inte bara teknisk, utan också av praktisk karaktär: multimodal användbarhet, eller med andra ord uppkoppling med andra applikationer. I en idealisk värld skulle ChatGPT sömlöst kunna komma åt din kalender, automatiskt boka om eller lägga till möten, till och med ringa telefonsamtal å dina vägnar för att rapportera att du är försenad. För närvarande tycks denna integrationsnivå dock vara långt borta. Trots att ChatGPT nu kan "se", "höra" och till och med känna av våra känslor, kvarstår frågan om dessa förmågor verkligen är ett steg framåt eller bara imponerande och i princip värdelösa jippon. Även om OpenAI är beundransvärt för sin innovation, känns det ofta som att utvecklare bara retar oss med AI:s potential, medan nyckelfunktioner som verkligen skulle öka användbarheten av ChatGPT förblir låsta bakom säkerhets- och etiska lås som bromsar verkliga framsteg i interaktion mellan människa och maskin.
I framtiden verkar det som att ChatGPT kommer att bli en permanent fixtur på våra enheter, delvis på grund av dess integration med olika system via applikationer, vilket redan indikeras av den nyligen lanserade skrivbordsapplikationen. Denna applikation är ett lovande steg mot att uppfylla de långsiktiga förväntningarna vi har på artificiell intelligens: att utföra vissa uppgifter automatiskt eller halvautomatiskt. Till exempel kan appen automatiskt bedöma vilka e-postmeddelanden som är viktiga eller varna dig för trafikstockningar på din rutt. Denna förmåga hos ChatGPT att agera som en proaktiv assistent som förutser och reagerar på användarens behov öppnar dörren till många praktiska tillämpningar i vardagen, där AI kommer att kunna fungera som en nyckelförmedlare mellan komplexiteten i den digitala världen och vår vardag. behov.
Kanske OpenAI verkligen vill att ChatGPT ska vara en mångsidig och intressant samtalspartner, men detta verkar tjäna mer än att maskera de verkliga begränsningarna som AI-utveckling står inför. Även om den senaste uppgraderingen kan fungera imponerande, kommer det verkliga testet att vara om OpenAI någonsin kommer att öppna dörren till ChatGPT:s fulla potential, eller om vi kommer att fortsätta att bevittna ett tekniskt "game of thrones" där verklig makt döljs bakom en slöja av säkerhet och etiska problem.