OpenAI spełniło swoją wizję przyszłego asystenta AI, ogłaszając ulepszenia głosu w stylu „Her” dla ChatGPT. Jednak w miarę postępu technologii pojawia się pytanie, czy jej prawdziwe możliwości nie są celowo ograniczane.
Jak blisko jesteśmy technologii, która naprawdę nas zrozumie? Dzięki nowej aktualizacji ChatGPT OpenAI obiecuje naprawdę interaktywne doświadczenia, ale ci z nas, którzy używają go na co dzień, wiedzą, że potencjał jest wciąż niewykorzystany. Czy OpenAI tworzy narzędzie przyszłości, czy po prostu świadomie ukrywa klucz do prawdziwego przełomu w AI?
W poniedziałek OpenAI zaprezentowało nową funkcję swojego asystenta głosowego, który nie tylko reaguje na ludzką mowę, ale także potrafi czytać ludzkie emocje i tłumaczyć wypowiadane słowa w czasie rzeczywistym, co było niezwykłym demonstracją. Możliwość wstrzymania sztucznej inteligencji podczas mówienia i kontynuowania bez ponownego monitowania brzmi rewolucyjnie, dodając nowy wymiar interaktywności człowiek-maszyna. To przybliżenie postaci granej przez Scarlett Johansson w filmie „Ona” nie jest przypadkowe — jest odzwierciedleniem wysiłków OpenAI, aby uczynić sztuczną inteligencję bardziej ludzką.
Jednak jako zwykli użytkownicy ChatGPT wiemy, że pomimo widocznego postępu, nadal istnieją bariery uniemożliwiające AI pełne wykorzystanie jej potencjału. Od niespójności w reakcjach na nielogiczne błędy, które uniemożliwiają automatyzację bez nadzoru człowieka, wiele jej możliwości wydaje się celowo ograniczanych. Dlaczego OpenAI, dysponujący wiedzą techniczną i potencjałem, miałby wstrzymywać rozwój tak zaawansowanego narzędzia?
W Ameryce Północnej użytkownicy ChatGPT mogą już od jakiegoś czasu korzystać z funkcji „Pamięć”, która zapamiętuje wszystko, co im każesz. Może to być przełom w interakcji ze sztuczną inteligencją, ponieważ możesz nauczyć ją, jak się do Ciebie zwracać i odpowiadać w oparciu o Twoje preferencje. Mimo to ChatGPT wydaje się żyć w żartie – pomiędzy obiecaną przydatnością a faktyczną bezużytecznością. Aby było choć w części funkcjonalne, konieczne jest wykorzystanie szeregu aplikacji zewnętrznych, co stawia pod znakiem zapytania autonomię i niezależność tego narzędzia.
Jednym z najbardziej frustrujących ograniczeń w korzystaniu z ChatGPT jest to, że pomimo dostępności funkcji „Pamięć” w głównych modelach, niestandardowe GPT – modele dostosowane do określonych celów – nadal nie mają takiej możliwości. Oznacza to, że każdy niestandardowy GPT działa w próżni, bez możliwości uczenia się i dostosowywania na podstawie przeszłych interakcji. To ograniczenie znacznie ogranicza ich użyteczność i autonomię, gdyż nie mogą one budować ciągłej wiedzy ani podążać za długoterminowymi trendami w dialogu. Co więcej, bez pamięci CustomGPT nie może dostosować swoich odpowiedzi do indywidualnych potrzeb i preferencji użytkownika, co ma kluczowe znaczenie dla stworzenia prawdziwie spersonalizowanego i skutecznego doświadczenia AI. Jak na ironię, podczas gdy OpenAI rozwija się w technologii głosu i obrazu, kluczowa funkcjonalność, która przekształciłaby niestandardowe GPT w potężne narzędzia, pozostaje nieuchwytna, pozostawiając użytkowników i programistów w stanie oczekiwań i ciągłego pragnienia większej funkcjonalności.
Największe wyzwanie stojące przed rozwojem ChatGPT ma charakter nie tylko technologiczny, ale także praktyczny: użyteczność multimodalna, czyli innymi słowy łączność z innymi aplikacjami. W idealnym świecie ChatGPT miałby bezproblemowy dostęp do Twojego kalendarza, automatycznie zmieniał terminy lub dodawał spotkania, a nawet wykonywał w Twoim imieniu połączenia telefoniczne i zgłaszał spóźnienia. Obecnie jednak wydaje się, że taki poziom integracji jest odległy. Pomimo tego, że ChatGPT może teraz „widzieć”, „słyszeć”, a nawet wyczuwać nasze emocje, pozostaje pytanie, czy te możliwości to rzeczywiście krok do przodu, czy tylko efektowne i w zasadzie bezużyteczne chwyty. Chociaż OpenAI jest godne podziwu ze względu na swoją innowacyjność, często można odnieść wrażenie, że programiści po prostu drażnią nas potencjałem sztucznej inteligencji, podczas gdy kluczowe funkcjonalności, które naprawdę zwiększyłyby użyteczność ChatGPT, pozostają zamknięte za zabezpieczeniami i etycznymi blokadami, które spowalniają prawdziwy postęp w interakcji człowiek-maszyna.
Wygląda na to, że w przyszłości ChatGPT na stałe zadomowi się na naszych urządzeniach, po części dzięki integracji z różnymi systemami za pośrednictwem aplikacji, na co wskazuje już niedawno uruchomiona aplikacja desktopowa. Ta aplikacja jest obiecującym krokiem w kierunku spełnienia długoterminowych oczekiwań, jakie mamy wobec sztucznej inteligencji: wykonywania określonych zadań automatycznie lub półautomatycznie. Na przykład aplikacja może automatycznie ocenić, które e-maile są ważne lub powiadomić Cię o korkach na Twojej trasie. Ta zdolność ChatGPT do działania jako proaktywny asystent, który przewiduje i reaguje na potrzeby użytkownika, otwiera drzwi do wielu praktycznych zastosowań w życiu codziennym, gdzie sztuczna inteligencja będzie mogła służyć jako kluczowy mediator pomiędzy złożonością cyfrowego świata a naszą codziennością wymagania.
Być może OpenAI naprawdę chce, aby ChatGPT był wszechstronnym i interesującym rozmówcą, ale wydaje się, że służy to więcej niż maskowaniu rzeczywistych ograniczeń stojących przed rozwojem sztucznej inteligencji. Chociaż najnowsza aktualizacja może działać imponująco, prawdziwym testem będzie to, czy OpenAI kiedykolwiek otworzy drzwi do pełnego potencjału ChatGPT, czy też w dalszym ciągu będziemy świadkami technologicznej „gry o tron”, w której prawdziwa władza ukryta jest za zasłoną bezpieczeństwa i obawy etyczne.