Google i Apple przygotowują się do zrewolucjonizowania świata osobistych asystentów AI dzięki Gemini Nano i Apple Intelligence. Który będzie lepszy? Przyjrzyjmy się bliżej. Zderzenie osobistych asystentów AI!
Nadchodzi zatem interesująca jesień technologiczna, na horyzoncie pojawiają się nowe iPhone'y i urządzenia Pixel z nową technologią - osobistymi asystentami AI, które obiecują uczynić życie jeszcze bardziej niesamowitym, dopóki nie zacznie nam działać na nerwy. Tym razem są w centrum uwagi Google Bliźnięta Nano i Apple z jego Inteligencja Apple. Obie firmy obiecują, że ich asystenci AI zmienią sposób, w jaki korzystamy ze smartfonów. Przyjrzyjmy się więc, co tak naprawdę oferują – czego się więc spodziewać i kto może być lepszym wyborem dla Twojego i tak już przeciążonego inteligentnego urządzenia.
Sztuczna inteligencja na urządzeniu
Google i Apple mogą pochwalić się możliwością przetwarzania żądań AI bezpośrednio na urządzeniu. Oznacza to, że Twój telefon staje się minimózgiem, który działa niezależnie od serwerów w chmurze. Google nazywa go Gemini Nano, podczas gdy Apple używa po prostu nazwy Apple Intelligence. Gdy urządzenie nie może wykonać zadania na miejscu, łączy się z chmurą – co jest wspólne zarówno dla Gemini, jak i Apple Intelligence. Google oferuje pełny pakiet, natomiast Apple również sporadycznie korzysta z ChatGPT, bez rejestrowania prywatnych danych. Google ma tę zaletę, że jest właścicielem całego systemu, podczas gdy Apple cieszy się różnorodnością, opierając się na możliwościach ChatGPT.
Multimodalność
Multimodalność – to magiczne słowo – oznacza możliwość działania w różnych trybach – tekstowym, wideo i audio. Obie platformy mogą pochwalić się tą funkcjonalnością. Akceptują wprowadzanie tekstu, polecenia głosowe, analizują pliki audio, przeglądają obrazy, a nawet wyszukują filmy. Oczywiście, chociaż zarówno Google, jak i Apple zachwalają te możliwości, wciąż czekamy, aż te funkcje faktycznie trafią na nasze urządzenia.
Wprowadzanie języka
Usługa Apple Intelligence jest obecnie dostępna wyłącznie w języku angielskim. Z drugiej strony Google Bliźnięta obsługuje ponad 45 języków, co daje mu przewagę w komunikacji z większą globalną bazą użytkowników. Oczywiście Apple będzie stopniowo wprowadzać kolejne języki, ale jak wiemy, jest to bardzo powolne i pragmatyczne.
Generowanie i transkrypcja tekstu
Obie platformy oferują funkcje generowania i transkrypcji tekstu. Google Gemini umożliwia pisanie e-maili, ulotek, sprawdzanie dokumentów i nie tylko, niezależnie od urządzenia. Apple Intelligence oferuje podobne funkcje, ale tylko na urządzeniach Apple. Chociaż Apple nie wypuściło jeszcze funkcji generowania tekstu, funkcja Google Gemini jest już dostępna wszędzie.
Generowanie obrazu
Oprócz analizy obrazu Gemini i Apple Intelligence umożliwiają także generowanie obrazu. Google Pixel Studio, dostępne wyłącznie w modelach Pixel 9, umożliwia tworzenie obrazów na podstawie poleceń tekstowych, dostosowywanie stylu i nie tylko. Apple Image Playground ma podobne możliwości, ale oferuje mniej stylów. Google umożliwia także rozpoznawanie obrazów AI, co jest kluczem do ograniczenia dezinformacji. Ponadto Google wprowadza Magic Editor, który pozwala poprawiać i edytować zdjęcia za pomocą GenAI, zaś Apple wprowadza GenMoji – tworzenie spersonalizowanych emoji, których można używać w różnych aplikacjach do przesyłania wiadomości.
Tryb na żywo
Na dzisiejszym wydarzeniu Google zaprezentowano tryb Live Gemini, który pozwala rozmawiać z AI tak, jakbyś był prawdziwą osobą. Obecnie dostępna tylko w języku angielskim i dla abonentów Gemini Advanced, umożliwia rozmowę i interakcję z sztuczną inteligencją. Apple Intelligence nie ma jeszcze tego trybu, ale możemy się go spodziewać w przyszłości. Zwłaszcza, że wiemy, że współpracują z ChatGPT, wierzymy, że ta funkcja będzie świetna od Apple w przyszłości.
Nagrywanie rozmów i transkrypcja
Obie platformy umożliwiają nagrywanie i transkrypcję rozmów. Google wyświetla transkrypcje w dziennikach połączeń, a Apple dodaje je do aplikacji Notatki. O nagraniu informowani są wszyscy uczestnicy rozmowy. Oczywiście obie platformy będą robić notatki ze spotkań i formułować wnioski.
Pamięć i kontekst
Obie platformy charakteryzują się wyjątkową zdolnością zapamiętywania kontekstu rozmów i rozumienia potrzeb użytkowników. Dzięki temu sztuczna inteligencja może płynnie kontynuować rozmowę i uzyskać dostęp do istotnych informacji z przeszłości. Zrozumiemy to wszystko lepiej, gdy funkcje faktycznie zostaną udostępnione na naszych urządzeniach. Zakładamy więc, że urządzenia będą pamiętać nasze prośby, przyzwyczajenia i przeszłe rozmowy i dzięki temu w jakiś sposób będą rosły wraz z potrzebami użytkownika.
Prywatność
Prywatność jest zawsze ważnym tematem. Google i Apple zdają sobie sprawę z obaw związanych ze sztuczną inteligencją, dlatego większość funkcjonalności odbywa się na urządzeniu, bez połączenia z Internetem. Kiedy sztuczna inteligencja potrzebuje dostępu do chmury, dzieje się to w jej własnym środowisku, bez dostępu osób trzecich do danych. Wielu problemów należy się spodziewać w Europie, która odrzuca pewne zasady w zakresie prywatności.
Dostępność
Google Gemini Nano będzie dostępna tylko na urządzeniach Piksel 9, natomiast Apple Intelligence będzie dostępne na iPhone’a 15 Pro serii i nowszych urządzeń. Niestety użytkownicy w UE nie będą mogli korzystać z Apple Intelligence ze względu na przepisy DMA.
Nadal czekamy na dwóch asystentów AI oficjalne daty premiery, ale spodziewamy się, że będą dostępne w nadchodzących tygodniach lub miesiącach. Apple Intelligence będzie bezpłatne dla wszystkich użytkowników, podstawowe funkcje Gemini Nano będą bezpłatne dla użytkowników urządzeń Pixel, z rocznym dostępem do bardziej zaawansowanych funkcji dla abonentów Gemini Advanced.