Google と Apple は、Gemini Nano と Apple Intelligence によって AI パーソナル アシスタントの世界に革命を起こす準備をしています。どちらが良いでしょうか?詳しく見てみましょう。 AIパーソナルアシスタントの激突!
ということで、興味深いテクノロジーの秋が近づいており、新しい iPhone や Pixel デバイスが新しいテクノロジーを搭載して登場する予定です。AI パーソナル アシスタントは、私たちの不安を感じ始めるまでは、生活をさらに素晴らしいものにしてくれると約束されています。今度はGoogleとともに注目を集めています ジェミニナノ そしてAppleとその アップルインテリジェンス。両社は、AIアシスタントがスマートフォンの使い方を変えると約束している。それでは、実際に何を提供しているのかを見てみましょう。つまり、何を期待するのか、そしてすでに過負荷になっているスマートデバイスにとって誰がより良い選択である可能性があるのかを見てみましょう。
デバイス上のAI
Google と Apple は、デバイス上で AI リクエストを直接処理できる機能を誇っています。これは、携帯電話がクラウド サーバーから独立して動作する小さな頭脳になることを意味します。 GoogleはこれをGemini Nanoと呼んでいますが、Appleは単にApple Intelligenceという名前を使用しています。デバイスがオンサイトでタスクを実行できない場合、デバイスはクラウドに接続します。これは Gemini と Apple Intelligence の両方に共通です。 Google は完全なパッケージを提供していますが、Apple も個人データを記録せずに ChatGPT を使用することがあります。 Google はシステム全体を所有するという利点を持っていますが、Apple は ChatGPT の機能に依存することで多様性を享受しています。
マルチモダリティ
マルチモダリティ - その魔法の言葉 - は、テキスト、ビデオ、オーディオなどのさまざまなモードを通じて操作できる機能を意味します。どちらのプラットフォームもこの機能を備えています。テキスト入力、音声コマンドを受け入れ、音声ファイルを分析し、画像を表示し、ビデオを検索することもできます。もちろん、Google と Apple は両方ともこれらの機能を宣伝していますが、私たちはこれらの機能が実際にデバイスに導入されるのをまだ待っています。
言語入力
Apple Intelligence は現在英語でのみ利用可能です。一方で Google ジェミニ 45 を超える言語をサポートしているため、より大規模なグローバル ユーザー ベースとのコミュニケーションに有利です。もちろん、Apple は徐々に他の言語を導入する予定ですが、ご存知のとおり、それは非常に遅く、実用的です。
テキストの生成と転写
どちらのプラットフォームも、テキスト生成および転写機能を提供します。 Google Gemini を使用すると、デバイスに関係なく、電子メール、チラシの作成、文書のチェックなどを行うことができます。 Apple Intelligence も同様の機能を提供しますが、Apple デバイスでのみ提供されます。 Apple はまだテキスト生成機能をリリースしていませんが、Google の Gemini 機能はすでにどこでも利用できます。
画像生成
画像分析に加えて、Gemini と Apple Intelligence により画像生成も可能になります。 Pixel 9 モデル専用の Google Pixel Studio を使用すると、テキスト コマンドに基づいて画像を作成したり、スタイルをカスタマイズしたりできます。 Apple の Image Playground にも同様の機能がありますが、提供するスタイルは少なくなっています。 Google はまた、誤った情報を減らすための鍵となる AI 画像認識も可能にしています。さらに、Google は GenAI を利用して写真を修正および編集できる Magic Editor を導入し、Apple はさまざまなメッセージング アプリケーションで使用できるパーソナライズされた絵文字の作成である GenMoji を導入しました。
ライブモード
今日の Google イベントでは、まるで本物の人間であるかのように AI と会話できる Gemini のライブ モードが紹介されました。現在、Gemini Advanced 加入者向けに英語でのみ利用可能で、AI と会話したり対話したりすることができます。 Apple Intelligence にはまだこのモードがありませんが、将来的には期待できます。特に、ChatGPT と連携していることがわかっているので、この機能は将来 Apple から素晴らしいものになると信じています。
通話の録音と文字起こし
どちらのプラットフォームでも、会話を録音して文字に起こすことができます。 Google は通話記録にトランスクリプトを表示し、Apple はそれを Notes アプリに追加します。通話の参加者全員に録音について通知されます。もちろん、どちらのプラットフォームも会議からメモを取って結論を出します。
記憶と文脈
どちらのプラットフォームも、会話のコンテキストを記憶し、ユーザーのニーズを理解する優れた機能を誇ります。これにより、AI はシームレスに会話を継続し、過去の関連情報にアクセスできるようになります。機能が実際にデバイス上で稼働するようになると、このすべてがよりよく理解できるようになります。したがって、デバイスは私たちのリクエスト、習慣、過去の会話を記憶しており、ユーザーのニーズに合わせて何らかの形で成長すると考えられます。
プライバシー
プライバシーは常に重要なトピックです。 Google と Apple は AI に対する懸念を認識しているため、ほとんどの機能はインターネット接続なしでデバイス上で実行されます。 AI がクラウドにアクセスする必要がある場合、それは独自の環境内で行われ、サードパーティがデータにアクセスすることはありません。プライバシー分野における特定の規則を拒否する欧州では、多くの問題が予想される。
可用性
Google ジェミニ ナノ デバイスでのみ利用可能になります ピクセル9、Apple Intelligence は iPhone15プロ シリーズ以降のデバイス。残念ながら、EU 内のユーザーは DMA 法により Apple Intelligence を使用できなくなります。
2人のAIアシスタントをまだ待っています 正式な発売日, ただし、今後数週間または数か月以内に利用可能になると予想されます。 Apple Intelligence はすべてのユーザーに無料で、Gemini Nano の基本機能は Pixel デバイス ユーザーに無料で提供され、Gemini Advanced 加入者はより高度な機能に 1 年間アクセスできます。