OpenAI は、オンライン タスクの自動化に革命をもたらす AI エージェントである OpenAI Operator の研究バージョンを開始しました。独自のブラウザを使用して、「クリック」、「スクロール」、「入力」を行うことができます。
自分でボタンをクリックしたり、フォームに記入したり、電子メールを送信したりしなければならなかった時代を覚えていますか?いいえ?その場合、OpenAI があなたのためにツールを作成しただけかもしれません。オンライン タスクを実行できる新しい AI エージェントである OpenAI Operator をご紹介します。
それはどういう意味ですか?退屈なデジタルタスクを人工知能に委任できるようになりました。私たちは、AI が (彼のものではなくあなたのもので) ワンクリックで予約、ディナーの注文、さらには次回の購入の割引を見つけてくれる未来を歓迎します。
オペレーターはどのように機能しますか?
演算子は新しいものに基づいています 「コンピュータ利用エージェント」モデルGPT-4 のビジュアル機能と、強化学習を使用して開発された高度なロジックを組み合わせたものです (強化学習).
簡単に言うと: オペレーターは、特別な API を必要とせずに、スクリーンショットを通じて Web ページを「表示」し、要素のレイアウトを「理解」し、マウスとキーボードを使用して「操作」することができます。
Operator は未来のデジタル アシスタントのように聞こえますが、いくつかの重大なセキュリティ制限を設けて設計されています。ログインの詳細や電子メールの送信リクエストなどの機密情報に遭遇した場合、常にユーザーの許可を求めます。どこかでスタックした場合 (PowerPoint プレゼンテーションの作成など、複雑すぎるインターフェイスを理解できないため)、すぐにユーザーに制御を渡すことができます。
すでに参入している企業
OpenAI はすでに次のような企業と提携しています。 ドアダッシュ, インスタカート, オープンテーブル, 価格表 と ウーバーこれは、オペレーターが単にウェブ上で何も考えずに「クリック」するのではなく、ユーザーの実際のニーズに統合されることを意味します。
例えば: 人気のレストランのテーブルを確保したり、ディナーの簡単な配達を注文したりする必要がありますか?オペレーターは、不必要な問題なく手配することを約束します。
もちろん、それが完璧であるという意味ではありません。 OpenAI Operator は依然として、カレンダーの管理やスライドショーの作成など、より複雑なタスクに苦労していると指摘しました。しかし正直に言うと、そうしない人はいないでしょうか?
未来の細字
このオペレーターは現在、米国の ChatGPT Pro 加入者のみが利用できます。つまり、このデジタル超大国を利用するには多額の金額を支払う必要があります。 月200ドル.
これはかなりの金額ですが、OpenAI がこの種の自動化にお金を払う意思のあるビジネス ユーザーやテクノロジー愛好家をターゲットにしていることは明らかです。
将来的には、 プラス と チームこれにより、オペレーターはより幅広いユーザーの輪に近づくことができます。
AI と倫理:どこで線を引くのでしょうか?
他の高度な AI ソリューションと同様に、Operator もセキュリティと倫理に関する問題を提起します。 AI が非倫理的な目的で悪用されることはあるのでしょうか? OpenAI は、Operator が悪意のあるリクエストを拒否し、未承認のコンテンツをブロックするように設計されていることを保証します。
しかし、他の AI ツールで見てきたように、システムを悪用しようとする者が常に存在します。
結論: Operator は未来のものですか、それとも単なる流行ですか?
Operator は間違いなく、AI テクノロジーの開発における魅力的な一歩であり、完全なデジタル自動化にさらに近づきます。しかし、次のような疑問が残ります。 私たちは本当にオンラインタスクを人工知能に任せる準備ができているのでしょうか?
1 つ明らかなことは、OpenAI がその約束を果たすことができれば、Operator は時間 (と神経) を節約したい人にとって不可欠なデジタル アシスタントになる可能性があるということです。もちろん、彼があなたの許可なしにパイナップルピザを注文し始めるまでは。