FBピクセル

Warmwind OS: クラウドで動作する初のAIネイティブ「オペレーティングシステム」

ドイツのイエナ発スタートアップ企業が自律的な「クラウド従業員」を約束

Warmwind OS
写真: ウォームウィンド

Warmwind OSは、ノートパソコン用の従来のOSではなく、バックグラウンドで「デジタルワーカー」を支えるクラウドプラットフォームです。デジタルワーカーは画面を操作し、ボタンをクリックしたり、フォームに入力したり、API統合なしで、既に使用しているアプリを通じて長いワークフローを実行できます。このプロジェクトはドイツで開発されており、クローズドベータテスト中ですが、既に数千件の応募が待機リストに登録されています。

ここ数十年で、私たちはコマンドを入力することからアイコンをタップするようになりました。今では、コンピューターはもはや待つのではなく、動作を開始するようになりました。 ウォームウィンドOS オペレーティングシステムの考え方をクラウドに拡張します。ユーザーインターフェースを見て理解し、マウスとキーボードを使用して「メールに返信する」から「レポートを作成して送信する」まで、目的を実行するAIです。 PDFこれは魔法ではなく、カスタマイズされた Linux イメージからグラフィカル デスクトップをブラウザーにストリーミングし、タブを閉じてもすべてが実行されるのです。

写真: ウォームウィンド

Warmwind OS とは何でしょうか?

ウォームウィンドOS は、自律的なアプリケーション作業のためのクラウドネイティブプラットフォームです。実際には、デジタルアシスタントとして機能するAIエージェントを意味します。開発者がAPIや特別な統合を準備することなく、プログラムを起動し、画面を読み上げ、クリック、入力し、ツール間を移動します。全体がクラウドOSとして設計されており、ユーザーはブラウザでストリーミングされたデスクトップ画面を見ることができ、ロジックはサーバー側で実行されます。


チームによると、このシステムは自動化タスク向けに最適化されたカスタムLinuxディストリビューション上で動作し、ユーザーインターフェースはWaylandとVNCストリーミング(「ブラウザは単なるウィンドウ」)を介して提供される。ブラウザを閉じても、エージェントは動作を継続する。

写真: ウォームウィンド

仕組み:下はLinux、上はブラウザ

内部には、従来の「Web アプリケーション」よりも OS に近いスタックが存在します。

  • カスタマイズされたLinux サーバー上のプロセスと作業タスクを管理します。
  • ストリーミングGUI (Wayland + VNC) は、ブラウザに「ライブ」デスクトップを送信します。
  • ローカルインストールなし: すべてがクラウドで実行され、ブラウザは単なるビューアーです。
  • ビジュアルオートメーションAIはAPIの代わりに目(視覚)と手(マウス/キーボード)を使用します。

このアプローチは、APIが存在しない場合やAPIが高価な場合には本質的に堅牢ですが、インターフェースが頻繁に変更される場合は脆弱です。これは、ビジュアル自動化の永遠のトレードオフです。(これは、あらゆる「ルックアンドクリック」システムに共通する技術的な帰結であり、Warmwindの明確な約束ではありません。)

写真: ウォームウィンド

「ティーチングモード」:指示を求めるのではなく、何をすべきかを示す

Warmwindには学習モードがあり、タスクを一度デモンストレーションします。エージェントが「見ている」間に画面をクリックし、音声指示やコンテキストを追加します。システムはパターンを一般化するため、次回からは自動的に実行します。ページがわずかに変更された場合でも同様です。「書くのではなく、見せる」というコンセプトは、この製品の哲学の中心であり、デモ動画にも明確に示されています。

役立つ場所: 顧客サポートから人事 (さらには古い ERP) まで

最初のデモでは、チームは非常に多様なタスクを実演しました。エージェントが注文データを検索し、顧客への返信を作成する、LinkedInで採用ファネルを構築し、収集したすべてのデータをスプレッドシートに即座に入力する、インポートやエクスポート機能のない従来型の煩雑な不動産管理ソフトウェアを自動化するなどです。これらはすべて、WarmwindがAIを「認識」し、人間のように動作することで可能になります。ただし、手首を疲れさせることはありません。

OSなのか、それとも「ただの」Webアプリなのか? なぜ意図的に曖昧な名前になっているのでしょうか?

チーム自身も認めているように、これはノートパソコンに常駐する従来のOSではなく、クラウドOSであり、「ウェブアプリ」は現実のカスタマイズされた環境への窓に過ぎません。説明の中で、彼らはWarmwindを、OSの定義が新しい利用モデルへと拡張された近年の事例(例えばChromeOS)と比較しています。強調されているのは、機能が重要であるということです。つまり、自律的なデジタル作業のための包括的で耐久性のある作業レイヤーであるということです。

ChatGPT + Warmwind:頭脳と手

WarmwindはChatGPTと競合するのではなく、むしろその逆です。ChatGPTは「ライター兼リサーチャー」であり、Warmwindは「手と目」として、それらの情報をドキュメント、PDF、メール、投稿などの形式にまとめ、実際に配信します。あるシナリオでは、WarmwindはChatGPTを開き、コンテンツのコピーを取得し、レポートを作成し、指定した時間に送信します。

ビジネス、プライバシー、原産地:ドイツ製

ウォームウィンドが開発 エヴァAG イエナから。2年間の開発を経て、同社は「ステルス」段階から クローズドベータ終わりました。 150万シード (bm-t Beteiligungsmanagement Thüringen、BRT Ventures、個人投資家)であり、 12.000 利害関係者。システムは ドイツのインフラ、目指す GDPRコンプライアンス チームによれば、外部APIに依存せず、必要に応じて実行できるとのことだ。 オンプレミスチーム(約10人)はベータテストを拡大する予定です。

写真: ウォームウィンド

Warmwind は RPA ツールとどう違うのでしょうか?

従来のRPA(ロボティック・プロセス・オートメーション)は脆弱性を抱えがちです。UIが変更されると、ボットがクラッシュします。Warmwindは、厳密に記録されたスクリプトではなく、UI要素を「見て」推論するモデルを使用しているため、少なくともデモとアーキテクチャの説明によると、小さな変更にも容易に対応できます。もう一つの違いは、Warmwindが 持続可能なクラウドOSは、複数の「従業員」を同時に実行し、Google Docs、Excel、Slack から Canva、SAP、Salesforce までのプログラムを使用できます。

制限事項と未解決の問題(今後監視します)

  • ビジュアル自動化の信頼性: エージェントは主要な UI の変更にどの程度耐えられるでしょうか?
  • セキュリティとアクセス管理: 会社のアカウントの鍵を持っているのは誰ですか? 監査証跡はどのように維持されますか?
  • コストとパフォーマンス: 小規模なチームでは現実的に何人の「クラウド従業員」を雇うことができるでしょうか?
  • 「OS」メタファーの限界: 長期的には、このタイプのシステムを OS、マネージド サービス、あるいは何か他のものとして扱うことになるのでしょうか?

 

結論:「AI向けOS」は単なる流行語ではなく、新たなオペレーティングレイヤーである

ウォームウィンドOS ノートパソコンの代わりになるものではありません。最も反復的な作業時間を代替するものです。このプラットフォームが動画やブログで謳われている通り、実際に堅牢であれば、コンピューティングの新たなレイヤー、つまりアプリケーション間で連携するOSが生まれるでしょう。今のところは、クローズドベータ版、明確なビジョン、そして堅牢なクラウド実装です。特にExcel、メール、CRMを多用するチームにとって、今後の動向に注目する価値があります。

詳しくは

warmwind.space

2004 年からあなたとともに

年から 2004 私たちは都市のトレンドをリサーチし、情熱を刺激するライフスタイル、旅行、スタイル、製品の最新情報をフォロワーのコミュニティに毎日お知らせします。 2023 年からは、世界の主要言語でコンテンツを提供します。