FBピクセル

今週の人工知能 #15/2025: Metaが崩壊し、Claudeが勝利し、OpenAIがついにその扉を開いた

実現しなかったラマ4、エリートのためのクロード・マックス、そして未来の協力者としてのコパイロット

Ta teden v umetni inteligenci
写真: ジャン・マカロル / Ai art

Meta での爆発的なドラマ、OpenAI での衝撃的な透明性、そして AGI まであと数か月という開発状況。ということで、今週の人工知能について。

今週の AI ニュースを見逃した方に、一つだけお伝えしておきます。 ミント 彼女は(再び)ひざまずき、クロードは事務所の長となり、 OpenAI Google はついにオープンソースを採用し、人間よりも優れたビデオ編集ができる人工スーパーアシスタントのビジョンを開発しています。これは冗談ではありません。今週の人工知能 – 第 15 号です。

今週の人工知能#15:
メタとラマ4の惨事

Llama 4 は Meta の AI 開発の最高傑作となるはずだったが、最終結果は残念なものとなった。公開されたモデルは、ベンチマークに参加して感銘を受けたモデルではありません。これに最初に気づいたのはイーサン・モリック教授で、同教授は LLM-arena で公開されたモデルの結果が公開バージョンで達成されたものと一致しないことを確認しました。 (出典:x.com/ethanmollick)

その後、現在OpenAIで働く、Metaの元従業員による投稿がRedditに現れ、Llama 4とは公然と距離を置いていた。そのうちの1人は自身のプロフィールにこう記していた。「Llama 2とLlama 3、Llama 4?私は全く関係ありません」 (出典:reddit.com)

さらに、Meta の AI 部門での内部再編は、ベンチマークで無名かつ低予算の中国製モデルである DeepSeek V3 に追い抜かれたことがきっかけとなったという情報も出ている。人工知能の開発に数十億ドルを投資している企業にとって、これは決して小さな成果ではない。

クロード・マックスとクロード4についての予測

アントロピックは今週、新たなサービスで驚かせた クロード・マックス – 要求の厳しいユーザー向けのサブスクリプション プランで、インタラクション クォータの 5 ~ 20 倍、最新モデルや機能への優先アクセスを提供します。 (出典:anthropic.com)

一方、アントロピック社の主任科学者ジャレッド・カプラン氏は、クロード4号は今後6か月以内に打ち上げられると発表した。同氏によると、AI モデルの開発は、主にポストトレーニングの加速と強化学習の改善により、ハードウェアの開発よりも速く進んでいるという。今週の人工知能に関する、さりげなくも大きなニュースのひとつ。

OpenAIがついにオープンソースモデルを発表

透明性の欠如と当初の使命からの乖離について長年にわたり批判されてきたが、サム・アルトマン氏は、OpenAIがまもなく既存のあらゆる代替モデルを上回るオープンソースモデルをリリースすると発表した。 (出典:openai.com)

さらに、ChatGPT には長期記憶機能が搭載され、過去のやり取りを利用してエクスペリエンスをパーソナライズできるようになり、ユーザーは AI に自分の目標を積極的に追跡させ、思考パターンの不一致をガイドしてもらうことができます。

しかし、すべてがバラ色というわけではない:OpenAIの短縮されたセキュリティテスト

フィナンシャル・タイムズ OpenAIがモデルのセキュリティテストの時間と範囲を大幅に削減したことを明らかにした。数週間ではなく、今ではわずか数日しか残されておらず、未発見の脆弱性を持つモデルが公開される可能性があるという懸念が生じている。元テストエンジニアはFTに対し、GPT-4の危険性はリリースからわずか2か月後に発見されたと語った。 (出典:ft.com)

理由は単純で、競争圧力だと言われています。企業は遅れを取らないように新モデルの導入を急いでいる。これらは現代の最も強力なツールであるにもかかわらず、セキュリティは軽視されつつあります。

DeepCode 14B: OpenAIのオープンソースの競合

DeepSeekとAenticaが発表 ディープコード 14Bソフトウェア コードを生成するためのオープン ソース モデル。わずか 140 億のパラメータで、商用の GPT-3.5 モデルに匹敵する結果を実現します。彼らは 24,000 以上の独自のタスクでモデルをトレーニングし、完璧な解決策に対してのみモデルに報酬を与える GRPO+ メソッドを使用しました。 (出典: github.com/aentica)

BrowseComp: AIエージェントのための新しいリーグ

OpenAIは ブラウズコンプは、Web を効率的に閲覧し、複雑な情報を検索できる AI エージェントのベンチマークです。これは、関連情報に到達するために数十ページを参照する必要があるモデルをテストするためのものです。 (出典:github.com/openai/simple-evals)

Googleがリード

グーグルが合併計画を発表 ジェミニヴィオ モデル - ビデオ生成によるテキスト、画像、音声の理解。彼らの目標は、私たちと同じように世界を理解するマルチモーダルなスーパーアシスタントを作成することです。 (出典:googlecloudnext.com)

さらに、Googleは新世代のAIチップを導入した。 TPUアイアンウッドこれは、2018 年の第 1 世代と比べて 3600 倍の性能です。これにより、Nvidia に依存せずに、より大きなモデルをトレーニングし、より高速に実行できるようになります。

Microsoft Copilotは強力な競争相手になりつつある

マイクロソフトの 副操縦士 再設計されたインターフェース、アパート検索機能、手紙の書き方のヘルプ、さらには画像編集機能も備えています。画面とコンテキストにアクセスできるリアルタイムのパーソナル アシスタントとして機能します。 (出典:microsoft.com)

マイクロソフトのAI部門責任者ムスタファ・スレイマン氏は、幻覚や指示の不遵守といった基本的な問題がまだ解決されていないことを認めながらも、AGIは5年以内に実現する可能性があると考えている。

Midjourney v7: 画像は素晴らしいが、テキストはまだない

Midjourney は、ハイパーリアリズムで感動を与えるイメージング モデルの第 7 世代をリリースしました。しかし、テキスト生成は彼ら自身も認めているように、まだ大きく遅れをとっています。ユーザーがほとんど使用していないため、優先事項ではありません。 (出典:midjourney.com)

ライブで働くネオロボット

ロボットプラットフォーム 1X ネオ 彼女はライブタスクを独立して実行できることを示しました。これは単なる PR 活動ではありません。ロボットはスクリプトなしで移動し、掃除し、操作しました。人間と安全に共存できるように、人工筋肉と可動性を備えた設計になっています。 (出典:1x.tech)

AI科学者が初の専門論文を執筆

Sakana AI Labsは、自社のモデルがワークショップで査読を通過した初の科学論文を執筆したと発表した。 AIは人間の支援なしに仮説を立て、データを分析し、結論を導き出しました。 (出典:sakana.ai)


結論

わずか 1 週間で、Meta のビジョンの崩壊、オープンソース モデルの加速、セキュリティ テストの危険な傾向、そして新世代のマルチモーダル エージェントの登場を目にしました。人工知能の世界は急速に進化しているだけでなく、わずか1年前にはSFのように思えた方向に進化しています。

来週はさらに多くのことが期待されます。何か見逃したら、私たちがここにいます。毎週月曜日。

2004 年からあなたとともに

年から 2004 私たちは都市のトレンドをリサーチし、情熱を刺激するライフスタイル、旅行、スタイル、製品の最新情報をフォロワーのコミュニティに毎日お知らせします。 2023 年からは、世界の主要言語でコンテンツを提供します。