fbpx

Cette semaine en intelligence artificielle #15/2025 : Quand Meta s'est effondré, Claude a gagné et OpenAI a enfin ouvert ses portes

Le Llama 4 qui n'a jamais existé, Claude Max pour l'élite et Copilot comme collaborateur du futur

Ta teden v umetni inteligenci
Photo : Jan Macarol / Ai art

Drame explosif chez Meta, transparence choquante chez OpenAI et développements qui nous placent à quelques mois de l'AGI. Alors, cette semaine, place à l'intelligence artificielle.

Si vous avez manqué l’actualité de l’IA cette semaine, laissez-nous vous dire une seule chose : menthe elle s'agenouille (à nouveau), Claude devient le chef du bureau, OpenAI adopte enfin l'open source, et Google développe sa vision d'un super assistant artificiel capable de monter des vidéos mieux que vous. Et ce n’est pas une blague. Cette semaine, c'est l'intelligence artificielle - numéro 15.

#15 cette semaine en intelligence artificielle :
Meta et le désastre de Llama 4

Llama 4 était censé être le joyau de la couronne du développement de l'IA de Meta, mais le résultat final est une déception. Le modèle qui a été présenté au public n’est pas celui qui a participé aux benchmarks et qui a impressionné. C'est le professeur Ethan Mollick qui l'a remarqué en premier, en confirmant que les résultats du modèle publié dans LLM-arena ne correspondaient pas à ceux obtenus par la version publique. (source : x.com/ethanmollick)

Des publications sont ensuite apparues sur Reddit, rédigées par d'anciens employés de Meta, aujourd'hui employés chez OpenAI, qui se sont ouvertement distanciés de Llama 4. L'un d'eux a écrit sur son profil : « Llama 2 et Llama 3, Llama 4 ? Je n'y suis pour rien. » (source : reddit.com)

De plus, des informations ont émergé selon lesquelles un remaniement interne au sein de la division IA de Meta a été déclenché lorsqu'ils ont été dépassés dans les benchmarks par un modèle chinois inconnu et à petit budget, le DeepSeek V3. Pour une entreprise qui investit des milliards dans le développement de l’intelligence artificielle, ce n’est pas une mince affaire.

Claude Max et les prédictions sur Claude 4

Anthropic surprend avec un nouveau service cette semaine Claude Max – une formule d’abonnement pour les utilisateurs exigeants, offrant un quota d’interaction cinq à vingt fois supérieur, un accès prioritaire aux derniers modèles et fonctionnalités. (source : anthropic.com)

Pendant ce temps, Jared Kaplan, scientifique en chef chez Anthropic, a annoncé que nous verrons Claude 4 dans les six prochains mois. Selon lui, le développement des modèles d’IA se produit plus rapidement que le développement du matériel, principalement en raison de l’accélération de la post-formation et des améliorations de l’apprentissage par renforcement. L’une des nouvelles subtiles mais majeures de cette semaine en matière d’intelligence artificielle.

OpenAI annonce enfin son modèle open source

Après des années de critiques pour manque de transparence et d'éloignement de sa mission initiale, Sam Altman a annoncé qu'OpenAI publierait bientôt un modèle open source qui surpassera toutes les alternatives existantes. (source : openai.com)

De plus, ChatGPT dispose désormais d'une mémoire à long terme, ce qui permet d'utiliser les interactions passées pour personnaliser les expériences et permet à l'utilisateur de faire en sorte que l'IA suive activement ses objectifs et le guide à travers les incompatibilités dans les schémas de pensée.

Mais tout n'est pas si rose : tests de sécurité abrégés chez OpenAI

Financial Times a révélé qu'OpenAI a considérablement réduit le temps et la portée des tests de sécurité de ses modèles. Au lieu de plusieurs semaines, ils ne disposent désormais que de quelques jours, ce qui suscite des inquiétudes quant à la possibilité que des modèles contenant des vulnérabilités non découvertes soient publiés publiquement. Un ancien ingénieur de test a déclaré au FT que les dangers du GPT-4 ont été découverts seulement deux mois après sa sortie. (source : ft.com)

La raison serait simple : la pression concurrentielle. Les entreprises se précipitent pour introduire de nouveaux modèles afin de ne pas prendre de retard. Et même si ces outils sont les plus puissants de notre époque, la sécurité est reléguée au second plan.

DeepCode 14B : un concurrent open source d'OpenAI

DeepSeek et Aentica présentés DeepCode 14B, un modèle open source pour générer du code logiciel. Avec seulement 14 milliards de paramètres, il obtient des résultats comparables aux modèles commerciaux GPT-3.5. Ils l'ont formé avec plus de 24 000 tâches uniques et ont utilisé la méthode GRPO+, qui récompense le modèle uniquement pour une solution parfaite. (source : github.com/aentica)

BrowseComp : une nouvelle ligue pour les agents IA

OpenAI a introduit BrowseComp, une référence pour les agents d'IA capables de parcourir efficacement le Web et de rechercher des informations complexes. Il est destiné à tester des modèles qui doivent parcourir des dizaines de pages pour accéder aux informations pertinentes. (source : github.com/openai/simple-evals)

Google mène le jeu

Google dévoile ses plans de fusion Gémeaux et Vio modèles – compréhension textuelle, imagée et audio avec génération vidéo. Leur objectif est de créer un super assistant multimodal qui comprend le monde comme nous. (source : googlecloudnext.com)

De plus, Google a présenté une nouvelle génération de puces d’IA TPU Ironwood, qui est 3600 fois plus puissant que la première génération de 2018. Cela leur permet de former des modèles plus grands et de les exécuter plus rapidement sans dépendre de Nvidia.

Microsoft Copilot devient un concurrent sérieux

Microsoft Copilote Il dispose d'une interface repensée, de fonctionnalités de recherche d'appartement, d'une aide à la rédaction de lettres et même de capacités d'édition d'images. Il agit comme un assistant personnel en temps réel, avec accès à l'écran et au contexte. (source : microsoft.com)

Mustafa Suleyman, directeur de Microsoft AI, estime que l'AGI pourrait être là d'ici cinq ans, même s'il reconnaît que les problèmes de base – tels que les hallucinations et le faible suivi des instructions – n'ont pas encore été résolus.

Midjourney v7 : des images époustouflantes, mais toujours pas de texte

Midjourney a publié la septième génération de son modèle d'imagerie, qui impressionne par son hyperréalisme. Cependant, la génération de texte est encore loin derrière, comme ils l'admettent eux-mêmes : les utilisateurs l'utilisent à peine, ce n'est donc pas une priorité. (source : midjourney.com)

Le robot Neo travaille en direct

Plateforme robotique 1X Néo a montré qu'elle pouvait effectuer des tâches en direct de manière autonome. Il ne s’agit pas simplement d’un autre coup de pub ; le robot se déplaçait, nettoyait, fonctionnait sans scripts. Sa conception comprend des muscles artificiels et une mobilité qui lui permet de coexister en toute sécurité avec les humains. (source : 1x.tech)

Un scientifique spécialisé en IA écrit son premier article professionnel

Sakana AI Labs a annoncé que son modèle a rédigé le premier article scientifique ayant passé avec succès l'examen par les pairs lors d'un atelier. L’IA a formulé une hypothèse, analysé les données et tiré des conclusions – sans assistance humaine. (source : sakana.ai)


Conclusion

En seulement une semaine, nous avons assisté à l’effondrement de la vision de Meta, à l’accélération des modèles open source, à des tendances dangereuses dans les tests de sécurité et à une nouvelle génération d’agents multimodaux. Le monde de l’intelligence artificielle n’évolue pas seulement rapidement – il évolue dans une direction qui semblait relever de la science-fiction il y a à peine un an.

La semaine prochaine promet encore plus. Si vous manquez quelque chose, nous serons là. Tous les lundis.

Avec vous depuis 2004

De l'année 2004 nous recherchons les tendances urbaines et informons quotidiennement notre communauté d'adeptes des dernières nouveautés en matière de style de vie, de voyage, de style et de produits qui inspirent avec passion. À partir de 2023, nous proposons du contenu dans les principales langues mondiales.