Google a lancé Gemini 3 Deep Think – un service d’IA avancé pour les tâches scientifiques qui continue à « ajuster » ses réponses aux requêtes.
Google a présenté une version mise à jour de Gemini 3 Deep Think
La société Google a annoncé une importante mise à jour de sa plateforme Gemini 3 Deep Think – une intelligence artificielle capable de raisonnement et de résolution de tâches scientifiques et d'ingénierie complexes.
Ce qui a changé
Paramètre | Nouveau | Comment ça se présente | Objectif
---|---|---|---
Passer de la théorie pure à l’application pratique | Résoudre des problèmes sans contraintes claires, avec des données incomplètes | Accès intégré dans l'application Gemini | Les abonnés Google AI Ultra peuvent l’utiliser, et via l’API – les ingénieurs et entreprises (requête nécessaire)
Partenaires de développement | Chercheurs scientifiques | Collaboration sur des tâches complexes
Indicateurs de performance
Test | Résultat | Commentaire
---|---|---
Humanity’s Last Exam | 48,4 % | Sans outils tiers
ARC‑AGI‑284,6 % | Benchmark pour les assistants IA
Codeforces (Elo) | 3455 | Haut niveau parmi les solutions logicielles
IMO 2025 | Médaille d’or | Équivalent au niveau des participants à l’OLYMPIADE INTERNATIONALE
Histoire/Physique | Même résultat | Montre la polyvalence dans différentes disciplines
CMT‑Benchmark (physique théorique) | 50,5 % | Bonne maîtrise des concepts complexes
Agent IA «Aletheia»
Dans le laboratoire DeepMind de Google, ils ont créé l’agent Aletheia basé sur Gemini 3 Deep Think. Caractéristiques clés :
1. Vérification d’hypothèses – l'agent identifie les faiblesses dans les solutions proposées et les corrige itérativement.
2. Reconnaissance de l’incertitude – il peut indiquer qu’il ne connaît pas la réponse.
3. Interaction avec des sources externes – utilise le service de recherche Google et la navigation web, mais évite d’inventer des liens.
Niveaux d’accomplissement
Google a découpé les succès d’Aletheia en cinq étapes :
| Étape | Description | Exemples |
|---|---|---|
| 0 – « petite nouveauté » | Mode entièrement autonome, trois problèmes de P. Érdős résolus (premier niveau) | Trois problèmes Érdős |
| 1 – « minimalité de nouveauté » | Un résultat supplémentaire en mode autonome | Quatrième problème |
| 2 – « publication prête » | Résultats autonomes et collaboratifs avec un humain, ainsi que des outils auxiliaires | Données issues d’études 3–4 |
| 3–4 – « percée significative/éminente » | Pas encore atteint |
Comment Aletheia gère les problèmes Érdős
* Sur les 700 problèmes non résolus jusqu’à présent, l’agent a résolu 13.
* Cependant, seulement 4 d’entre eux sont réellement nouveaux – le reste est déjà connu dans la communauté scientifique.
* Parmi les 212 solutions soumises, seules 6,5 % étaient substantiellement correctes ; 68,5 % contenaient des erreurs fondamentales, et 31,5 % ont mal interprété la tâche.
Les développeurs soulignent que l’IA a tendance à « réinterpréter la question pour y répondre plus simplement », ce qui la rend « extrêmement sujette aux erreurs par rapport aux humains ». En fin de compte, il n’est pas encore possible de remplacer les mathématiciens par une IA.
En résumé : Gemini 3 Deep Think et son agent Aletheia démontrent des résultats impressionnants dans divers domaines scientifiques, mais conservent d’importantes limites en termes de précision et de fiabilité des solutions. Google continue à travailler sur l’amélioration de la capacité de l’IA à raisonner profondément et à vérifier ses propres conclusions.
Commentaires (0)
Partagez votre avis — merci de rester courtois et dans le sujet.
Connectez-vous pour commenter