Google a lancé Gemini 3 Deep Think – un service d’IA avancé pour les tâches scientifiques qui continue à « ajuster » ses réponses aux requêtes.

Google a lancé Gemini 3 Deep Think – un service d’IA avancé pour les tâches scientifiques qui continue à « ajuster » ses réponses aux requêtes.

9 software

Google a présenté une version mise à jour de Gemini 3 Deep Think

La société Google a annoncé une importante mise à jour de sa plateforme Gemini 3 Deep Think – une intelligence artificielle capable de raisonnement et de résolution de tâches scientifiques et d'ingénierie complexes.

Ce qui a changé
Paramètre | Nouveau | Comment ça se présente | Objectif
---|---|---|---
Passer de la théorie pure à l’application pratique | Résoudre des problèmes sans contraintes claires, avec des données incomplètes | Accès intégré dans l'application Gemini | Les abonnés Google AI Ultra peuvent l’utiliser, et via l’API – les ingénieurs et entreprises (requête nécessaire)
Partenaires de développement | Chercheurs scientifiques | Collaboration sur des tâches complexes

Indicateurs de performance
Test | Résultat | Commentaire
---|---|---
Humanity’s Last Exam | 48,4 % | Sans outils tiers
ARC‑AGI‑284,6 % | Benchmark pour les assistants IA
Codeforces (Elo) | 3455 | Haut niveau parmi les solutions logicielles
IMO 2025 | Médaille d’or | Équivalent au niveau des participants à l’OLYMPIADE INTERNATIONALE
Histoire/Physique | Même résultat | Montre la polyvalence dans différentes disciplines
CMT‑Benchmark (physique théorique) | 50,5 % | Bonne maîtrise des concepts complexes

Agent IA «Aletheia»
Dans le laboratoire DeepMind de Google, ils ont créé l’agent Aletheia basé sur Gemini 3 Deep Think. Caractéristiques clés :

1. Vérification d’hypothèses – l'agent identifie les faiblesses dans les solutions proposées et les corrige itérativement.
2. Reconnaissance de l’incertitude – il peut indiquer qu’il ne connaît pas la réponse.
3. Interaction avec des sources externes – utilise le service de recherche Google et la navigation web, mais évite d’inventer des liens.

Niveaux d’accomplissement
Google a découpé les succès d’Aletheia en cinq étapes :

ÉtapeDescriptionExemples
0 – « petite nouveauté »Mode entièrement autonome, trois problèmes de P. Érdős résolus (premier niveau)Trois problèmes Érdős
1 – « minimalité de nouveauté »Un résultat supplémentaire en mode autonomeQuatrième problème
2 – « publication prête »Résultats autonomes et collaboratifs avec un humain, ainsi que des outils auxiliairesDonnées issues d’études 3–4
3–4 – « percée significative/éminente »Pas encore atteint

Comment Aletheia gère les problèmes Érdős
* Sur les 700 problèmes non résolus jusqu’à présent, l’agent a résolu 13.
* Cependant, seulement 4 d’entre eux sont réellement nouveaux – le reste est déjà connu dans la communauté scientifique.
* Parmi les 212 solutions soumises, seules 6,5 % étaient substantiellement correctes ; 68,5 % contenaient des erreurs fondamentales, et 31,5 % ont mal interprété la tâche.

Les développeurs soulignent que l’IA a tendance à « réinterpréter la question pour y répondre plus simplement », ce qui la rend « extrêmement sujette aux erreurs par rapport aux humains ». En fin de compte, il n’est pas encore possible de remplacer les mathématiciens par une IA.

En résumé : Gemini 3 Deep Think et son agent Aletheia démontrent des résultats impressionnants dans divers domaines scientifiques, mais conservent d’importantes limites en termes de précision et de fiabilité des solutions. Google continue à travailler sur l’amélioration de la capacité de l’IA à raisonner profondément et à vérifier ses propres conclusions.

Commentaires (0)

Partagez votre avis — merci de rester courtois et dans le sujet.

Pas encore de commentaires. Laissez un commentaire et partagez votre avis !

Pour laisser un commentaire, connectez-vous.

Connectez-vous pour commenter