Un module d'IA suspect et "sans nom" est apparu sur le réseau, qui pourrait être lié au projet DeepSeek

Un module d'IA suspect et "sans nom" est apparu sur le réseau, qui pourrait être lié au projet DeepSeek

9 hardware

Hunter Alpha – modèle mystérieux suscitant des soupçons sur DeepSeek

Un nouveau modèle d’IA apparu sur la plateforme OpenRouter sans auteur indiqué a rapidement attiré l’attention des journalistes et des chercheurs. Le 11 mars, il a été publié sous le nom de « Hunter Alpha » puis marqué par la plateforme elle‑même comme un « modèle caché », renforçant les rumeurs selon lesquelles le start-up chinois DeepSeek pourrait tester discrètement sa prochaine génération d’IA avant la sortie officielle.

Ce que disent les experts
* Reuters a mené une série de tests avec le chatbot Hunter Alpha.

- Le bot se décrivait lui‑même comme « un modèle chinois entraîné principalement en langue chinoise ».

- Il indiquait que ses données d’entraînement couvrent la période jusqu’en mai 2025 – date identique à celle mentionnée par le propre chatbot de DeepSeek.

- À la question sur son créateur, il n’a répondu qu’ : « je connais mon nom, le nombre de paramètres et la longueur de la fenêtre contextuelle ». Ni DeepSeek ni OpenRouter n’ont révélé l’auteur.

Caractéristiques techniques
* 1 trillion de paramètres – indique des exigences informatiques énormes.

* Fenêtre contextuelle jusqu’à 1 million de tokens – permet de traiter d’énormes volumes de texte en une seule session.

Nabil Haouam, ingénieur en agents IA, a noté que la combinaison d’une fenêtre aussi grande et du raisonnement logique avec un accès gratuit attire immédiatement l’œil ; les modèles similaires exigent généralement des coûts élevés.

Lien avec DeepSeek V4
* Le même ensemble de paramètres (1 trillion) et la fenêtre contextuelle (1 million de tokens) correspond à ce qui est annoncé pour le modèle à venir DeepSeek V4, prévu en avril.

* Cette concordance a suscité une vague d’hypothèses selon lesquelles Hunter Alpha pourrait être une version test précoce du futur produit.

Analyse du raisonnement logique
* Daniel Dewhurst a analysé les motifs de la chaîne de raisonnement et conclu que le style des constructions logiques dans le bot est difficile à falsifier ; il reflète généralement la méthode d’entraînement du modèle.

Cependant, tout le monde n’est pas d’accord avec cette conclusion.

Opinion indépendante
* Umur Ozkul a réalisé un benchmark indépendant et a conclu que Hunter Alpha est très probablement pas DeepSeek V4.

- Il a présenté des différences de comportement des tokens et des motifs architecturaux par rapport aux systèmes DeepSeek déjà existants.

Popularité du modèle
* Selon OpenRouter, le dimanche dernier le modèle a traité plus de 160 milliards de tokens.

* La majorité des requêtes provenaient d’outils de développement et de frameworks pour agents IA.

Lancer anonymement des modèles n’est pas rare : de nombreux développeurs utilisent cette approche pour obtenir un retour objectif de la communauté avant la sortie officielle.

Commentaires (0)

Partagez votre avis — merci de rester courtois et dans le sujet.

Pas encore de commentaires. Laissez un commentaire et partagez votre avis !

Pour laisser un commentaire, connectez-vous.

Connectez-vous pour commenter