SousQ, surnommé « le caméléon de l'IA », publie la version 1.1 : invite des évaluateurs tiers pour se prouver, mais est accusé d'inclure des phrases toutes faites d'IA

robot
Création du résumé en cours
Selon le suivi Beating, qui surveille les activités, le modèle controversé SubQ, qui prétend pouvoir réduire la consommation de calcul de mille fois, a publié un rapport technique de la version 1.1 Small (petits paramètres).

En réponse aux accusations selon lesquelles la version préliminaire manquait de publications académiques et de vérifications indépendantes, et était moquée par la communauté comme un « remède universel pour l'IA » (sous-entendant une publicité mensongère), la société de développement Subquadratic, en collaboration avec l’évaluateur tiers Appen, a mené une évaluation tripartite, affirmant que le modèle atteignait un taux de précision de 98 % dans la recherche sur une longueur limite de 12 millions de tokens, et obtenait des résultats proches des modèles de pointe en programmation pratique. Le rapport technique révèle également que le modèle n’a pas été entraîné à partir de zéro, mais qu’il a été modifié en remplaçant le mécanisme d’attention et en entraînant de manière incrémentielle sur 1 billion de tokens, à partir d’un modèle de pointe open source.

Même si une évaluation tierce a été menée pour prouver la validité, la communauté des développeurs reste sceptique face à cette mise à jour. Certains chercheurs soulignent que cette soi-disant technologie révolutionnaire ne comporte en réalité aucune avancée technique fondamentale, se limitant essentiellement à une technique existante consistant à diviser de longs textes en petits morceaux et à effectuer une sélection dynamique (c’est-à-dire la mécanisme d’attention par blocs clairsemés). D’autres lecteurs se plaignent que le rapport technique contient des phrases générées par IA (particulièrement évidentes dans la section 5.7.1). Les ingénieurs système mettent en garde que le mécanisme de filtrage pourrait entraîner des coûts supplémentaires de gestion lors d’une utilisation par plusieurs personnes simultanément, provoquant de graves ralentissements pour le 1 % des utilisateurs les plus lents.

Étant donné que le modèle ne publie pas ses paramètres principaux pour téléchargement ni ne propose une API accessible à tous, la promesse de réduction de calcul et de prix ultra-bas reste pour l’instant purement théorique.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé