La banque T a mis à la disposition du public LLM sur 32 milliards de paramètres.

«T-Bank» a mis à la disposition publique LLM sur 32 milliards de paramètres

T-Bank a ouvert l’accès à deux grands modèles de langage (LLM) : T-Pro et une version mise à jour de T-Lite. C’est ce que rapporte Vedomosti en se référant à un représentant de la banque. Le texte source est vide. La version professionnelle du réseau neuronal a 32 milliards de paramètres, T-Lite en a 7 milliards. Le deuxième a été présenté en juillet 2024.

Le nombre de paramètres reflète la capacité du modèle à prendre en compte plus de contexte, à mieux mémoriser les informations et à fournir des réponses précises. À titre de comparaison, Llama 3.1 405B de Meta a 405 milliards de paramètres, et Large 2 de la startup française Mistral en a 123 milliards.

L'accès ouvert à T-Pro et T-Lite permettra aux entreprises d'utiliser gratuitement des réseaux neuronaux pour résoudre des tâches internes et créer de nouveaux produits basés sur les modèles développés. Par exemple, dans Vedomosti, des chatbots intelligents ont été mentionnés pour le support client et les assistants pour les employés, tels que des outils de codage, de reporting ou de recherche.

Les modèles présentés font partie de la famille LLM Gen-T, conçue pour résoudre des tâches hautement spécialisées. Cela les différencie de ChatGPT, qui est universel.

T-Lite et T-Pro sont basés sur Qwen-2.5 du développeur chinois Alibaba Group et adaptés en russe. Le texte source est vide Veuillez fournir le texte source à traduire.

«Cette approche permet aux « T-technologies » de réduire considérablement les coûts de création de grands modèles linguistiques - de 80 à 90 % par rapport aux entreprises qui les forment à partir de zéro. Dans le même temps, la qualité des produits LLM en russe dépasse les solutions basées sur des modèles ouverts et propriétaires d'OpenAI, de Google et d'Anthropic», a souligné un représentant de la banque.

Les entreprises peuvent exécuter des modèles linguistiques sur leurs propres serveurs et les affiner pour des cas d'utilisation spécifiques, a souligné le PDG de Dbrain, Alexei Khakhunov.

Rappelons qu'en décembre, un assistant virtuel basé sur l'IA a été présenté en Russie pour les psychologues, ce qui augmente la productivité, la qualité des services et les revenus de 2 fois.

Le même mois, des scientifiques russes ont présenté un nouvel environnement ouvert, XLand-MiniGrid, conçu pour le développement d'algorithmes d'apprentissage par renforcement contextuel - une direction distincte dans la recherche en IA.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)