「T-バンク」は32億のパラメータを公開しました

#「T-банк」は32億のLLMパラメータをオープンに公開しました

「T銀行」は、T-Proと更新されたT-Liteの2つの大規模な言語モデル(LLM)へのアクセスを提供しました。これについては、同銀行の代表者が「ヴェドモスチ」に言及しています。

プロフェッショナルバージョンのニューラルネットワークには32億のパラメータがあり、T-Liteには7億のパラメータがあります。2番目のものは2024年7月に発表されました テキストが空です パラメータの数は、モデルがより多くのコンテキストを考慮し、情報をより良く記憶し、正確な回答を提供する能力を反映しています。比較のために、Llama 3.1 405B by Metaには4050億のパラメータがあり、フランスのスタートアップMistralのLarge 2には1230億のパラメータがあります。

T-ProやT-Liteへのオープンアクセスは、企業が内部タスクを解決し、開発されたモデルに基づいて新製品を作成するために、無料でニューラルネットワークを適用することを可能にします。「Vedomosti」の例では、サポートサービス用のスマートチャットボットや、コードの執筆、レポート作成、研究など、従業員向けのアシスタントが引用されています。

提供されたモデルは、特定の任務を解決するために設計されたLLM Gen-Tファミリーに属しています。これにより、彼らは汎用のChatGPTとは異なります。

T-Lite と T-Pro は、中国の開発者 Alibaba Group の Qwen-2.5 に基づいており、ロシア語に適合しています。

このアプローチは、「Tテクノロジー」が大規模な言語モデルを作成するための費用を80〜90%削減できるようにし、ゼロから学習する企業と比較して、ロシア語のLLM製品の解決策の品質はOpenAI、Google、Anthropicのオープンおよびプロプライエタリモデルに基づく解決策を上回ると、銀行の代表者は述べた。

ビジネスは、CEOであるDbrainのアレクセイ・ハフーノフ氏が指摘するように、独自のサーバー上で言語モデルを展開し、特定のケースに合わせて追加学習することができます。 テキストが入力されていません ロシアでは、12月に、心理学者向けのAIベースのバーチャルアシスタントが導入され、サービスの生産性、品質、収益が2倍に向上していることをご存知でしょうか。

その同じ月、ロシアの科学者たちは、強化学習アルゴリズムの開発に適した新しいオープンソース環境XLand-MiniGridを発表しました。これはAI研究の一環です。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)