“T-Bank”將LLM的320億參數發佈到公開領域

“T-bank”將32億個LLM參數公開

“T Bank”開放了兩個大型語言模型(LLM)T-Pro和更新版本的T-Lite。《Vedomosti》援引該銀行的代表報道。

專業版神經網絡具有32億參數,T-Lite具有7億參數。第二個在2024年7月發佈。

參數數量反映了模型考慮更多上下文、更好地記住信息並給出準確答案的能力。舉例來說,Meta 405的Llama 3.1擁有405億個參數,法國初創公司Mistral的Large 2擁有123億個參數。 請輸入要翻譯的文本。 對T-Pro和T-Lite的開放訪問將使企業能夠免費使用神經網絡解決內部問題並基於開發的模型創建新產品。例如,《Vedomosti》提供了智能客服機器人和員工助手,例如編寫代碼工具、撰寫報告或研究。

所展示的模型屬於LLM Gen-T系列,旨在解決特定領域的問題。這使它們與通用的ChatGPT有所不同。

T-Lite和T-Pro是基於中國開發者阿里巴巴集團的Qwen-2.5開發的,並針對俄語進行了適配。

“這種方法使得‘T-技術’能夠將大型語言模型的創建成本大幅降低 — 比那些從零開始訓練模型的公司降低了80–90%。與此同時,LLM產品的質量在俄語領域優於OpenAI、Google和Anthropic基於開放和專有模型的解決方案”,銀行代表指出。

企業可以在自己的服務器上運行語言模型並根據具體情況進行再訓練,Dbrain首席執行官Alexei Khakhunov強調。

在俄羅斯,提供了一個基於AI的虛擬助手給心理學家,可以提高生產力、服務質量和收入的兩倍。

同月,俄羅斯科學家推出了一款名為XLand-MiniGrid的新開放環境,旨在用於開發強化學習算法的上下文學習,這是人工智能研究的一個獨立方向。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)