“T-Bank”将LLM的320亿参数发布到公开领域

“T-bank”将32亿个LLM参数公开

“T Bank”开放了两个大型语言模型(LLM)T-Pro和更新版本的T-Lite。《Vedomosti》援引该银行的代表报道。

专业版神经网络具有32亿参数,T-Lite具有7亿参数。第二个在2024年7月发布。

参数数量反映了模型考虑更多上下文、更好地记住信息并给出准确答案的能力。举例来说,Meta 405的Llama 3.1拥有405亿个参数,法国初创公司Mistral的Large 2拥有123亿个参数。 请输入要翻译的文本。 对T-Pro和T-Lite的开放访问将使企业能够免费使用神经网络解决内部问题并基于开发的模型创建新产品。例如,《Vedomosti》提供了智能客服机器人和员工助手,例如编写代码工具、撰写报告或研究。

所展示的模型属于LLM Gen-T系列,旨在解决特定领域的问题。这使它们与通用的ChatGPT有所不同。

T-Lite和T-Pro是基于中国开发者阿里巴巴集团的Qwen-2.5开发的,并针对俄语进行了适配。

“这种方法使得‘T-技术’能够将大型语言模型的创建成本大幅降低 — 比那些从零开始训练模型的公司降低了80–90%。与此同时,LLM产品的质量在俄语领域优于OpenAI、Google和Anthropic基于开放和专有模型的解决方案”,银行代表指出。

企业可以在自己的服务器上运行语言模型并根据具体情况进行再训练,Dbrain首席执行官Alexei Khakhunov强调。

在俄罗斯,提供了一个基于AI的虚拟助手给心理学家,可以提高生产力、服务质量和收入的两倍。

同月,俄罗斯科学家推出了一款名为XLand-MiniGrid的新开放环境,旨在用于开发强化学习算法的上下文学习,这是人工智能研究的一个独立方向。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)