"T-Bank" melepaskan LLM sebanyak 32 miliar parameter ke akses terbuka

"T-bank" memposting LLM dengan 32 miliar parameter ke akses terbuka

"T-Bank" telah membuka akses ke dua model bahasa besar (LLM) T-Pro dan versi terbaru T-Lite. Ini dilaporkan oleh "Vedomosti" dengan mengutip perwakilan bank.

Versi profesional dari jaringan saraf memiliki 32 miliar parameter, T-Lite - 7 miliar. Yang kedua diperkenalkan pada Juli 2024. Masukan teks sumber yang ingin Anda terjemahkan Jumlah parameter mencerminkan kemampuan model untuk mempertimbangkan konteks yang lebih luas, mengingat informasi dengan lebih baik, dan memberikan jawaban yang akurat. Sebagai perbandingan, Llama 3.1 405B dari Meta memiliki 405 miliar parameter, sementara Large 2 dari startup Prancis Mistral memiliki 123 miliar.

Akses terbuka ke T-Pro dan T-Lite akan memungkinkan bisnis untuk menggunakan jaringan saraf secara gratis untuk memecahkan masalah internal dan menciptakan produk baru berdasarkan model yang dikembangkan. Sebagai contoh, Vedomosti mengutip chatbots pintar untuk help desk dan asisten untuk karyawan, seperti alat untuk menulis kode, menyusun laporan, atau penelitian.

Model-model yang disajikan termasuk dalam keluarga LLM Gen-T, yang dirancang untuk menyelesaikan tugas-tugas yang sangat spesifik. Ini berbeda dengan ChatGPT yang serba guna.

T-Lite dan T-Pro dibangun di atas Qwen-2.5 dari pengembang Tiongkok Alibaba Group dan diadaptasi untuk bahasa Rusia.

Teks sumber tidak boleh kosong

"pendekatan ini memungkinkan 'T-tek' untuk mengurangi biaya pembuatan model bahasa besar secara signifikan - sebesar 80-90% dibandingkan dengan perusahaan yang melatihnya dari awal. Namun, kualitas produk LLM dalam bahasa Rusia lebih unggul daripada solusi yang didasarkan pada model terbuka dan propietari dari OpenAI, Google, dan Anthropic," kata perwakilan bank.

Teks sumber tidak boleh kosong. Bisnis dapat meluncurkan model bahasa di server mereka sendiri dan melatih ulang untuk kasus tertentu, CEO Dbrain Alexei Khakhunov menekankan.

Ingat, pada bulan Desember di Rusia, asisten virtual berbasis AI untuk psikolog telah diperkenalkan, yang meningkatkan produktivitas, kualitas layanan, dan pendapatan dua kali lipat. Russian text is empty Pada bulan yang sama, para ilmuwan Rusia memperkenalkan lingkungan terbuka baru XLand-MiniGrid yang ditujukan untuk pengembangan algoritma pembelajaran penguatan kontekstual - sebuah bidang terpisah dalam penelitian kecerdasan buatan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)