O 'T-Bank' disponibilizou o LLM com 32 bilhões de parâmetros para acesso público
Por favor, forneça o texto de origem a ser traduzido.
O "T-Bank" abriu acesso a dois grandes modelos de linguagem (LLM) T-Pro e à versão atualizada do T-Lite. Isto é relatado pelo "Vedomosti" com referência a um representante do banco.
A versão profissional da rede neural tem 32 bilhões de parâmetros, o T-Lite - 7 bilhões. O segundo foi apresentado em julho de 2024
O número de parâmetros reflete a capacidade do modelo de levar em conta mais contexto, lembrar melhor das informações e fornecer respostas precisas. Para comparação, o Llama 3.1 405B da Meta tem 405 bilhões de parâmetros, enquanto o Large 2 da startup francesa Mistral tem 123 bilhões.
O acesso aberto ao T-Pro e T-Lite permitirá que as empresas usem redes neurais para resolver problemas internos e criar novos produtos com base em modelos desenvolvidos, de forma gratuita. Como exemplo, o 'Vedomosti' mencionou chatbots inteligentes para suporte ao cliente e assistentes para funcionários, como ferramentas para escrever código, compilar relatórios ou realizar pesquisas.
Os modelos apresentados fazem parte da família LLM Gen-T, projetados para lidar com tarefas altamente especializadas. Isso os diferencia do ChatGPT, que é mais universal.
T-Lite e T-Pro foram criados com base no Qwen-2.5 do desenvolvedor chinês Alibaba Group e foram adaptados para o idioma russo.
"Essa abordagem permite à "T-Technology" reduzir significativamente os custos de criação de grandes modelos de linguagem - em 80-90% em comparação com empresas que os treinam do zero. Ao mesmo tempo, a qualidade das soluções dos produtos LLM em russo supera as soluções baseadas em modelos abertos e proprietários da OpenAI, Google e Anthropic", observou um representante do banco.
Os negócios podem implantar modelos de linguagem em seus próprios servidores e refiná-los para casos específicos, destacou o CEO da Dbrain, Alexey Khakhunov.
Por favor, forneça o texto de origem a ser traduzido.
Lembramos que, em dezembro, na Rússia, foi apresentado um assistente virtual baseado em IA para psicólogos, que aumenta a produtividade, a qualidade dos serviços e a receita em dobro.
No mesmo mês, os cientistas russos apresentaram um novo ambiente aberto XLand-MiniGrid, projetado para desenvolver algoritmos de aprendizado contextual com reforço - uma área separada de pesquisa em IA.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
O 'T-Bank' disponibilizou LLM com 32 bilhões de parâmetros para acesso público
O 'T-Bank' disponibilizou o LLM com 32 bilhões de parâmetros para acesso público
Por favor, forneça o texto de origem a ser traduzido. O "T-Bank" abriu acesso a dois grandes modelos de linguagem (LLM) T-Pro e à versão atualizada do T-Lite. Isto é relatado pelo "Vedomosti" com referência a um representante do banco.
A versão profissional da rede neural tem 32 bilhões de parâmetros, o T-Lite - 7 bilhões. O segundo foi apresentado em julho de 2024
O número de parâmetros reflete a capacidade do modelo de levar em conta mais contexto, lembrar melhor das informações e fornecer respostas precisas. Para comparação, o Llama 3.1 405B da Meta tem 405 bilhões de parâmetros, enquanto o Large 2 da startup francesa Mistral tem 123 bilhões.
O acesso aberto ao T-Pro e T-Lite permitirá que as empresas usem redes neurais para resolver problemas internos e criar novos produtos com base em modelos desenvolvidos, de forma gratuita. Como exemplo, o 'Vedomosti' mencionou chatbots inteligentes para suporte ao cliente e assistentes para funcionários, como ferramentas para escrever código, compilar relatórios ou realizar pesquisas.
Os modelos apresentados fazem parte da família LLM Gen-T, projetados para lidar com tarefas altamente especializadas. Isso os diferencia do ChatGPT, que é mais universal.
T-Lite e T-Pro foram criados com base no Qwen-2.5 do desenvolvedor chinês Alibaba Group e foram adaptados para o idioma russo.
Os negócios podem implantar modelos de linguagem em seus próprios servidores e refiná-los para casos específicos, destacou o CEO da Dbrain, Alexey Khakhunov. Por favor, forneça o texto de origem a ser traduzido. Lembramos que, em dezembro, na Rússia, foi apresentado um assistente virtual baseado em IA para psicólogos, que aumenta a produtividade, a qualidade dos serviços e a receita em dobro.
No mesmo mês, os cientistas russos apresentaram um novo ambiente aberto XLand-MiniGrid, projetado para desenvolver algoritmos de aprendizado contextual com reforço - uma área separada de pesquisa em IA.