T-Bank pone 32 mil millones de parámetros LLM en el dominio público
El texto de origen está vacío. Por favor, proporcione un texto válido para la traducción.
"T-Bank" ha abierto el acceso a dos grandes modelos de lenguaje (LLM) T-Pro y la versión actualizada de T-Lite. Esto lo informa "Vedomosti" citando a un representante del banco.
El texto de origen está vacío. Por favor, proporcione un texto de origen para la traducción.
La versión profesional de la red neuronal tiene 32 mil millones de parámetros, T-Lite tiene 7 mil millones. El segundo fue presentado en julio de 2024.
El número de parámetros refleja la capacidad del modelo para tener en cuenta más contexto, recordar mejor la información y proporcionar respuestas precisas. Para comparación, Llama 3.1 405B de Meta tiene 405 mil millones de parámetros, mientras que Large 2 de la startup francesa Mistral tiene 123 mil millones.
El acceso abierto a T-Pro y T-Lite permitirá a las empresas utilizar redes neuronales de forma gratuita para resolver tareas internas y desarrollar nuevos productos basados en los modelos desarrollados. Por ejemplo, en Vedomosti se mencionan chatbots inteligentes para el servicio de soporte y asistentes para empleados, como herramientas para escribir código, crear informes o investigaciones.
Los modelos presentados forman parte de la familia LLM Gen-T, diseñada para resolver tareas altamente especializadas. Esto los distingue de ChatGPT, que es universal.
T-Lite y T-Pro se basan en Qwen-2.5 desarrollado por Alibaba Group y adaptado al idioma ruso.
'Este enfoque permite a las 'T-tecnologías' reducir significativamente los costos de creación de grandes modelos de lenguaje, en un 80-90% en comparación con las compañías que los entrenan desde cero. Al mismo tiempo, la calidad de las soluciones de los productos LLM en ruso supera las soluciones basadas en modelos abiertos y propietarios de OpenAI, Google y Anthropic', señaló un representante del banco.
Por favor, introduzca el texto que desea traducir.
Las empresas pueden implementar modelos de lenguaje en sus propios servidores y reentrenarlos para casos específicos, destacó el CEO de Dbrain, Alexey Hahunov.
Por favor, introduzca el texto que desea traducir.
Recordemos, en diciembre se presentó en Rusia un asistente virtual basado en inteligencia artificial para psicólogos, que aumenta la productividad, la calidad de los servicios y los ingresos en un 100%.
Ese mismo mes, los científicos rusos presentaron un nuevo entorno abierto XLand-MiniGrid, diseñado para el desarrollo de algoritmos de aprendizaje contextual con refuerzo, un área separada de la investigación en IA.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
El banco T ha puesto a disposición pública el LLM con 32 mil millones de parámetros.
T-Bank pone 32 mil millones de parámetros LLM en el dominio público
El texto de origen está vacío. Por favor, proporcione un texto válido para la traducción. "T-Bank" ha abierto el acceso a dos grandes modelos de lenguaje (LLM) T-Pro y la versión actualizada de T-Lite. Esto lo informa "Vedomosti" citando a un representante del banco. El texto de origen está vacío. Por favor, proporcione un texto de origen para la traducción. La versión profesional de la red neuronal tiene 32 mil millones de parámetros, T-Lite tiene 7 mil millones. El segundo fue presentado en julio de 2024.
El número de parámetros refleja la capacidad del modelo para tener en cuenta más contexto, recordar mejor la información y proporcionar respuestas precisas. Para comparación, Llama 3.1 405B de Meta tiene 405 mil millones de parámetros, mientras que Large 2 de la startup francesa Mistral tiene 123 mil millones.
El acceso abierto a T-Pro y T-Lite permitirá a las empresas utilizar redes neuronales de forma gratuita para resolver tareas internas y desarrollar nuevos productos basados en los modelos desarrollados. Por ejemplo, en Vedomosti se mencionan chatbots inteligentes para el servicio de soporte y asistentes para empleados, como herramientas para escribir código, crear informes o investigaciones.
Los modelos presentados forman parte de la familia LLM Gen-T, diseñada para resolver tareas altamente especializadas. Esto los distingue de ChatGPT, que es universal.
T-Lite y T-Pro se basan en Qwen-2.5 desarrollado por Alibaba Group y adaptado al idioma ruso.
Por favor, introduzca el texto que desea traducir. Las empresas pueden implementar modelos de lenguaje en sus propios servidores y reentrenarlos para casos específicos, destacó el CEO de Dbrain, Alexey Hahunov. Por favor, introduzca el texto que desea traducir. Recordemos, en diciembre se presentó en Rusia un asistente virtual basado en inteligencia artificial para psicólogos, que aumenta la productividad, la calidad de los servicios y los ingresos en un 100%.
Ese mismo mes, los científicos rusos presentaron un nuevo entorno abierto XLand-MiniGrid, diseñado para el desarrollo de algoritmos de aprendizaje contextual con refuerzo, un área separada de la investigación en IA.