DeepSeek añade reconocimiento de imágenes y videos a su chatbot principal

Una empresa china de inteligencia artificial ha añadido reconocimiento de imágenes y videos a su chatbot principal.

Al mismo tiempo, los fabricantes locales de chips demostraron que ahora pueden igualar el soporte de lanzamiento rápido que solía ser una fortaleza estadounidense.

DeepSeek, una empresa con sede en Hangzhou, añadió discretamente una nueva función llamada “modo de reconocimiento de imágenes” a su plataforma de chat. Este nuevo modo se une a otros dos modos que la compañía lanzó a principios de este mes: “experto” y “ráfaga”.

La nueva función permite que el chatbot entienda fotos y videos, no solo texto.

Esto lo pone en línea con otros grandes chatbots de IA que han ofrecido habilidades similares durante algún tiempo.

Chen Xiaokang, quien encabeza el equipo multimodal de DeepSeek, dijo que la herramienta fue probada inicialmente con un pequeño grupo de usuarios tanto en el sitio web como en la aplicación móvil.

Chen Deli, un investigador senior de la compañía, celebró el lanzamiento con una breve publicación que hacía referencia al logo de la empresa: “La pequeña ballena ahora puede ver.”

La función de imagen y video salió apenas unos días después de que DeepSeek lanzara una vista previa de su modelo insignia más reciente, DeepSeek-V4, y pusiera a disposición los pesos del modelo para que cualquiera pudiera descargarlo y usarlo.

V4 no es un solo modelo, sino dos. El primero, DeepSeek-V4-Pro, tiene 1.6 billones de parámetros y está diseñado para tareas difíciles que requieren razonamiento complejo y flujos de trabajo automatizados de múltiples pasos.

El segundo, DeepSeek-V4-Flash, está construido para manejar una gran cantidad de solicitudes a un costo menor. Ambos modelos soportan una ventana de contexto de un millón de tokens.

También utilizan un diseño de atención híbrido que, según la compañía, reduce la potencia de cálculo y la memoria necesarias durante la inferencia.

Los fabricantes chinos de chips alcanzaron un nuevo hito

Lo que llamó la atención de muchos observadores de la industria no fue solo el modelo en sí, sino lo que sucedió el día de su lanzamiento.

Cuatro empresas chinas de chips, Huawei Ascend, Cambricon, Hygon Information y Moore Threads, confirmaron que su hardware funcionó perfectamente con V4 desde el primer día en que fue lanzado.

Este tipo de soporte en el mismo día, donde un modelo nuevo funciona sin problemas en chips no-NVIDIA desde el lanzamiento en lugar de semanas o meses después, había sido casi imposible fuera del ecosistema de Nvidia.

Los chips Ascend de Huawei, incluyendo el A2, A3 y 950, soportan tanto V4-Pro como V4-Flash.

La compañía dijo que su chip Ascend 950 usa procesos de computación fusionados y flujos de procesamiento paralelo para hacer que la inferencia sea más rápida.

Cambricon completó su adaptación usando el marco de inferencia de código abierto vLLM y compartió su código en GitHub.

Hygon afirmó que realizó una optimización profunda del modelo en su plataforma DCU para crear un camino fluido desde el lanzamiento del modelo hasta su uso real.

Moore Threads trabajó con la Academia de Inteligencia Artificial de Beijing para ejecutar V4 en su tarjeta MTT S5000 usando la pila de software FlagOS.

Los observadores de la industria dicen que este lanzamiento coordinado representa un cambio real.

Durante años, los chips fabricados fuera del ecosistema de Nvidia tardaban meses en soportar un modelo nuevo importante. Lograr que ocho conjuntos de chips nacionales diferentes funcionen en el día uno es un hito significativo.

La visión general: costo e independencia para DeepSeek

Los observadores creen que el significado más profundo de este lanzamiento es que DeepSeek ha demostrado que puede ofrecer IA de alto nivel sin depender del hardware occidental.

Al hacer que sus modelos funcionen de manera nativa en múltiples chips chinos al mismo tiempo, reduce el riesgo de las restricciones de exportación que han bloqueado a las empresas chinas acceder a los procesadores estadounidenses más potentes.

El costo también es importante. DeepSeek ha trabajado arduamente para mantener bajo el precio de ejecución de sus modelos. Esto facilita que las empresas construyan sistemas automatizados sin enfrentarse a costos de computación muy altos.

De esta manera, las mejoras y el lanzamiento de DeepSeek no se tratan principalmente de un avance técnico. Se trata más de que toda una cadena de suministro se una.

A partir de este lanzamiento, la cuestión de quién lidera en IA parece alejarse de quién construye el modelo más inteligente, y acercarse a quién puede mantener todo el sistema funcionando de manera económica e independiente a largo plazo.

Si estás leyendo esto, ya estás un paso adelante. Quédate allí con nuestro boletín.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado