DeepSeek prueba interna de "modo de reconocimiento de imágenes", capacidad multimodal oficialmente abierta|Exclusivo

robot
Generación de resúmenes en curso

Noticias de Mars Finance 29 de abril, fuentes informaron que algunos usuarios han reportado que la versión web de DeepSeek ya ha lanzado el “modo de reconocimiento de imágenes”. Al probarlo, se descubrió que este modo permite a los usuarios subir imágenes y realizar comprensión y análisis de contenido. Actualmente, esta función aún no se ha desplegado completamente, y los límites específicos de sus funciones aún no están claros. Es importante destacar que, justo hoy, el investigador responsable del desarrollo multimodal de DeepSeek, Chen Xiaokang, publicó en la plataforma X un mensaje que decía “Now, we see you” acompañado de una imagen, en la que el icónico “ballena” de DeepSeek se quita la máscara. A principios de este mes, DeepSeek lanzó recientemente el “modo rápido” y el “modo experto”, siendo el primero adecuado para conversaciones diarias con respuestas inmediatas; el segundo, especializado en problemas complejos, puede requerir espera en picos de uso. En ese momento, se filtraron capturas de pantalla que mostraban que, además de los modos “rápido” y “experto”, DeepSeek también tenía un modo llamado “vision”. La última “modo de reconocimiento de imágenes” coincide en gran medida con la entrada del modo “vision” que circulaba anteriormente. Los análisis sugieren que la apertura de las capacidades multimodales de DeepSeek significa que su matriz de productos se ha extendido formalmente desde diálogos en texto puro hacia interacciones de imagen y texto, acercándose a modelos multimodales principales como GPT-4o y Gemini. (Observación panorámica)

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado