Claude Mythos hizo que Liang Wenfeng decidiera financiar.

robot
Generación de resúmenes en curso

¿Cuál fue el detonante directo de la ronda de financiación de DeepSeek?

La última información de The Information revela: Liang Wenfeng vio que Claude Mythos logró capacidades extraordinarias a través de una enorme cantidad de potencia de cálculo y datos, y se dio cuenta de que DeepSeek no podría seguir adelante sin acumular municiones.

Anthropic lanzó su primera vista previa en abril de este año, y los rumores de financiación de DeepSeek también surgieron por primera vez a mediados de abril.

La línea de tiempo coincide perfectamente.

El equipo de 300 personas de DeepSeek se duplicará

Tras completar la financiación, DeepSeek emitió un raro comunicado público el jueves:

Todos los departamentos contratarán "al menos el doble", cubriendo desarrollo de sistemas de IA, infraestructura, desarrollo de productos e investigación en aprendizaje profundo.

Actualmente, DeepSeek tiene alrededor de 300 empleados en toda la empresa.

Entre ellos, el equipo central Harness, responsable de convertir modelos en agentes de IA autónomos, ya está realizando entrevistas a diario.

El líder del equipo, Cui Tianyi, se unió desde Jane Street en marzo de este año y reveló este ritmo en X a principios de este mes.

Al mismo tiempo, DeepSeek está acelerando la adaptación a chips nacionales. Liang Wenfeng cree que los chips de Huawei alcanzarán el nivel de Nvidia en unos pocos años, y DeepSeek debería completar la adaptación primero.

Huawei solo se enteró el año pasado de que DeepSeek estaba probando sus chips en privado, y luego comenzó a colaborar directamente.

Pero el costo de la adaptación no es pequeño.

Los sistemas de entrenamiento e implementación de DeepSeek están construidos sobre el software CUDA de Nvidia, y los ingenieros deben reescribir el software subyacente para que los modelos funcionen eficientemente en los chips de Huawei.

Esto ha llevado directamente a que DeepSeek no haya lanzado ningún modelo de nueva generación durante 15 meses. En una era en la que otros laboratorios principales lanzan nuevos modelos cada dos o tres meses, este período vacío es particularmente llamativo.

Esto también hizo que DeepSeek perdiera la ola de herramientas de programación impulsada por Anthropic Claude Code en la segunda mitad del año pasado.

Pero Liang Wenfeng dijo a los inversores durante la presentación que las herramientas de programación y los chatbots de IA son solo productos temporales en la evolución de la IA. Si se apuesta demasiado por estos productos a corto plazo, se desviará del objetivo final de alcanzar la AGI.

"La IA no debería ser controlada por unos pocos"

En 2023, efectivamente se reunió con inversores, pero cuando les dijo que DeepSeek solo se dedicaba a la investigación profunda y la exploración científica, sin ningún plan de comercialización o ruta de producto, los inversores se echaron atrás.

Finalmente, Liang Wenfeng financió él mismo el laboratorio, manteniéndolo durante tres años.

En esta ronda de financiación de 7400 millones de dólares, Liang Wenfeng escribió el cheque más grande: 20 000 millones de RMB (aproximadamente 3000 millones de dólares), que representa dos quintas partes del total.

Tras completar la financiación, DeepSeek estableció un plan de participación accionaria para empleados, asignando acciones según la valoración real.

Liang Wenfeng dijo a quienes lo rodean que su estrategia no cambiará: continuar con el código abierto, mantener precios bajos y centrarse en la AGI. Define AGI como el nivel en el que las máquinas alcanzan capacidades humanas en una amplia gama de tareas como comprensión, razonamiento, aprendizaje, planificación y adaptación.

También dijo a quienes lo rodean que la IA no debería ser controlada por unos pocos.

DeepSeek es actualmente el único laboratorio principal de IA que ha divulgado completamente el código subyacente de todos sus modelos.

Entre los desarrolladores estadounidenses, la presencia de DeepSeek está creciendo rápidamente. El modelo insignia V4, lanzado en abril de este año, vio su participación en el volumen de tokens en la plataforma AI Gateway de Vercel saltar de menos del 1% al 17% en mayo, convirtiéndose en el tercer modelo más grande de la plataforma, solo detrás de Anthropic y Google, en un mes.

La versión ligera V4 Flash tiene un precio entre 20 y 50 veces más barato que los modelos de Anthropic.

Este crecimiento continuó en junio.

Fuente de este artículo: QuantumBit

Aviso de riesgo y términos de exención de responsabilidad

        El mercado tiene riesgos, invertir con precaución. Este artículo no constituye un consejo de inversión personal ni considera los objetivos de inversión, situación financiera o necesidades específicas de usuarios individuales. Los usuarios deben considerar si las opiniones, puntos de vista o conclusiones de este artículo se ajustan a su situación particular. Invertir según esto es bajo su propio riesgo.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado