Anthropic busca a Samsung para fabricar chips de IA, ¿la historia de fundición de Samsung tiene un nuevo as bajo la manga?

TL;DR
· Se ha informado que Anthropic está explorando el desarrollo de su propio chip de servidor de IA, pero aún no se han confirmado los detalles de diseño, fabricación o producción en masa.
· OpenAI ya ha revelado su chip de inferencia Jalapeño y ha comenzado las pruebas, con planes de implementarlo antes de finales de 2026.
· Samsung podría beneficiarse de la tendencia de subcontratación de chips de IA, pero a corto plazo, Anthropic todavía depende de la potencia de cálculo de AWS, Google y Nvidia.

El debate en torno al desarrollo de un chip de servidor de IA propio por parte de Anthropic se está intensificando, pero aún no es una línea de pedido de chips ya concretada. El núcleo de la atención externa reside en que el costo de inferencia detrás de Claude, el suministro de GPU, la electricidad de los centros de datos y la capacidad de los racks se están convirtiendo en restricciones duras para las empresas de modelos grandes. OpenAI ya ha revelado el chip de inferencia Jalapeño desarrollado en colaboración con Broadcom, y se ha informado que Anthropic está evaluando chips especializados más adecuados para sus propios modelos. Sin embargo, según la información pública disponible actualmente, aún no se ha confirmado si Samsung participará en la fabricación ni si el proyecto ha entrado en la fase de diseño formal.

Anthropic todavía se encuentra en una exploración temprana, no en la víspera de la producción en masa

La dirección que se dice que Anthropic está explorando es un chip de servidor más adecuado para la forma de operar de sus propios modelos de IA. En comparación con las GPU de uso general, si los chips personalizados se diseñan con éxito, podrían reducir los costos en tareas de inferencia específicas, mejorar la eficiencia energética y disminuir la dependencia del suministro externo de chips.

La dificultad de este tipo de chips no radica solo en el rendimiento de un solo chip. Las empresas de modelos grandes necesitan manejar simultáneamente la velocidad de cómputo, el ancho de banda de la memoria, la red de interconexión, el consumo de energía, la disipación de calor y la estabilidad del clúster. Lo realmente difícil es lograr que decenas de miles de chips trabajen de manera estable y coordinada en un centro de datos, y que sigan dando servicio a tareas de entrenamiento o inferencia.

Por ahora, la descripción más segura es que Anthropic todavía se encuentra en una etapa temprana de evaluación y definición. Cuestiones como qué tareas de IA asumirá principalmente el chip, cómo se establecerán los objetivos de rendimiento y consumo de energía, cómo se adaptará a nivel de servidor y clúster, y si será necesario contar con la participación de empresas externas de diseño de chips, aún no tienen respuestas claras y públicas.

La comunicación externa de la empresa también se mantiene cautelosa. Anthropic anunció en abril de este año la expansión de su colaboración con Amazon, invirtiendo más de 100 mil millones de dólares en tecnología de AWS durante la próxima década, asegurando hasta 5 GW de capacidad, y afirmó que ya ha utilizado más de 1 millón de Trainium2 para entrenar y dar servicio a Claude. Anthropic también enfatiza una estrategia de hardware diversificada, pero AWS sigue siendo su principal proveedor de entrenamiento y servicios en la nube.

Esto significa que, incluso si la exploración de chips propios continúa avanzando, a corto plazo será difícil reemplazar a los proveedores actuales. AWS Trainium, Google TPU y las GPU de Nvidia siguen siendo componentes importantes del sistema de potencia de cálculo a escala de Anthropic.

OpenAI va un paso adelante, la presión del costo de inferencia es más directa

El hecho de que Anthropic se haya colocado en el debate sobre chips propios tiene como telón de fondo importante que OpenAI ya ha dado una referencia.

El anuncio oficial de Broadcom muestra que OpenAI y Broadcom lanzaron Jalapeño el 24 de junio de 2026, posicionado como un acelerador para la inferencia de modelos de lenguaje grandes, también conocido como Intelligence Processor. OpenAI y Broadcom afirman que este chip tardó aproximadamente 9 meses desde el diseño inicial hasta la fabricación y la producción de prototipos, las muestras de ingeniería ya están funcionando en el laboratorio y se planea comenzar su implementación antes de finales de 2026.

Aquí es necesario distinguir dos etapas. Jalapeño ya ha sido lanzado y está en pruebas, pero eso no significa que ya esté en uso comercial a gran escala. Representa que las principales empresas de modelos han comenzado a incorporar el costo de inferencia en un control de hardware más profundo, no que la demanda de GPU vaya a ser reemplazada de inmediato.

La inferencia es el proceso computacional mediante el cual un modelo genera respuestas después de que los usuarios hacen preguntas a productos como ChatGPT o Claude. En comparación con el entrenamiento, la inferencia ocurre con mayor frecuencia y, a medida que la base de usuarios se expande, la presión de costos sigue aumentando. Para las empresas de modelos grandes, incluso una pequeña reducción en el costo por inferencia, aplicada a una gran cantidad de solicitudes y al gasto a largo plazo en centros de datos, puede convertirse en un ahorro considerable.

El ritmo de Anthropic es claramente más temprano. No ha publicado especificaciones del chip, ni ha divulgado indicadores de rendimiento, listas de socios o plazos de producción en masa. El progreso de OpenAI solo muestra al mercado una dirección: las empresas de modelos más importantes ya no solo compran GPU, sino que también intentan incorporar parte de la infraestructura de potencia de cálculo bajo su propio control.

El espacio de imaginación de Samsung se calienta, pero el pedido no está concretado

La razón por la que Samsung atrae la atención del mercado es que posee capacidades de fabricación avanzada y también busca más oportunidades de fabricación por contrato de chips de IA. Tras la aparición de noticias sobre la financiación de Anthropic y la colaboración en infraestructura, el mercado naturalmente vinculó a Samsung con posibles oportunidades de fabricación de aceleradores de IA.

Pero esto debe verse con cautela. La información pública que se puede confirmar es que Samsung, SK Hynix, Micron y otras empresas han aparecido en discusiones sobre socios de infraestructura de Anthropic. Micron anunció el 22 de junio de 2026 un acuerdo estratégico con Anthropic que incluye el diseño de arquitectura de IA para memoria y almacenamiento, acuerdos de suministro, la adopción de Claude internamente por parte de Micron y una inversión estratégica en la Serie H de Anthropic.

Estas señales de colaboración no pueden equipararse directamente a que Samsung ya haya recibido un pedido de chips propios de Anthropic. La información sobre que Anthropic ya ha contactado a Samsung para la colaboración en fabricación no está suficientemente respaldada por fuentes públicas verificables. Una evaluación más segura es que, si el proyecto de chip propio de Anthropic avanza a la etapa de fabricación, Samsung podría convertirse en uno de los participantes potenciales que atraigan la atención del mercado, pero actualmente no se puede describir como un acuerdo confirmado.

Para un proyecto de chip, desde la evaluación temprana hasta la producción en masa final, hay que pasar por la determinación de la arquitectura, la verificación del diseño, la selección del proceso de fabricación, el ensamblaje y las pruebas, y la coordinación de la cadena de suministro. Mientras el diseño del chip no esté definido, el papel de la fundición difícilmente se concretará.

La contratación de personal aumenta la credibilidad, pero la ruta aún no está decidida

Las acciones en cuanto a talento hacen que las pistas de hardware de Anthropic sean más relevantes. Según informes, Clive Chan, miembro temprano del equipo de chips personalizados de OpenAI, se ha unido a Anthropic. Los datos públicos muestran que participó en la construcción temprana del equipo de chips de OpenAI y también tiene experiencia relacionada con Tesla Dojo. Anthropic también ha estado reforzando la contratación de ingenieros de chips recientemente.

Esto indica que la empresa al menos se está preparando para tener capacidades de hardware. Para una empresa de modelos, un equipo de hardware que entienda los modelos, las cargas de inferencia y los sistemas de centros de datos puede ayudar a determinar qué tareas son adecuadas para chips personalizados y cuáles deben seguir dependiendo de GPU, TPU o chips de proveedores en la nube.

Pero la incorporación de talento y la expansión de la contratación siguen siendo solo señales de una inversión temprana. El proyecto podrá continuar solo si el chip logra una ventaja suficiente en costo, rendimiento, consumo de energía y complejidad de implementación. Si el chip personalizado solo puede mejorar la eficiencia en teoría, pero no puede funcionar de manera estable a gran escala, o si el costo de fabricación y adaptación de software es demasiado alto, la empresa aún podría seguir dependiendo principalmente de chips externos.

Esta es también la razón por la que Nvidia es difícil de reemplazar a corto plazo. Las GPU de Nvidia siguen siendo el pilar del entrenamiento y la inferencia de IA, su ecosistema de software es maduro y los clientes de centros de datos ya han construido una gran cantidad de sistemas en torno a su plataforma. Es más probable que los chips personalizados primero asuman parte del trabajo en escenarios de inferencia específicos, en lugar de reemplazar completamente las GPU.

Para los inversores, el impacto real del debate sobre los chips propios de Anthropic, a corto plazo, se parece más a un juego de suministro. Las principales empresas de modelos quieren obtener más opciones de potencia de cálculo, y los proveedores de nube, Broadcom, Samsung, TSMC, los fabricantes de memoria y la cadena de suministro de empaquetado avanzado podrían beneficiarse de esta tendencia. Pero en el caso de Anthropic, los hechos claros siguen siendo limitados: la exploración de chips propios está en una etapa temprana, el papel de Samsung no está confirmado, y la potencia de cálculo a escala de Claude todavía depende de AWS, Google y Nvidia.

Haga clic para conocer los puestos de trabajo en BlockBeats

Bienvenido a unirse a la comunidad oficial de BlockBeats:

Grupo de suscripción de Telegram: https://t.me/theblockbeats

Grupo de discusión de Telegram: https://t.me/BlockBeats_App

Cuenta oficial de Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado