Wow, @arena ¿es hecho por taiwaneses?


Recientemente, las listas de AI coding son muy interesantes de ver 👀
Pero creo que el enfoque ya no es "quién es el número uno".
Lo realmente importante es: el primer lugar en modelos de IA, está empezando a no ser tan escaso. 🧠⚡️
Antes, todos pensaban que la IA sería la ganadora que se comería todo:
GPT-4 muy por delante,
otros modelos solo podían seguir.
Pero ahora, en listas como Arena, los modelos en la parte superior cada vez están más apretados. Claude, OpenAI, Google, GLM, Qwen, Kimi, todo tipo de modelos de código abierto y cerrado están en el mismo rango de capacidades. La diferencia en puntuaciones Elo se está reduciendo, lo que indica que las capacidades de los modelos se están estandarizando rápidamente.
Esto es muy parecido a la electrificación 🚰
Abres la llave del agua, no te importa mucho qué compañía suministra el agua.
Lo que te importa es:
- ¿Es barato?
- ¿Es estable?
- ¿Se corta?
- ¿Se puede integrar en tu flujo de trabajo?
Los modelos de IA también están yendo en esa dirección.
Cuando la diferencia en capacidades de los modelos se reduce, lo que el mercado necesita reevaluar no es "quién es el más inteligente", sino:
🧩 quién puede integrarlo en el flujo de trabajo
💰 quién tiene el menor costo de inferencia
🔒 quién puede cumplir con las regulaciones empresariales y la seguridad
📊 quién tiene retroalimentación de datos y retención de usuarios
🛠 quién puede convertir el modelo en un producto, no solo en una demo
Especialmente en modelos de codificación.
Al final, los ingenieros no necesariamente eligen "el número uno en la lista".
Elegirán la herramienta que sea más estable, más barata, que entienda mejor su base de código, y que no se rompa de repente.
Por eso, cuando veo la lista de Arena, lo primero que noto no es la clasificación, sino los cambios en la estructura.
Cuanto más apretados estén los primeros veinte, más delgada será la barrera de entrada del modelo en sí.
El valor se moverá hacia productos, datos, distribución, costos de computación y capacidad de despliegue empresarial. 🏗️
Y hay otra cosa muy interesante:
Uno de los fundadores principales de Arena, la infraestructura global de evaluación de IA, Wei-Lin Chiang, es graduado de la Universidad Nacional de Taiwán en ciencias de la computación, y luego hizo investigación en UC Berkeley, creando el sistema de evaluación ciega de chatbots Arena.
En el pasado, las narrativas más fuertes en IA solían ser sobre chips, servidores y cadenas de suministro.
Pero Arena nos recuerda:
Que no solo se puede hacer infraestructura hardware para IA.
También se puede participar en la infraestructura de confianza de IA. 🌏
El futuro de la industria de IA probablemente no será:
"¿De quién es el modelo más fuerte?"
Sino:
"¿Quién tiene la autoridad para definir qué significa fuerte?"
"¿Quién puede convertirse en la agencia de calificación de confianza en el mundo de los modelos?"
"¿Quién puede hacer que el mercado crea que estos rankings de IA son reales?"
Hace dos años, el modelo más fuerte en sí mismo era la barrera de entrada.
Pero en la próxima etapa, lo que realmente valdrá dinero será:
- Cómo se evalúan los modelos,
- Cómo se despliegan,
- Cómo se confía en ellos,
- Cómo los usan las empresas a largo plazo.
La guerra de IA está pasando de "capacidad del modelo" a la fase de "infraestructura". 🚀
Ver original
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado