OpenAI consume vorazmente la capa de aplicación? a16z: las oportunidades están fuera del "Camino de ladrillos amarillos", las oportunidades para los emprendedores aún están detrás

Question

a16z socio destacado, que la capa de aplicaciones de IA no es un solo campo de batalla, las startups deben evitar herramientas horizontales de grandes modelos que atacan directamente, y en su lugar enfocarse en profundizar en industrias verticales. Este artículo proviene de un tuit.
(Resumen previo: Google lidera la inversión en la plataforma de enrutamiento de IA OpenRouter, valorada en 1.300 millones de dólares, con un crecimiento del 240% en un año)
(Información adicional: Sam Altman en conversación con el fundador de a16z: OpenAI apuesta agresivamente por infraestructura, Sora es una herramienta estratégica clave)

Índice de este artículo

Alternar

La ansiedad se extiende: ¿los grandes modelos devoran la capa de aplicaciones?
La trampa del camino dorado: el camino mortal de las herramientas horizontales
Oportunidad en Oz: la barrera de protección de los flujos de trabajo verticales
Ventaja en costos: enrutamiento de modelos y post-entrenamiento
Plano de control: valor en cumplimiento y gobernanza

Esto es exactamente lo que Joe Schmidt, socio de a16z, intenta responder en este artículo. Usa la metáfora del "camino dorado" de "El Mago de Oz" para dividir las oportunidades de aplicación de IA en dos categorías: una, el camino principal que están explorando los laboratorios de grandes modelos, como generación de código, escritura, creación de imágenes, agentes universales y asistentes de oficina horizontales; otra, "otros lugares en Oz", es decir, escenarios verticales que profundizan en procesos industriales, dependen de flujos de trabajo complejos, acumulación de datos, cumplimiento, gobernanza y capacidades de integración de sistemas.

En su opinión, la verdadera oportunidad para las startups está en estos últimos.

Desde ventas hasta seguros, Joe Schmidt enfatiza repetidamente una lógica: lo que las empresas realmente están dispuestas a pagar no es una ventana de chat más inteligente, sino un sistema que sea responsable de los resultados comerciales. Necesita entender el estado caótico de los datos del cliente, gestionar aprobaciones múltiples y casos límite, asumir responsabilidades de cumplimiento y auditoría, y también, a medida que los modelos se actualizan, ayudar a los clientes a migrar, enrutarlos y optimizar costos.

Esta es también la conclusión central sobre la próxima generación de software empresarial: los modelos subyacentes serán cada vez más potentes y reemplazables; pero lo que realmente no puede ser sustituido son los datos, procesos, capacidades de gobernanza y memoria operativa acumulados en torno a industrias y flujos de trabajo específicos. La oportunidad de las empresas de aplicaciones de IA no está en competir con los laboratorios de modelos en el "camino dorado", sino en adentrarse en lugares más complejos, sucios, lentos, pero también más cercanos al valor real del negocio.

Recientemente, he escuchado constantemente de fundadores y posibles empleados la misma pregunta: ¿qué más se puede hacer en la capa de aplicaciones de IA? ¿O al final, OpenAI y Anthropic acabarán matando todo?

Detrás de esta pregunta hay una ansiedad típica de IA. Algunos ya han llegado a la conclusión: si no quieres quedar atrapado en la capa base de forma permanente, el único lugar con valor a largo plazo es dentro de los laboratorios de grandes modelos o en emprendimientos en robótica, tecnología dura o áreas similares de frontera — en teoría, hacer cosas que "los laboratorios no pueden tocar". Porque si cada tipo de software será devorado, o será absorbido por Codex o Claude en tareas específicas, o algún modelo futuro lo hará innecesario, la mejor opción parece ser: ¡corre rápido!

Reconozco que casi también soy un maximalista de IA, y creo que tienen razón en parte. Los laboratorios de grandes modelos sí están entrando en grandes áreas de la capa de aplicaciones. Pero "la capa de aplicaciones" no es un conjunto homogéneo de oportunidades. La clave está en: ¿estás siguiendo el "camino dorado" o en otros lugares en Oz?

Nota: "Camino dorado" es la ruta principal hacia la ciudad de Esmeralda en "El Mago de Oz", que conduce a la zona central del reino de Oz, donde está el "Mago".

El "camino dorado" es la metáfora que usamos para describir la ruta que están siguiendo los laboratorios de grandes modelos, invirtiendo recursos enormes en ella. La generación de código, escritura, creación de imágenes, estos problemas son naturalmente adecuados para laboratorios, porque mejoran a medida que aumenta la capacidad original del modelo: cada dólar invertido en preentrenamiento y post-entrenamiento mejora directamente la calidad del producto.

Pero en otros lugares en Oz, existen problemas más complejos, generalmente más verticales. No se trata simplemente de ofrecer una herramienta horizontal a un usuario empresarial, que pueda resolverlo conectándolo a herramientas estándar y capacidades informáticas. El valor aquí proviene más de las plataformas que rodean al modelo: esas plataformas hacen que las salidas sean confiables, cumplan con regulaciones y puedan integrarse realmente en los procesos de negocio. La capacidad del modelo base sigue siendo importante, pero ya no lo es todo.

Estamos viendo esto en tiempo real. OpenAI y Anthropic están reconociendo en el mercado que no pueden resolver todos los problemas con un asistente de IA universal. Han anunciado inversiones en proyectos conjuntos de despliegue a gran escala, que construyen modelos personalizados y configurados para empresas. Si realmente creyeran que la próxima versión del modelo resolverá estos problemas, no invertirían miles de millones en estos proyectos.

La ansiedad se extiende: ¿los grandes modelos devoran la capa de aplicaciones?

Por eso, si quieres ganar dinero haciendo aplicaciones de IA, no sigas el "camino dorado", sino que construye en otros lugares en Oz. Aquí compartimos algunas experiencias que hemos aprendido, y que algunos fundadores en nuestro portafolio también han experimentado.

Si vas a fundar una empresa, el camino dorado es el más visible, pero también el más peligroso. Toma un modelo de alto rendimiento, conéctalo a algunos conectores existentes, como Google Drive, Slack, Salesforce, Notion, GitHub, y construye una capa de orquestación inteligente. Parece magia.

El problema es que esto es exactamente lo que los laboratorios de grandes modelos están haciendo con Cowork y Codex. Obviamente, tienen modelos, lo que significa mejores márgenes, mayor control y poder de fijación de precios sobre todos los participantes downstream. Pero quizás más importante, controlan las arquitecturas que deciden qué problemas son adecuados para resolver con sus modelos. Hasta ahora, han adoptado deliberadamente el patrón "modelo + llamada a herramientas", que es precisamente lo que necesitan en los trabajos horizontales y de baja cantidad de pasos en el camino dorado. Incluso si una startup logra superar a Codex o Claude Code, los laboratorios de modelos aún tienen una gran capacidad de distribución y el aura de marca más fuerte en IA.

Si tú eres una startup de aplicaciones de IA, usando la misma estrategia: conectando los mismos conectores, sin subinteligencias o configuraciones propias, sin canales de distribución, probablemente estás en un camino hacia la nada.

Pero no todo es pesimismo para las startups. Fuera del camino dorado, todavía hay oportunidades enormes. Pueden tener clientes en estos lugares y resolver problemas complejos.

Estas empresas están construyendo experiencias con agentes: modelos integrados en herramientas complejas, automatización y redes de integración — en otras palabras, software. Esto las hace, por naturaleza, verticales. Pueden enfocarse en flujos de trabajo de múltiples pasos y múltiples participantes, diseñar subinteligencias para diferentes roles y escenarios verticales, y abordar problemas que los laboratorios horizontales de Anthropic y OpenAI no pueden alcanzar: recopilar contexto de múltiples sistemas, y enrutarlos a múltiples aprobadores en diferentes etapas.

Este trabajo suele involucrar uno o más sistemas legados, y requiere resultados deterministas, porque la ambigüedad no es aceptable, y a veces, está ligado a resultados comerciales clave. Los laboratorios de modelos saben lo valiosos que son estos problemas: por eso están formando sus propios equipos de configuración externalizada, y por eso están surgiendo grupos de empresas de servicios de aprendizaje reforzado para grandes clientes.

Una objeción a este punto de vista es: hasta ahora, apostar a los modelos o laboratorios no ha sido una buena jugada, porque probablemente seguirán mejorando y acabarán comiéndose el mercado de estas aplicaciones.

Por supuesto, los laboratorios seguirán mejorando. Pero creo que, a largo plazo, las empresas en otros lugares en Oz tienen varias formas de defenderse.

Muchas cosas que realmente internalizas en tu negocio no están en ningún conjunto de entrenamiento: las prácticas no escritas de la industria, los estándares sin documentación, el conocimiento tribal en las mentes de los profesionales. Todo eso no está en internet público. No importa cuánto poder de entrenamiento pongas, no puede reemplazar el trabajo interno en estos flujos de trabajo.

Aquí se activan dos círculos virtuosos: uno, el círculo de clientes, donde, al ver más variaciones del mismo problema, el patrón se vuelve más fuerte; otro, el círculo interno del cliente, donde las razones detrás de decisiones específicas, las excepciones no explicadas y las reglas de experiencia de la empresa emergen solo cuando los usuarios interactúan realmente con el sistema.

La trampa del camino dorado: el camino mortal de las herramientas horizontales

Incluso si los datos del cliente no se pueden usar entre clientes, las empresas de aplicaciones pueden usar patrones en diferentes tipos de problemas para guiar el diseño de futuros problemas. Si una empresa ha hecho que su agente inteligente maneje 100 revisiones de líneas rojas legales, 1,000 ciclos de evaluación de seguros, o 10,000 actividades de desarrollo de ventas SDR, su comprensión de las formas del problema ya no puede ser copiada por un nuevo agente que inicie por primera vez.

En teoría, un agente horizontal también puede construir la misma infraestructura de aprendizaje, pero no lo hace por falta de foco, y más aún, por la experiencia del usuario. Capturar ese conocimiento depende completamente de qué interfaz de flujo de trabajo ofreces a los usuarios. Los jugadores verticales pueden diseñar esas interfaces en torno a la información que realmente necesitan exponer en un flujo de trabajo específico, algo que las herramientas horizontales no pueden hacer. Los conjuntos de evaluación, las anotaciones de salidas, los sistemas de clasificación de casos límite, pueden formar un ciclo de datos vertical, y apoyar la afinación posterior. Sin una infraestructura de producción a escala similar, los imitadores tendrán dificultades para crear ese ciclo. La viabilidad depende de derechos sobre los datos, volumen de uso en producción y estructura contractual con los clientes, pero el reconocimiento de patrones seguirá acumulándose.

Los laboratorios de modelos ya hacen enrutamiento: llaman a diferentes modelos según la solicitud, integrando en la capa base. Pero no pueden hacer enrutamiento entre proveedores, ni evaluar modelos de la competencia para tareas específicas, ni usar modelos de código abierto ajustados para tareas estrechas.

Las empresas en otros lugares en Oz seleccionarán el modelo más adecuado para cada sub-tarea en el mercado de modelos, en lugar de usar solo el modelo de un laboratorio principal. También asumirán trabajos que nadie quiere hacer: reevaluar con cada lanzamiento de modelo, ajustar indicaciones para casos límite de clientes, poner en producción sin romper el entorno. Los laboratorios no hacen esas tareas. Te venden el nuevo modelo y te dicen que hagas la migración. Las empresas en Oz absorben los costos de migración. Los clientes obtienen la mejor capacidad de inteligencia del mercado y continuidad en cada actualización.

Enviar cada consulta a Opus 4.7 es la forma más rápida de volver negativo el margen bruto. Las mejores empresas en Oz enrutaron entre modelos en diferentes niveles: las tareas más difíciles a los modelos de vanguardia, la mayoría a modelos intermedios, y en áreas ya probadas, a modelos más pequeños o ajustados.

Algunas ya están haciendo su propio post-entrenamiento, optimizando modelos para las tareas que realmente importan a los clientes, y ofreciendo servicios a costos mucho menores que las API de vanguardia. Los laboratorios de modelos fijan precios en "suelo": cuánto X dólares puede comprar el nivel mínimo de inteligencia. Las empresas en Oz venden lo contrario: el nivel de inteligencia mínimo necesario para un flujo de trabajo específico, a un costo en dólares muy bajo. Solo si comprendes exactamente qué nivel de inteligencia necesita cada sub-tarea, esto es posible. Los laboratorios no pueden entender en estructura cada tarea en cada industria vertical, pero el reconocimiento de patrones seguirá acumulándose.

Ya en los laboratorios de modelos, se hace enrutamiento: llamar a diferentes modelos según la solicitud, integrando en la capa base. Pero no pueden hacer enrutamiento entre proveedores, ni evaluar modelos de la competencia para tareas específicas, ni usar modelos de código abierto ajustados para tareas estrechas.

Las empresas en otros lugares en Oz seleccionarán el modelo más adecuado para cada sub-tarea en el mercado de modelos, en lugar de usar solo el modelo de un laboratorio principal. También asumirán trabajos que nadie quiere hacer: reevaluar con cada lanzamiento de modelo, ajustar indicaciones para casos límite de clientes, poner en producción sin romper el entorno. Los laboratorios no hacen esas tareas. Te venden el nuevo modelo y te dicen que hagas la migración. Las empresas en Oz absorben los costos de migración. Los clientes obtienen la mejor capacidad de inteligencia del mercado y continuidad en cada actualización.

Enviar cada consulta a Opus 4.7 es la forma más rápida de volver negativo el margen bruto. Las mejores empresas en Oz enrutaron entre modelos en diferentes niveles: las tareas más difíciles a los modelos de vanguardia, la mayoría a modelos intermedios, y en áreas ya probadas, a modelos más pequeños o ajustados.

Algunas ya están haciendo su propio post-entrenamiento, optimizando modelos para las tareas que realmente importan a los clientes, y ofreciendo servicios a costos mucho menores que las API de vanguardia. Los laboratorios de modelos fijan precios en "suelo": cuánto X dólares puede comprar el nivel mínimo de inteligencia. Las empresas en Oz venden lo contrario: el nivel de inteligencia mínimo necesario para un flujo de trabajo específico, a un costo en dólares muy bajo. Solo si comprendes exactamente qué nivel de inteligencia necesita cada sub-tarea, esto es posible. Los laboratorios no pueden entender en estructura cada tarea en cada industria vertical, pero el reconocimiento de patrones seguirá acumulándose.

Ser un plano de control para que los clientes en un campo vertical ejecuten IA tiene un valor enorme. Este plano de control es donde se concentran permisos, auditorías, qué puede hacer la inteligencia artificial, y qué realmente hizo.

Este plano de control se construye sobre los límites específicos de cada caso de uso, y esos límites varían mucho entre industrias y roles. Como estas empresas tienen herramientas, flujos de trabajo y datos con los que interactúan, pueden ofrecer resultados deterministas que las herramientas horizontales no pueden. También asumen la complejidad regulatoria para el cliente final: reglas federales civiles y de abogados en EE. UU., HIPAA en salud, regulaciones SEC y FINRA en finanzas, regulaciones estatales de seguros, etc. Si un jugador horizontal no se convierte en una colección de 100 industrias verticales, no podrá hacer esto de manera convincente. El CIO necesita un socio que pueda comprometerse contractualmente a cumplir con las regulaciones.

Todo esto vuelve a un solo punto: la concentración.

Esa concentración puede ser en una industria vertical, como seguros, legal, contabilidad; o en una función que se profundice lo suficiente, como ventas, atención al cliente, finanzas. En cualquiera de los casos, requiere un equipo que esté en contacto con el mismo tipo de clientes a largo plazo, entendiendo sus flujos, casos límite y requisitos regulatorios. Los laboratorios de grandes modelos no están diseñados para esto. Tienen que atender a todos, cubrir todos los lugares, y esa es la razón por la que construyeron el camino dorado inicialmente. La misma elección también limita su entrada en otros lugares en Oz: puedes estar en todas partes, o ser excelente en una cosa, pero no ambas.

¿Y cómo entender esto en la práctica? Aquí algunas recomendaciones prácticas del CEO de 11x, Prabhav Jain.

Oportunidades en Oz: la barrera de los flujos de trabajo verticales

Construir una empresa que resista el impacto de los laboratorios de grandes modelos requiere partir de resultados concretos que los clientes realmente valoran. Para nosotros, ese resultado es ayudar a las empresas a generar más oportunidades y canales de venta.

Desde aquí, la pregunta se vuelve muy específica: ¿qué actividades queremos tener en nuestro control completo y que realmente impulsen el crecimiento del canal de ventas? Desglosar cada actividad en tareas. ¿Qué tareas son adecuadas para un agente inteligente, y cuáles no? ¿Cuáles requieren una comprensión profunda del dominio, y cuáles no? Los laboratorios de modelos también lanzan flujos de trabajo, pero cuando un flujo tiene muchas etapas, entradas caóticas, estados difíciles de explicar, o restricciones del mundo real, solo tener un modelo mejor no basta. Aquí, el trabajo vuelve a la ingeniería de software tradicional, y en ese nivel, los laboratorios no tienen ventaja frente a una aplicación enfocada.

Por ejemplo, algunas tareas que manejamos incluyen: identificación de clientes potenciales basada en señales personalizadas, completado de información de prospectos, investigación profunda de cuentas, extracción de contexto desde CRM, redacción de información para diferentes canales, evaluación de la cualificación del prospecto, y sistemas de entrega de correos. Algunas son tareas de agentes, otras no. No se pueden hacer con una sola instrucción, requieren ingeniería profunda.

La clave en la analogía de Oz es: en cualquier flujo de trabajo real, aproximadamente la mitad son tareas no relacionadas con agentes inteligentes, y esa mitad no aporta ventaja de laboratorio. Por debajo del nivel del modelo, su capacidad para escribir software determinista no es mejor que la tuya. La otra mitad, que sí requiere agentes, también exige que enfoques en el resultado deseado, ajustando, entrenando y restringiendo el modelo.

El conocimiento del dominio generalmente no está en los datos de entrenamiento general. Se construye desde la industria vertical o funciones específicas, y se alimenta en el momento adecuado en el flujo de trabajo. Cuando nuestro agente decide si un contacto entrante es calificado, debe entender qué constituye una buena conversación de ventas para un sector y perfil específicos. Esa es la tarea del aplicador, y esa capacidad se compone en forma exponencial.

Más importante aún, esas capacidades se vuelven obsoletas a medida que la empresa evoluciona. Por eso, la mejora continua en los flujos de trabajo y en el contexto en que operan se vuelve una ventaja competitiva. Por ejemplo, cuando empezamos con productos de outreach por email, "emails escritos por IA" estaban empezando a aparecer. Hoy, la percepción del mercado es aguda: distinguir qué correos son generados por IA y cuáles parecen humanos cambia cada pocos meses. Nuestro agente debe ajustarse continuamente a las dinámicas del mercado, y esa barrera se construye aquí. De hecho, a pesar de esa dinámica, nuestra tasa de respuesta activa ha aumentado 4 veces en los últimos meses, generando miles de millones en oportunidades para los clientes.

Los problemas complejos son donde realmente se libera valor comercial. De lo contrario, solo estarías haciendo una capa superficial.

Desglosar problemas comerciales suficientemente complejos revela caos. Un ejemplo simple en GTM: si una empresa ya es cliente, no deberías volver a contactar a un contacto específico dentro de esa empresa. Pero esto no es sencillo.

Quizá tienes el dominio de esa empresa en tu CRM. ¿Qué pasa si esa empresa tiene muchas subsidiarias? ¿Y si en el CRM solo aparece la matriz matriz de la matriz? ¿Y si en Salesforce hay un campo desactualizado que hace que envíes un email frío al director de ingresos en lugar del contacto correcto? La realidad es caótica. Incluso los humanos tienen dificultades para manejarlo, y los modelos tampoco cruzan esa barrera mágicamente. Para ordenar ese caos, necesitas agentes diseñados específicamente para ese problema, no simplemente apuntar un copiloto genérico al CRM. De hecho, con los datos que tenemos, hemos descubierto que la calidad y frescura de nuestros datos supera a la del cliente, por lo que, por defecto, usamos nuestros datos como referencia.

Las barreras regulatorias están muy subestimadas. Incluso en un mismo producto, cada caso de uso requiere sus propias barreras. Para nosotros, un cliente potencial en finanzas reguladas difiere mucho en garantías de un cliente SaaS mediano. Y esas garantías se transmiten en cómo se escribe el agente, quién puede contactarlo, qué datos puede acceder, qué puede decir en una llamada, y cómo se registran las decisiones.

Un sistema "único para todo" colapsaría ante estas diferencias. Las barreras deben construirse por caso de uso, por cliente, y mantenerse auditables. Por eso, necesitamos ingenieros de despliegue y estrategas técnicos para ajustar cada cliente.

Ventaja en costos: enrutamiento de modelos y post-entrenamiento

Por ejemplo, trabajamos con una institución Fortune 1000 para llamadas salientes con su gran base de clientes SMB, con consentimiento. En las primeras rondas, la tasa de respuesta era baja. Tuvimos que iterar rápidamente para aprender a activar a estos públicos en los primeros 10 segundos de la llamada. Los SMB tienen comportamientos muy diferentes a los grandes compradores B2B o consumidores. Hoy, generamos más oportunidades en un día que todo su equipo de ventas en ese segmento en un mes.

Las ventas son solo un ejemplo. Los seguros muestran otra cara de la misma moneda. Aquí la comprensión de "salir del camino dorado" de Aman Gour, CEO de FurtherAI.

Al comenzar a desplegar IA en operaciones reales de seguros, escuchamos una hipótesis recurrente: que el modelo es la inteligencia, y el flujo de trabajo solo un andamio alrededor del modelo.

Pero, a medida que trabajamos con más aseguradoras, estamos cada vez más convencidos de que es exactamente lo contrario.

En seguros, mucha inteligencia ya está en los flujos de trabajo. Dos aseguradoras pueden hacer que un mismo proceso de envío de documentos pase por revisión, cotización, aprobación, y emisión. La ruta en sí es sencilla. Lo que realmente diferencia a una aseguradora de otra son todos los detalles internos: qué riesgos necesitan escalamiento, qué señales de pérdida son clave, qué reglas de suscripción tienen prioridad cuando hay conflicto, cuándo se requiere firma humana, qué datos externos se consultan, y cómo se registran las decisiones finales.

Estas lógicas no están en un motor de reglas limpio. Están dispersas en los procesos operativos, revisiones gerenciales, filosofías de suscripción, preferencias de riesgo específicas, y años de experiencia. Muchas de esas reglas no están en un formato que un modelo pueda leer directamente.

Por eso, no confiamos en un agente que solo razona desde cero cada vez, ni en flujos rígidos que colapsan ante la complejidad. En cambio, construimos flujos de trabajo con agentes: que aportan repetibilidad, auditabilidad y control de costos; que manejan variabilidad y reanudan procesos cuando el camino ideal se interrumpe; y que dejan a los humanos en los puntos que requieren juicio y responsabilidad.

Al principio, esto automatiza tareas manuales. Pero con el tiempo, cada mejora se vuelve una señal, cada excepción un feedback, y cada corrección humana revela qué partes del manual no estaban completas. Eventualmente, el flujo de trabajo deja de ser solo un script, y se convierte en la memoria operativa de la aseguradora.

Eso es algo que los laboratorios de modelos no pueden alcanzar fácilmente. Seguirán lanzando mejores modelos y agentes universales, y deberían hacerlo. Pero no permanecerán en un flujo de trabajo de aseguradora durante años, aprendiendo por qué un cliente fue escalado, por qué una reclamación fue rechazada, o por qué un ajustador cambió una decisión. Esa comprensión solo surge de ejecutar el mismo flujo miles de veces en producción. La primera versión no es una barrera, la verdadera barrera es el ciclo de uso en producción, que se construye con el tiempo.

Para nosotros, esa es la idea de "salir del camino dorado".

Plano de control: valor en cumplimiento y gobernanza

¿Cuántos pasos necesita esa tarea? ¿Qué herramientas necesitas construir para soportarla?

Comparando con una búsqueda horizontal en Google Drive, que es un paso simple y tolerante a errores, donde el usuario lee un resumen y vuelve a preguntar si hay dudas.

Ahora, una tarea de revisión legal basada en precedentes de los últimos tres años en un bufete: puede involucrar decenas de pasos, múltiples herramientas, y requerir revisión por socios, incluso argumentación en tribunales. Parecen iguales: un agente inteligente haciendo algo, pero solo la segunda requiere un software profundo construido por un equipo dedicado durante años.

¿Estás construyendo un sistema para que el cliente ejecute su trabajo, o solo añades una capa inteligente a un sistema existente?

Un sistema tiene un flujo de trabajo completo: captura de datos, gobernanza, registro de tareas. Cuando el cliente describe cómo sucede el trabajo, se refiere a ese sistema. La herramienta solo añade inteligencia a un flujo ya en marcha.

Los productos basados en herramientas también generan ingresos reales, pero los laboratorios de modelos tienen más facilidad para llevárselos, porque el cliente no depende de ellos como capa de orquestación. Los sistemas con alto valor de contrato (ACV) suelen ser productos de sistema, porque reemplazan trabajo humano real y, por tanto, se pagan en consecuencia. Pero no siempre. Pregúntate: si un laboratorio de modelos lanza un producto que compite directamente contigo, ¿el cliente seguirá necesitando tu herramienta? Si sí, estás construyendo un sistema. Si no, solo una herramienta — incluso con un ACV alto.

El rendimiento de un laboratorio de modelos se mide en benchmarks; el de una empresa en Oz, en su impacto en la cuenta de resultados del cliente.

A los clientes no les importa qué puntaje sacan en SWE-Bench o MMLU. Les importa si su agente cierra negocios, modifica contratos, o aprueba pólizas correctas. Si se enfocan en resultados específicos del flujo, en lugar de en puntuaciones generales, están en Oz. Si compran capacidades generales, están comprando lo que pueden obtener con Claude o Codex.

Las mejores empresas de agentes inteligentes operan como fondos de cobertura: ganan en alpha, que se mide en la cuenta de resultados del cliente, no en puntuaciones de benchmarks.

Veremos grandes ganadores tanto en el camino dorado como fuera de él. Los modelos seguirán ganando, porque tienen modelos y capacidades de distribución diseñadas para herramientas horizontales.

Pero las empresas en otros lugares en Oz también pueden ganar, si tienen sistemas de trabajo: interfaces para la ejecución real, y datos que fluyen y se capturan en ese proceso. Estas empresas tienen captura de datos, sistemas de flujo de trabajo, gobernanza. A medida que los flujos complejos en un sector maduran, se convierten en experiencias centrales que los clientes no pueden abandonar. Con la llegada de nuevas generaciones de modelos por parte de jugadores existentes y nuevos, estas empresas serán las que integren y entreguen esos modelos a los clientes. Los modelos base son reemplazables, pero los sistemas de trabajo no.

La próxima generación de software empresarial se construirá fuera del camino dorado.

Ver original

OpenAI consume vorazmente la capa de aplicación? a16z: las oportunidades están fuera del "Camino de ladrillos amarillos", las oportunidades para los emprendedores aún están detrás

La ansiedad se extiende: ¿los grandes modelos devoran la capa de aplicaciones?

La trampa del camino dorado: el camino mortal de las herramientas horizontales

Oportunidades en Oz: la barrera de los flujos de trabajo verticales

Ventaja en costos: enrutamiento de modelos y post-entrenamiento

Plano de control: valor en cumplimiento y gobernanza

Temas de actualidad

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

StockTradingChallengeUpTo17000U

USLaunchesNewStrikesOnIranOilRebounds

2gGoldEvery10Minutes

Fijado