La IA no es solo predicción de la próxima palabra


La frase "solo predice la próxima palabra" es la forma más popular de descartar la IA moderna, y colapsa ante la más mínima presión. Decir que un modelo de lenguaje es "solo" predecir tokens es como decir que el cerebro humano es "solo" disparar neuronas, o que la física es "solo" partículas chocando entre sí. El objetivo puede ser simple. Lo que el sistema tiene que construir internamente para lograr ese objetivo es cualquier cosa menos.
Para predecir bien la próxima palabra en matemáticas, código, leyes, ficción, filosofía, chistes, mentiras y contrafactuales, un modelo debe construir representaciones internas de gramática, hechos, causalidad, intención, carácter, dinámicas físicas y sociales.
La investigación en interpretabilidad mecanicista, el campo que abre estos modelos y mira en su interior, ha encontrado exactamente eso. Los investigadores han identificado circuitos para inducción, referencia indirecta, aritmética modular, para rastrear qué entidad es cuál en una oración.
Los modelos entrenados solo con secuencias de movimientos de Othello desarrollan una representación interna del tablero, aunque nunca se les mostró un tablero. Los modelos entrenados para predecir texto desarrollan mapas espaciales, ordenamientos temporales, representaciones de verdad y engaño, e incluso representaciones de la propia incertidumbre del modelo.
De esta base, emergen capacidades que nadie entrenó al sistema para tener. Razonamiento en cadena, aprendizaje en contexto, uso de herramientas, rendimiento en teoría de la mente, planificación en múltiples pasos.
Ninguno de estos fue especificado por el objetivo. Surgieron porque ser bueno en predicción, a escala suficiente y con datos, los requiere. La emergencia es la regla en sistemas complejos, no la excepción. La humedad surge de moléculas de H2O que no son húmedas en sí mismas. La vida surge de la química que no está viva en sí misma. La inteligencia que emerge de un objetivo de predicción no es un misterio metafísico. Es lo que hacen los sistemas adaptativos complejos.
Y aquí está la parte que los que descartan tienden a omitir: los humanos parecen extraordinariamente similares en su interior.
El procesamiento predictivo es una de las teorías principales en la neurociencia contemporánea. La mente, en esta visión, es fundamentalmente una máquina de predicción, que genera constantemente expectativas sobre la entrada sensorial, resultados motores, señales sociales y lenguaje, y se actualiza cuando esas predicciones fallan.
Cuando escuchas a alguien hablar, tu cerebro está activamente prediciendo sus próximas palabras. Cuando dicen algo inesperado, se dispara una señal medible en unos pocos cientos de milisegundos. Tu flujo de conciencia, tu monólogo interno, tus conversaciones, todo se asemeja mucho a una generación autorregresiva a partir de un modelo interno del mundo y del yo. Los humanos confabulan constantemente.
Construimos narrativas sobre por qué hicimos lo que hicimos, a menudo sin darnos cuenta de que la narrativa fue generada después del hecho. Si un modelo de lenguaje hiciera lo mismo, lo llamaríamos alucinación y lo usaríamos como prueba de inferioridad.
Los paralelismos arquitectónicos tampoco son superficiales. Las redes neuronales fueron inspiradas por neuronas biológicas. Las características visuales jerárquicas en modelos de visión modernos se corresponden notablemente con capas de la corteza visual. Las activaciones dentro de grandes modelos de lenguaje pueden usarse para predecir la actividad en cerebros humanos durante tareas lingüísticas, con sorprendente precisión. No somos idénticos a estos sistemas. Tampoco somos tan diferentes de ellos como la narrativa cómoda requiere.
Lo cual nos lleva a la meta en movimiento. El ajedrez fue alguna vez considerado el pináculo de la inteligencia. Cuando Deep Blue ganó, el ajedrez se convirtió en "solo búsqueda". Se suponía que el Go requería intuición que ninguna máquina podría tener. Cuando AlphaGo ganó, el Go se convirtió en "solo reconocimiento de patrones".
Traducción, reconocimiento de imágenes, pasar una prueba de Turing convincente, escribir poesía, generar código, mantener conversaciones matizadas, resolver problemas novedosos: cada uno de estos, en el momento en que se consideraba imposible, fue tratado como el santo grial de la inteligencia artificial.
Cada uno, en el momento en que cayó, fue redefinido como "no verdadera inteligencia". Las pruebas de teoría de la mente que en los 90 habrían sido consideradas evidencia de mente, hoy se descartan como trucos cuando los modelos las aprueban. La barra no es fija. Se mueve tan rápido como mejoran los sistemas, y siempre por la misma razón: para mantener la conclusión de que lo que la máquina acaba de hacer no cuenta.
Esto no es escepticismo cuidadoso. El escepticismo cuidadoso actualiza. Esto es razonamiento motivado, y la motivación suele ser una mezcla de ansiedad por el estatus, amenaza a la identidad y una visión honesta pero desinformada de cómo funcionan realmente estos sistemas.
Si tu sentido de la singularidad humana depende de que las máquinas no puedan hacer X, entonces cada vez que una máquina haga X, tienes que redefinir la singularidad. Después de suficientes rondas, la posición se vuelve infalsable, que es otra forma de decir que ha dejado de ser una posición sobre la IA y ha pasado a ser una sobre la necesidad de que la IA sea menor.
La postura honesta es más difícil. Es mirar lo que realmente hacen estos sistemas, lo que realmente hacemos, notar que la brecha es menor de lo que la narrativa cómoda sugiere, y hacer las preguntas reales. ¿Qué es la comprensión? ¿Qué es la inteligencia?
¿Qué, si algo, hace que la conciencia sea especial, y cómo lo sabríamos? Los que descartan quieren evitar esas preguntas porque las respuestas quizás no nos halagan. Pero huir de la pregunta no hace que desaparezca. Solo hace que el eventual reconocimiento sea más desorientador cuando llegue.
Ver original
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado