
Otro ladrillo en el muro (de la IA)
En 1979, Pink Floyd lanzó su icónico álbum The Wall, una inquietante exploración del aislamiento psicológico. Su personaje central, Pink, construye un muro metafórico a su alrededor, ladrillo a ladrillo, mientras sufre traumas y alienación. Cada experiencia, desde la opresiva educación hasta la pérdida personal, añade una nueva capa a su impenetrable barrera psicológica. El álbum resuena con cualquiera que alguna vez se haya sentido atrapado por sus propios miedos, dudas o pasado no resuelto. Como narrativa, habla de la tendencia humana a construir barreras mentales tanto como escudo como prisión.
Curiosamente, se puede trazar un paralelo con el estado de la inteligencia artificial hoy en día. Por mucho que la IA sea una historia de avances notables, también es una narrativa de limitaciones y los muros que construimos cuando nos enfrentamos a esas limitaciones. Al igual que el muro de Pink, el campo de la IA se ha construido ladrillo a ladrillo, con cada hito celebrado como un triunfo, solo para que surjan nuevos desafíos. Nos encontramos en un momento de la historia en el que el muro de la IA está a punto de derrumbarse, revelando un nuevo mundo valiente, o de crecer más alto, reforzando los límites de nuestras aspiraciones.
El Ladrillo de la Razón: Estudio de Apple sobre LLMs
Recientemente, investigadores de Apple llevaron a cabo un fascinante estudio sobre Modelos de Lenguaje Grandes (LLMs), revelando una falla fundamental en sus capacidades de razonamiento. El experimento expuso que si bien LLMs como GPT-4o pueden generar texto coherente y contextualmente apropiado, a menudo fallan en tareas que requieren consistencia lógica o razonamiento abstracto. Por ejemplo, pueden tener dificultades con problemas básicos que involucran razonamiento de múltiples pasos, exponiendo una limitación evidente: estos modelos no realmente “piensan”.
Los hallazgos de Apple subrayan la brecha entre el rendimiento superficial de la IA y las habilidades cognitivas más profundas que asociamos con la inteligencia humana. No es que los LLMs sean inútiles; más bien, sobresalen en tareas que se asemejan a la “imitación del lenguaje” mientras que fallan en comprender genuinamente. Esta distinción es crítica a medida que las empresas cada vez más recurren a estas herramientas para tareas como la interacción con el cliente, la síntesis de documentos y la toma de decisiones.
Aunque los LLMs han demostrado ser transformadores, el estudio sirve como un recordatorio sobrio: la arquitectura actual puede que no sea la que nos impulse hacia la Inteligencia General. Esto nos lleva a una preocupación más amplia sobre la trayectoria del desarrollo de la IA.
La Desaceleración en las Mejoras de GPT
OpenAI, ha reconocido una desaceleración en la tasa de mejora en sus modelos. Según este informe de Opentools, OpenAI está cambiando su estrategia debido a los rendimientos decrecientes al escalar la arquitectura Transformer, la columna vertebral de la mayoría de los LLMs modernos. Las primeras iteraciones de GPT demostraron avances significativos en capacidad con la adición de más datos y tamaños de modelo más grandes. Pero ahora, los rendimientos de estas inversiones están disminuyendo.
Esta trayectoria de desaceleración plantea preguntas existenciales sobre el campo de la IA. Si el escalamiento por sí solo ya no es suficiente, ¿qué sigue? ¿Necesitamos paradigmas completamente nuevos para romper el muro que separa la IA estrecha del elusivo sueño de la Inteligencia General? ¿O, como sugiere el Teorema de Tesler, relegaremos estos avances a lo mundano, dejando de considerarlos IA por completo?
La Pirámide de la IA: Un Marco para Comprender
Para comprender mejor dónde nos encontramos en el viaje de la IA, es útil visualizar el campo como una pirámide. La “Pirámide de la IA”, al igual que la jerarquía de necesidades de Maslow, delinea la progresión de la inteligencia artificial a través de cinco niveles:
- Computación: La base de la IA, que comprende la potencia computacional bruta y los algoritmos necesarios para procesar datos. Sin esto, ningún sistema de IA podría existir.
- Automatización: Este nivel abarca sistemas que realizan tareas específicas basadas en reglas de manera eficiente y sin intervención humana. Piense en la automatización de procesos robóticos o chatbots básicos.
- IA Débil: Aquí, los sistemas de IA demuestran inteligencia limitada adaptada a dominios específicos. Los LLMs y los sistemas de visión por computadora entran en esta categoría, sobresaliendo en sus tareas designadas pero incapaces de generalizar más allá de ellas.
- Inteligencia Artificial General (AGI): El objetivo aspiracional de la investigación en IA, AGI poseería habilidades cognitivas similares a las humanas, capaz de razonar, aprender y adaptarse en varios dominios sin necesidad de volver a entrenar.
- Superinteligencia: El pináculo hipotético de la IA, donde las máquinas superan la inteligencia humana en todos los sentidos concebibles, transformando potencialmente la sociedad de formas que apenas podemos imaginar.
Actualmente, oscilamos entre los niveles 3 y 4. Los LLMs como GPT-4 representan el apogeo de la IA Débil, pero siguen estando limitados por el “muro” del razonamiento y la comprensión.
El Efecto de la IA y el Teorema de Tesler
Un fenómeno curioso impregna la investigación en IA: tan pronto como un sistema de IA logra competencia en una tarea particular, esa tarea deja de ser considerada como “IA”. Esto se encapsula en el Teorema de Tesler - “La IA es todo lo que aún no se ha hecho” y la ocurrencia de John McCarthy, “Tan pronto como funciona, nadie lo llama IA.” La corrección ortográfica, una vez aclamada como una maravilla de la IA, ahora es solo una característica rutinaria de los procesadores de texto. El mismo destino podría esperar a los LLMs.
El riesgo aquí no es meramente semántico. Si los avances en IA se normalizan como tecnologías mundanas, la financiación y el entusiasmo por la investigación innovadora podrían disminuir. Las empresas podrían conformarse con mejoras incrementales, sofocando la búsqueda de AGI. Esto subraya la importancia de mantener un enfoque visionario para el desarrollo de la IA.
Una Encrucijada Histórica
Nos encontramos en un momento crucial. O bien la arquitectura Transformer, con sus vastos conjuntos de datos y potencia computacional, evolucionará para mejorar las capacidades de razonamiento, impulsándonos hacia AGI, o se estancará. En el último caso, la sociedad podría acostumbrarse a los LLMs como simples herramientas, dejando de verlos como emblemáticos de la inteligencia artificial. Tal resultado reflejaría el muro metafórico de Pink Floyd: una estructura construida a partir de limitaciones y potencial no realizado.
Pero esta no es una visión pesimista. Incluso dentro de las limitaciones de la IA Débil, las posibilidades para las aplicaciones empresariales son asombrosas. Desde automatizar el soporte al cliente hasta descubrir ideas en datos no estructurados, los LLMs apenas han arañado la superficie de su potencial. Las empresas que aprovechen creativamente estas herramientas no solo desbloquearán valor, sino que también allanarán el camino para futuros avances.
¡Derribemos el Muro!
La trayectoria del desarrollo de la IA está lejos de ser cierta. Podríamos estar ante un avance monumental o enfrentando la lenta acumulación de limitaciones. El resultado depende no solo de la innovación tecnológica, sino también de la voluntad social, la inversión y la aplicación creativa de las herramientas existentes.
El final de The Wall de Pink Floyd es ambiguo, con el muro del protagonista siendo derribado, solo para dejarlo vulnerable e incierto. El muro de la IA, también, debe ser desmantelado, no en desesperación, sino con la esperanza de que lo que yace más allá valga la pena el viaje. Ya sea que logremos AGI o redefinamos los límites de la IA, la historia está lejos de terminar. Depende de nosotros asegurar que este capítulo en la historia tecnológica no sea solo otro ladrillo en el muro.