Talón de Aquiles: Apple reveló la principal debilidad de la inteligencia artificial
Apple publicó un estudio que dejó al descubierto un aspecto poco explorado de la inteligencia artificial: su colapso ante problemas complejos. El documento, difundido justo antes del evento WWDC, cuestiona la efectividad real de los sistemas más avanzados cuando se enfrentan a tareas de razonamiento lógico.
Según sus autores, los llamados Large Reasoning Models (LRMs), diseñados específicamente para simular procesos de pensamiento, comienzan a fallar estrepitosamente cuando la dificultad de los desafíos aumenta. El estudio pone en duda la idea de una IA capaz de razonar como un humano y sugiere que el entusiasmo en torno a la inteligencia artificial general (AGI) podría estar adelantado a su tiempo.
Entre los modelos evaluados figuran sistemas desarrollados por OpenAI, Google, Claude y DeepSeek. Para el experimento, Apple utilizó puzzles clásicos como la Torre de Hanoi, el cruce del río y rompecabezas de bloques. Si bien los modelos demostraron eficacia en las etapas más simples, bastó con agregar un quinto disco o una ficha adicional para que su precisión se desplomara a cero.
Incluso cuando los investigadores entregaron la solución paso a paso, los sistemas continuaron fallando. A medida que el nivel de complejidad aumentaba, los modelos reducían el esfuerzo de razonamiento en lugar de incrementarlo, lo que sorprendió a los propios autores.
Una lógica que se descompone
El informe identificó tres fases de desempeño: en la primera, los modelos tradicionales superaban a los LRMs en tareas sencillas; en la segunda, los LRMs tomaban ventaja gracias a sus cadenas de razonamiento más largas. Pero en la tercera —ante problemas realmente complejos— todos colapsaban.
Además, se observó un fenómeno que los investigadores denominaron «overthinking»: los modelos hallaban una solución correcta y aun así seguían generando respuestas equivocadas. En otros casos, exploraban caminos erróneos desde el inicio y nunca lograban revertir la lógica fallida.
¿IA o ilusión de inteligencia?
Los autores sostienen que estos hallazgos no significan que los modelos carezcan de razonamiento, sino que su rendimiento no supera los límites humanos. Como señaló el experto Gary Marcus, los propios humanos también fallan en desafíos como la Torre de Hanoi con ocho discos. La diferencia es que las IAs lo hacen incluso con ayudas explícitas.
El trabajo de Apple se apoyó en modelos cerrados, lo que impidió observar cómo procesan internamente la información. Tampoco se evaluaron tareas del mundo real ni se utilizaron entornos más diversos, lo que limita el alcance de las conclusiones. Aun así, el estudio refuerza una advertencia: la IA actual no reemplaza algoritmos clásicos bien diseñados.
Una estrategia más cauta que sus rivales
La publicación de este informe a días del WWDC fue leída como un mensaje interno de Apple, que viene adoptando una estrategia de implementación más prudente que otras tecnológicas. Mientras firmas como Google y Samsung incorporan IA de forma masiva en sus productos, Apple ha sido más cuidadosa con las capacidades de razonamiento de sus modelos.
Con esta investigación, la empresa no solo advierte sobre las limitaciones actuales, sino que también marca distancia de las promesas de una inteligencia artificial «que piensa». El debate recién comienza.

