Cuando se habla de “la IA” como si fuera una sustancia histórica única, se comete ya el primer error. No existe “la IA” como algo genérico, como una sola forma, casi como si fuera una sola entidad, y no existe tampoco como un destino inevitable de la técnica, del mismo modo que no existió “la industria” como una sola forma necesaria de organizar la producción industrial. Lo que hoy se impone bajo el nombre genérico de inteligencia artificial es, más precisamente y aquí sí vale el uso del término en cierto contexto académico, un régimen técnico e histórico determinado, a saber: modelos generativos de gran escala, entrenados sobre corpus inmensos, optimizados por métodos estadísticos, ejecutados sobre infraestructuras energéticamente costosas, y desplegados por empresas; empresas que más que hacer productos construyen entornos de dependencia. La actual IA generativa es específicamente neural, basada en redes entrenables, no la IA lógica basada en secuencias de instrucciones llamados programas (que fue la dominante desde fines del siglo XX a comienzos del presente, aunque ambas emergieran casi juntas por ramas muy distintas). Y la actual, que está haciendo metástasis para todo uso en el mundo desde prácticamente 2024, no es cualquier red neural. Tampoco conforma un cerebro en ningún caso, ni en conjunto ni por separado, incluso aunque se llegara a la mistificada inteligencia artificial general (en el ambiente tecnológico se usa AGI pronunciado en inglés, para diferenciarlo de la AI que no llegaría a serlo, supuestamente). No se trata de cualquier automatización, y tampoco funciona como un gran algoritmo. No es cualquier experimento de ciencia cognitiva computacional, y tampoco es ésa la intención. Para entender las inteligencias artificiales actuales, dejo debajo una lista de videos bastante educativos, aunque técnicos. Pero lo que hoy llamamos “la inteligencia artificial”, como una gran entidad gigantesca, tal vez sí ya exista, pero no de la forma en que imaginamos. Se trata de una forma particular de articular ese cosmos artificial de hardware, software, capitales, lenguajes y, quién diría, promesas civilizatorias, que rodea al establecimiento y provisión de modelos al público basados en este tipo, muy específico, e increíblemente tosco, de redes neurales artificiales. Iré, pues, del todo a las partes. Veamos...
Para empezar, la pregunta que hay que hacerse no es si esta gigantesco servicio de IA “sirve”. Sería absurdo negar que sirve a algo. La pregunta es ¿a qué sirve? (y también ¿a quién sirve? en última instancia) Para empezar hay que recordar que sirve, en principio, para una sociedad (el término gente dejémoslo aparte por un momento) que será modificada por ésta en sus fines, porque dependerá de ella y luego la requerirá para subsistir, cosa que no es una elección previa de nadie, y lo será menos luego de que esa codependencia se establezca completamente, como ocurre con toda tecnología de uso masivo. Sin duda, la IA sirve para traducir, resumir, programar, asistir, generar imágenes, clasificar documentos, simular interlocutores, acelerar procesos administrativos, abrir zonas genuinamente fértiles de investigación, etc. Sin duda que responde bien a la pregunta utilitaria en este sentido estrecho, pero la cuestión es otra, ya que el régimen que hoy se expande como inteligencia artificial puede confundirse sin más con un camino hacia la inteligencia fuerte. ¿Se dirige hacia ahí? ¿O la AGI será sólo el zombi filosófico escalado que es ahora? Creo que estamos ante un artefacto (recuérdese esta palabra) extraordinariamente útil pero estructuralmente pobre, que por su utilidad inmediata amenaza con colonizar el espacio de las alternativas. Y el problema es que está triunfando demasiado pronto, antes de que hayamos aprendido a distinguir una competencia superficial de una verdadera comprensión, así como a no confundir correlación con causalidad, a generación con relación con el mundo, a inducción con deducción, a discernir la diferencia clave entre memoria emulada y memoria viva, así como entre agencia simulada y agencia real.
Dicho de otra forma: el problema no es que los modelos actuales no hagan nada. Hacen muchísimo, y precisamente por eso pueden instalarse como si aquello que hacen fuera equivalente a pensar. La historia de la técnica está llena de herramientas que primero resolvieron problemas parciales y luego redefinieron el horizonte de lo posible, y que al hacerlo volvieron invisible todo lo que no encajaba en su propia lógica. Acá está la cuestión que interesa: acabar con la idea de IA como noción abstracta, y que la gente tenga una somera idea de lo que sus propios inventores, creadores y desarrolladores están viendo, o sea: la metástasis de esta IA en particular.
Voy a ir por niveles del problema, yendo de los más bien prácticos y de aplicación, hasta los más teóricos y de naturaleza, para cerrar con las implicaciones humanas del asunto.
Fuentes sobre la distinción organismo-artefacto en relación con la IA neural:
Textos y papers
- Iris van Rooij et al., “Reclaiming AI as a Theoretical Tool for Cognitive Science”
https://link.springer.com/article/10.1007/s42113-024-00217-5 - Melanie Mitchell, “Why AI Is Harder Than We Think”
https://arxiv.org/abs/2104.12871 - Gary Marcus, “The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence”
https://arxiv.org/abs/2002.06177
Videos
- IBM Technology, “AI, Machine Learning, Deep Learning and Generative AI Explained”
https://www.youtube.com/watch?v=qYNweeDHiyU - 3Blue1Brown, “Neural networks”
https://www.youtube.com/playlist?list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi - “What the Books Get Wrong about AI [Double Descent]”
https://www.youtube.com/watch?v=z64a7USuGX0 - “The moment we stopped understanding AI [AlexNet]”
https://www.youtube.com/watch?v=UZDiGooFs54 - “These Numbers Can Make AI Dangerous [Subliminal Learning]”
https://www.youtube.com/watch?v=NUAb6zHXqdI - Melanie Mitchell, “Why AI is harder than we think. Melanie Mitchell. Santa Fe Institute”
https://www.youtube.com/watch?v=WF_nm0axBzo
El primer nivel de la crítica es, si se quiere, material, en sentido técnico e industrial, al menos en principio. Conviene empezar ahí porque de otro modo uno se deja hipnotizar por la interfaz: prompts a una ventanita donde una máquina responde como si fuera alguien. La “desmaterialización” conversacional es engañosa, y detrás hay data centers, electricidad, agua, chips, minerales, cadenas de suministro, capital financiero, concentración de talento, contratos de nube, y todo eso es el sustrato tanto físico como social. Se calcula que sólo en 2024 los data centers consumieron cerca del 1,5% de la electricidad mundial (más o menos 415 TWh). Una tecnología que, para sostener esta ya cada vez más fea promesa, necesita expandir de manera acelerada su infraestructura energética, y que no puede evaluarse como si fuera una mera herramienta de software. El AI Index de Stanford muestra que en 2024 alrededor del 90,2% de los modelos notables provinieron de la industria. La OCDE analizó la infraestructura de IA y descubrió sólidas barreras de salida respecto a al misma: los ecosistemas de software y hardware, como CUDA, hacen que migrar a alternativas no dependa de cambiar un componente sino de un ecosistema completo.
Ya estamos grandes para pensar el problema con un optimismo ingenuo de mercado, porque si una trayectoria tecnológica exige inversiones crecientes, que implica estándares de facto, que requiere un estándar de compatibilidad con herramientas ya existentes, y un despliegue de nueva infraestructura física costosa, entonces puede estabilizarse independientemente de si la trayectoria de desarrollo científico-técnico sea la más adecuada para sí misma desde su punto de inicio. El mercado no puede corregir estos componentes a semejante nivel, ya que los cristaliza: para un proceso de mercado, la dotación de recursos precedente no es neutral. He hablado de esto en ya demasiados posteos de mi blog, pero vale la pena repetirlo: no sólo se trata de que la demanda está atomizada y que genera una oferta compulsiva para las partes, sino que la demanda no es un ente abstracto con una subjetividad humana que sea independiente de otra oferta, teniendo esta última sus posibilidades determinadas objetivamente por necesidades tecnológicas, sino que es la demanda misma la que es co-creada con la oferta, ambas en conjunto en un gran proceso social-tecnológico, por ende inercial. En este proceso no es el mercado el que elige las relaciones sociales que exige la producción, sino que es el mercado el que acerca lo que se produce a la utilidad para esas relaciones. No existe una utilidad abstracta humana separada de los mercados, ya que es ese orden emergente en el que se insertan los hombres. La subjetividad individual puede tener libre albedrío, pero incluso así, en el caso de las sociedades impersonales, las agregaciones de voluntades de agentes decidiendo sin coordinación mutua cómo surfear las olas de los mercados y sus tecnologías, dan forma a la flota de empresas según esta acción pero no según su voluntad (Ferguson dixit), con lo cual no pueden determinar su dirección, y pueden terminar generándola aunque todos y cada uno se opongan a la misma: los capitanes de estas empresas ya no eligen los puertos, sino que es el viaje mismo el que tiene a sus acciones subordinadas. Ergo, si ambos polos (oferta y demanda) de un mismo proceso cuya lógica y forma (capitalista) opera sobre una misma materia (el mercado general), no se articulan entre sí conscientemente, aunque sea a nivel macro, pueden tomar rumbos fatales incluso respecto a sí mismas (esto Hayek lo tuvo que admitir respecto al derecho en el common law, y también en economía: no le tenía miedo a la palabra planificación en este sentido). El sendero rentable de corto plazo puede bloquear el sendero más fértil de largo plazo, y cuando ese sendero se materializa, se vuelve una infraestructura que cambia el marco de lo útil, o sea de lo eficaz y de lo eficiente. A dicha altura, cualquier corrección ya no dependerá de escribir un paper mejor, sino de mover capitales, suministrar energía, de fábricas, estándares, profesionales, contratos y expectativas.
El problema de la IA actual no es tanto que pueda imitar mal el razonamiento, que lo hace (en realidad, incluso cuando razona bien, porque le es indistinto, pero dejemos esto para después), sino más bien que parece estar construyendo un mundo donde los intentos de razonar de verdad ya no encuentren condiciones materiales para desarrollarse. Acemoglu lo plantea parcialmente cuando distingue entre una IA orientada a complementar capacidades humanas y una trayectoria actual volcada a la automatización y la concentración. Mi preocupación es similar pero le agregaría un detalle: que esa trayectoria además de ser socioculturalmente regresiva, sea cognitivamente regresiva, ya que se están premiando a sistemas que mejor escalan en el ecosistema existente, en vez de a los sistemas que más se acercan a una inteligencia real, que como desarrollaré un poco más abajo, debe estar basada en “el mundo”, la causalidad y la comprensión teorética, o sea: mediante una verdadera abstracción de la realidad.
Fuentes sobre las dependencias del camino sociotecnológicas:
Textos y papers
- IEA, “Energy and AI – Energy demand from AI”
https://www.iea.org/reports/energy-and-ai/energy-demand-from-ai - Stanford HAI, “The 2025 AI Index Report”
https://hai.stanford.edu/ai-index/2025-ai-index-report - OECD, “Competition in Artificial Intelligence Infrastructure”
https://www.oecd.org/en/publications/competition-in-artificial-intelligence-infrastructure_623d1874-en.html - Daron Acemoglu, “The AI Revolution: The Possibility of a Pro-Human Direction”
https://www.hsgac.senate.gov/wp-content/uploads/Testimony-Acemoglu-2023-11-08.pdf - Kate Crawford, “Atlas of AI”
https://yalebooks.yale.edu/book/9780300264630/atlas-of-ai/ - Kate Crawford & Vladan Joler, “Anatomy of an AI System”
https://anatomyof.ai/
Videos
- Kate Crawford, “Kate Crawford: Anatomy of AI”
https://www.youtube.com/watch?v=uM7gqPnmDDc
El segundo nivel es la arquitectura física del cómputo. La metáfora de la “red neuronal” suele ocultar que una red artificial contemporánea, aun cuando use “pesos” y “activaciones”, corre sobre máquinas con hardware (CPUs, GPUs) y software (emuladores de redes neurales haciendo procesos matemáticos en bruto) que utilizan de soporte material a, precisamente, el sistema con una lógica casi diametralmente opuesta a la neural (entrenable), o sea: el modelo lineal de cómputo lógico-algorítmico (programable), que sería llamado de “von Neumann”, en el que necesariamente está separada, por un lado, la memoria como datos discretos, y, por el otro, el procesamiento lógico-matemático que los articula y ordena. En una arquitectura von Neumann, los datos se almacenan en un lugar y se procesan en otro. El resultado es que una parte enorme del costo temporal y energético no está en la operación matemática en sí, sino en mover datos. IBM se puso al hombro el problema, y lo resumió lacónicamente con una simple aserción: el costo de tiempo y energía asociado al movimiento de datos es el obstáculo más importante del cómputo utilizado en la IA. Punto. Hay que evitar confundir una abstracción matemática con su encarnación física. Que una red artificial tenga “pesos” no la vuelve materialmente análoga al cerebro, y en el cerebro, la memoria está encarnada en la estructura misma que la procesa, o sea: cada sinapsis no es una celda de memoria externa que un procesador consulta sino que es su mecanismo base de transmisión y modificación. En una red biológica, la historia del sistema está escrita en la forma misma del sistema. En la IA contemporánea, en cambio, la red es una emulación estadística, y encima lo hace sobre una arquitectura que transporta matrices. Podrá ser una emulación asombrosa, pero sigue siendo una emulación, que opera sobre un sustrato físicamente torpe, que se da de patadas con aquello que, encima, simplemente pretende imitar.
Por eso las líneas de investigación, como ser la de compute-in-memory, in-memory computing, memristores, chips neuromórficos, SNNs, arquitecturas event-driven, etc., no son exotismos marginales a la labor científica actual en IA, sino que, muy por el contrario, son respuestas al hecho de que el régimen actual separa aquello que en la biología va unido, a saber, memoria y cómputo, estructura y proceso, estado y operación. Obviamente, un chip neuromórfico no resuelve por sí solo el problema de la inteligencia, en tanto no alcanza con hacer spikes para obtener causalidad, ni alcanza con integrar memoria para obtener deducción, pero es condición necesaria, y ya de por sí es útil con sólo esto. Sin un sustrato que haga viable el aprendizaje continuo, temporal y local (i.e. donde los ajustes de las conexiones vía pesos sinápticos se realizan utilizando solo la información disponible en la propia neurona o en sus conexiones directas, a diferencia del modelo de retropropagación), las formas más interesantes, e infinitamente mejores energéticamente, de inteligencia artificial quedan materialmente penalizadas, y hace que en vez de crearse agentes que aprendan “viviendo”, sea más barato (pero más caro luego, aunque esto el mercado nunca lo pueda mensurar) seguir fabricando modelos pasivos enormes. No se trata aquí de “digital vs. analógico” (esto también, pero es otro punto) o “sintético vs. biológico” (esto ya tiene más ribetes metafísicos respecto a la demarcación de qué es orgánico), sino de la oposición entre una memoria externa servida a un procesador versus una memoria incorporada en el proceso mismo. Una IA más natural, orgánica aunque sea sintética, tendría que acercarse a esta segunda forma, y repito: no es necesario para esto que sea de carne, ni que tenga neuronas biológicas, pero sí estar organizada como un sistema unificado donde recordar, computar, ordenar, modificar y actuar, no sean operaciones separadas.
Fuentes sobre las redes neuromórficas y las soluciones a la emulación:
Textos y papers
- IBM Research, “In-memory computing”
https://research.ibm.com/projects/in-memory-computing - IBM Research, “In-memory hyperdimensional computing”
https://research.ibm.com/blog/in-memory-hyperdimensional-computing - Intel, “Neuromorphic Computing”
https://www.intel.com/content/www/us/en/research/neuromorphic-computing.html - Samuel Schmidgall et al., “Brain-inspired learning in artificial neural networks: a review”
https://arxiv.org/abs/2305.11252
Videos
- IBM, “What is In-Memory Computing?”
https://www.youtube.com/watch?v=BTnr8z-ePR4 - Intel, “Architecture All Access: In Conversation on Neuromorphic Computing”
https://www.youtube.com/watch?v=aIESmwxuJbE
El tercer nivel es la diferencia entre el modelo de la red basada en el perceptrón artificial y el basado en la neurona biológica. Un perceptrón, en su forma elemental, es una suma ponderada seguida de una función de activación. O sea, grosso modo: entran valores, se multiplican por pesos, se suman, y se produce una salida. Es una abstracción ingeniosa que se vuelve empobrecedora si se la toma como imagen adecuada de una neurona. La neurona biológica se basa en el tiempo, tiene una historia, opera con membranas, tiene refractariedad, y mil otros elementos cada uno con una función en un modelo radicalmente distinto: dendritas, oscilaciones, spikes, umbrales dinámicos, neuromodulación, plasticidad local y estados internos. No hace “cálculos” matemáticos sino que almacenamiento y proceso son locales aunque el conjunto lógica-memoria sea holístico (realmente holístico), y además vive en una dinámica temporal.
Charles Simon, en su serie divulgativa sobre por qué el machine learning no es como el cerebro, lo explica con una imagen bastante útil. Muchos modelos artificiales tratan el valor de una neurona como si fuera una tasa o magnitud agregada; una neurona biológica usa timing, fase y relaciones temporales entre spikes. El perceptrón ignora el timing relativo o la fase, y se queda con una magnitud agregada. Nada de esto significa que la neurociencia sea reducible al argumento de Simon, ya que la biología integra a las señales como información, pero la cuestión es que una red de perceptrones estáticos no tiene nada que ver con el modo en que el cerebro hace del tiempo una dimensión interna de la información. Buzsáki lleva esto a un modelo todavía más amplio, según el cual el cerebro no es un dispositivo pasivo que recibe inputs, sino un sistema que produce actividad desde adentro hacia afuera y usa la acción para dar significado a la percepción. Freeman, con su énfasis en la dinámica no lineal, en atractores y oscilaciones, había insistido también en que el significado emerge en estados globales de un sistema vivo, y que no reside en agregados de símbolos aislados ni en rasgos estadísticos. Una red sintética verdaderamente más orgánica no debería limitarse a imitar la apariencia general de una red.
En este punto aparece el ejemplo del niño que aprende una figura o el número “1” (cualquier ejemplo sirve). La comparación con MNIST es ilustrativa: una red clásica puede requerir miles o decenas de miles de imágenes etiquetadas para clasificar dígitos manuscritos con alta precisión. Un niño, en cambio, no aprende el “1” como una nube estadística de píxeles en base a una inducción de fuerza bruta de impresiones (Hume creía que de esta última forma operaba la abstracción, pero su teoría empirista nunca representó la realidad de la cognición humana). Lo ve, lo traza, sigue el trayecto de la línea, lo vectorializa, lo reconoce deformado, lo diferencia de otros signos, luego lo ubica en una serie, lo usa para contar, lo relaciona con “uno” como cantidad, con “primero” como orden, con marcas en objetos, con dedos, con prácticas, etc. Las mentes biológicas, los animales (sean o no racionales, esto va aparte), aprendemos una forma visual investigándola, buscando su esencia abstracta y luego intentando que lo visto encaje en ella (Husserl dixit: intuición eidética); no aprendemos una aproximación estadística de lo que un entrenador nos marcó en el cerebro como reflejo que es “la misma cosa”, asociándonos a lo bruto millones de imágenes para lograr guardar una suma de relaciones promedio de valores enlazados con un valor de salida único. O sea, las redes biológicas en un cerebro real, ante la imposibilidad metafísica de abstraer directamente (por fuera de los sentidos) la esencia y forma de un ente dado en la realidad, nos inspiramos en esa cosa y su relación con la idea tras la misma (abducción), véase: hacemos teoría desde la coherencia lógica que la distinga, y contrastamos con qué concepto encaja mejor de los que elaboramos (deducción). Aprendemos una función dentro de un sistema de significado, de acciones y símbolos. Lake, Salakhutdinov y Tenenbaum formulan este contraste: las personas pueden generalizar desde uno o muy pocos ejemplos y usar conceptos para la propia acción, la imaginación y la explicación de la realidad. Zador agrega que los animales no aprenden desde una tabula rasa estadística: traen sesgos inductivos fuertes incorporados en la arquitectura del sistema nervioso. Si bien el genoma no codifica cada aprendizaje concreto, sí establece estructuras y predisposiciones que hacen posible aprender realmente, y hacerlo por ende mucho más rápido. Así, el niño no “supera” a la red generativa porque tenga más datos, sino porque tiene cuerpo, un mundo que reflejar, acción en el mundo, prácticas y un tipo de aprendizaje que no está condenado a reconstruir todo desde cero.
De vuelta: este ejemplo del “1” de Simon me llama la atención en su sencillez: muestra una diferencia clave que le separa de la clasificación. Una cosa es reconocer una imagen como perteneciente a una clase, pero otra muy distinta es poseer un concepto que puede participar en operaciones, explicaciones, acciones y reglas, más allá de la clasificación, o mejor dicho, como causa de la creación de esa clasificación en primer lugar. Si una red dice “esto es un 1” después de millones de ejemplos, puede haber aprendido una frontera de decisión sofisticada, pero no entiende qué es un “1” en la trama de usos donde el signo vive. El niño, en cambio, aprende el “1” como un signo en sí mismo, a partir de la forma, como gesto, luego como cantidad, como lugar en una serie, como herramienta. Y por eso el aprendizaje humano no es sólo más eficiente en muestras, sino que es ontológicamente eficaz.
Fuentes sobre las redes neurales biológicas en contraste con las artificiales:
Textos y papers
- Brenden Lake, Ruslan Salakhutdinov & Joshua Tenenbaum, “Human-level concept learning through probabilistic program induction”
https://www.science.org/doi/10.1126/science.aab3050 - Andrew Zador, “A critique of pure learning and what artificial neural networks can learn from animal brains”
https://www.nature.com/articles/s41467-019-11786-6 - György Buzsáki, “Emergence of Cognition from Action”
https://pmc.ncbi.nlm.nih.gov/articles/PMC4895837/ - György Buzsáki, “The Brain from Inside Out”
https://global.oup.com/academic/product/the-brain-from-inside-out-9780190905385 - Charles Simon, “Machine Learning Is Not Like Your Brain Part One: Neurons Are Slow, Slow, Slow”
https://www.kdnuggets.com/2022/04/machine-learning-like-brain-part-one-neurons-slow-slow-slow.html - Charles Simon, “Machine Learning Is Not Like Your Brain Part Two: Perceptrons and Neurons”
https://www.kdnuggets.com/2022/05/machine-learning-like-brain-part-two-perceptrons-neurons.html
Videos
- Charles Simon, “Machine Learning vs Human Learning: They’re Not the Same”
https://www.youtube.com/watch?v=3YXM5Nhf5f0 - Charles Simon, “How Your Brain REALLY Works: What AI Still Doesn’t…”
https://www.youtube.com/watch?v=5Crck_r2vuo - Charles Simon, “AI Can Predict—But Can It Understand? A New Architecture …”
https://www.youtube.com/watch?v=WTAMJr6mMCY
La cuestión del aprendizaje lleva a una distinción que conviene hacer con cuidado entre inducción, deducción y abducción. La IA actual aprende por inducción estadística: a partir de ejemplos, ajusta parámetros para capturar regularidades, y como sólo puede hacer esto, el criterio para encontrar regularidades es exógeno. No es para nada una inducción ingenua ni pobre: puede descubrir estructuras latentes, composiciones parciales, analogías, regularidades sintácticas, relaciones semánticas, patrones del mundo sedimentados en texto e imágenes, y sólo en este sentido “crear”. Pero, usando términos de Popper, no es el mundo 2 popperiano, sino el mundo 3 que ha tomado “vida”. En términos de la termodinámica, no crea verdadera información nueva, por más “temperatura” que se le permita al modelo. No hay abducción ni deducción que genere sintéticamente novedad. Sigue siendo, en su base, meramente una novedad analítica: aprendizaje por regularidades observadas. La deducción fuerte es otra cosa: consiste en derivar conclusiones nuevas que se siguen necesariamente de premisas por reglas que preservan validez, pero que no están explicitadas en aquellas. Si las premisas son verdaderas y la inferencia es válida, la conclusión no puede ser falsa. La abducción fuerte, por su parte, es mucho más que inventar una explicación plausible al activar el “recuerdo” estadísticamente grabado de patrones similares, precisamente porque en la inferencia estadística no hay verdadera evocación sino un reflejo: la red no busca dentro de sí, sino que refleja en forma conductual sin tener separadas la causa de la búsqueda y el resultado. No hay verdaderas hipótesis, que impliquen derivar consecuencias esperables, diseñar pruebas discriminantes y actualizar el modelo cuando la evidencia vuelve. Y, por último, quizás lo más importante, es que no hay inducción fuerte sin una abducción fuerte que logre un criterio previo para abstraer para así poder inducir, así como tampoco la hay sin una deducción fuerte que logre relacionar lo inducido con el conocimiento previo.
Cuando un LRM “razona”, puede estar haciendo algo real en el plano funcional: una búsqueda interna, una revisión, una generación de pasos, luego auto-corrección y exploración de cadenas. Pero si no hay un mecanismo que obligue la validez de esos pasos no se puede hablar de deducción en sentido fuerte sino débil: mera producción de razonamientos probables. Y probables sólo para nosotros, no para sí mismo, ya que no tiene nada contra lo cual contrastar. Puede acertar mucho y, sin embargo, estar estructuralmente autorizado a dar un salto inválido. Puede también generar una explicación plausible sin estar haciendo abducción en sentido fuerte, porque la explicación no queda puesta en riesgo por pruebas diseñadas para refutarla. No sería un tanteo sino una reacción. Y podría “imaginar” escenarios sin que esa imaginación esté anclada en un modelo causal sometido a intervención. No agrega entropía a la cultura.
Pearl distingue entre ver, hacer e imaginar, lo cual, otra vez, es una forma analógica del proceso interno de inducir, deducir y abducir. Ver sería observar correlaciones; hacer sería intervenir, e imaginar sería razonar contrafácticamente. El aprendizaje estadístico puede ser extraordinario en el nivel del ver, pero resulta que la ciencia y la comprensión exigen hacer e imaginar. Si una IA no tiene un operador interno equivalente a la intervención, si no puede representar qué pasaría al forzar una variable, si no puede distinguir correlación de causalidad, entonces su abducción queda degradada a una narración simulada. Puede decir “la causa probable es X”, pero no necesariamente entiende en qué condiciones X dejaría de ser causa, qué prueba lo separa de Y o qué mundo alternativo se seguiría de otra intervención. El problema de la “inducción” no es que inducir sea algo malo per se, ya que la inducción es condición necesaria del aprendizaje, pero precisamente es necesaria para el aprendizaje en tanto la inducción, para llevar a aprender algo, obliga a llegar a una deducción a contrastar, así como inspira a la creación de teorías mediante el mismo criterio abductivo que lleva a concebir una causalidad a partir de una correlación.
Una inteligencia fuerte sintética debería poder integrar inducción, deducción y abducción (de hecho, no son separables) en un sistema donde cada forma de inferencia tenga su legalidad propia. La inducción es la vía para descubrir regularidades, mientras que la deducción preserva validez relacional, y la abducción busca explicaciones verosímiles y las somete a riesgo (partiendo de nociones sustantivas de lo verdadero, que luego bajan como deducciones sobre más inducción). En la IA actual, estas dimensiones aparecen mezcladas en una competencia textual general, todas sostenidas sobre una inducción operando por fuerza bruta y asistida desde el exterior para que no se descarrile en su entropía ciega. Entropía que en el fondo no es entropía, ya que no hay nueva información en términos cualitativos: el único elemento neguentrópico son los entrenadores, y sólo mantienen un simulacro de neguentropía en tanto no hay relación entre los elementos estabilizados. Las alucinaciones no son accidentes subjetivos de una tendencia a la objetividad. Hinton y su amigo Dawkins se equivocan, pues, de cabo a rabo: existe un teatro de la mente (así como el dolor de una lastimadura existe sólo en la mente y la lastimadura en sí sólo fuera de ella, siendo que ésta no pasa en tanto tal a través del sistema nervioso), pero en las IA es un teatro sin guión teatral y ciego al público, donde los actores son como autómatas que se colocan con recuerdos ajenos, para luego improvisar continuamente, en un groove trucho, por asociación mecánica con esos recuerdos.
La fenomenología de las IA generativas es siempre la misma: no hay ninguna arquitectura donde la validez lógica, la intervención causal y la búsqueda de explicación sean parte del proceso mismo. Éstas entran de vez en cuando por el techo del pre-entrenamiento, como filtros externos o estilos de respuesta, manteniéndose siempre adelante y como base condicionante de un entrenamiento que nunca le supera como parámetro guía (los descarrilamientos son sólo productos emergentes, con suficiente tiempo, de los carriles previos, lo cual muestra además que no emergen equilibrios metaestables, y por esto no hay nada peor para entrenar una IA que lo generado por sí misma o por otra IA), muy a diferencia del aprendizaje real que, contra lo que nos dice la nefasta educación positivista desde hace un par de siglos a esta parte, es siempre primero creación teorética del sujeto, inspirada por el mundo y guiada por la distinción de lo verdadero –y aquí remito a los textos sobre epistemología y pedagogía de Zanotti padre e hijo, haciendo la salvedad de que no adhiero a la posibilidad en ciencias sociales de modelos apriorísticos (ni por agregación, ni sistémicos), salvo y exclusivamente en las ciencias formales (que precisamente son formales por ser un desarrollo autoconsciente de la racionalidad misma).
Fuentes sobre los modelos generativos en base a fuerza bruta inductiva:
Textos y papers
- Judea Pearl & Dana Mackenzie, “The Book of Why – Chapter 1: The Ladder of Causation”
https://bayes.cs.ucla.edu/WHY/why-ch1.pdf - Judea Pearl, “Causality: Models, Reasoning, and Inference”
http://bayes.cs.ucla.edu/BOOK-2K/ - Artur d’Avila Garcez et al., “Neural-Symbolic Learning and Reasoning”
https://arxiv.org/abs/1711.03902 - Robin Manhaeve et al., “DeepProbLog: Neural Probabilistic Logic Programming”
https://arxiv.org/abs/1805.10872
Videos
- Judea Pearl, “The New Science of Cause and Effect”
https://www.youtube.com/watch?v=ZaPV1OSEpHw
La investigación de Newell y Herbert Simon vuelve a este punto con una increíble actualidad, resolviendo el cómo se inserta la lógica en la “materialidad” en el modelo originario y genuino (biológico) de una red neural. La Physical Symbol System Hypothesis sostenía que un sistema físico de símbolos posee los medios necesarios y suficientes para la acción inteligente general. Uno puede no aceptar la tesis en su literalidad fuerte y, de hecho, gran parte de la historia posterior de la inteligencia artificial y de las ciencias cognitivas fue una revisión de esta hipótesis, pero... el problema que Newell y Simon plantearon no cambió en nada: la inteligencia real parece necesitar manipulación de una estructura de conceptos en base a reglas, puesto que sin algún tipo de estructura real, discreta, la red puede producir regularidades pero no necesariamente legalidad.
Ahora bien, esto no implica volver sin más a la IA simbólica clásica: el problema no se resuelve reemplazando una red por el clásico sistema experto, rígido, que confunde inteligencia con manipulación explícita de símbolos escritos, al estilo del lenguaje de programación Prolog. Este modelo representa el problema opuesto al neural perceptrón, en la imitación del pensamiento humano: un edificio procedimental lógico que convierte el lenguaje en hechos y reglas como variables y condicionales, sin percepción global simultánea y de conjunto. La cuestión es la integración de ambos mundos de IA: cómo hacer que la validez, la operación lógica de unidades de sentido, sea endógena a un sistema neural. O sea: neural-simbólico. En otras palabras, nadie quiere seguir con los actuales modelos neurales para hacer IA generativas, donde los perceptrones son como perros de Pavlov puestos en columnas esperando disciplinariamente una penalidad; que conforman un orden espontáneo del que emerge una respuesta, que luego el sistema se la pasa a un verificador externo como quien manda un texto a corregir. Lo que se busca es precisamente lo contrario: una arquitectura en la que ciertas transiciones inferenciales inválidas sean directamente imposibles, inestables o penalizadas por la dinámica interna. Que sean “molestas” para la red, por lo mismo que a nuestras mentes nos provoca rechazo ver un triángulo de Penrose. Una deducción fuerte endógena implica una propiedad del espacio de estados dentro de la red, y no es una decoración formal agregada al final.
SATNet, DeepProbLog, semantic loss y otras líneas neuro-simbólicas son intentos parciales de acercarse a eso. SATNet integra un solver para buscar grados de satisfacción dentro del loop de deep learning. DeepProbLog combina programación lógica probabilística con predicados neuronales. La semantic loss introduce una función de pérdida que conecta salidas neuronales con restricciones lógicas. Estas soluciones todavía no son, ni de lejos, la forma final de una inteligencia sintética orgánica, pero al menos siguen siendo híbridos con piezas formales explícitas que muestran el vacío que las actuales IA no pueden llenar, demostrando que la estructura no tiene que venir de un auditor externo, sino que es parte misma del cómputo.
Por una dirección ya más matemática aparecen, y enumero a grosso modo: Birkhoff, los retículos, luego Wille y Ganter con el análisis formal de conceptos, y Kuznetsov en líneas afines. Nos recuerdan que el conocimiento va más allá de una nube de vectores en campos multidimensionales continuos y sin relación interna, en tanto implican un orden, una interrelación mutua, y una interrelación objeto-atributo. La lógica de retículos y los cierres de Galois si bien no son una receta para reemplazar transformers, logra advertir que hay formas de estructura conceptual que no se reducen a proximidades en un embedding. Si una IA fuerte debe abstraer, clasificar y deducir, necesitará de un sistema de legalidad conceptual. El mapa multidimensional de los conceptos que iluminan el trayecto hasta las neuronas de salida de los tokens finales, no se basa meramente en trayectos afianzados, que discurren a través de las capas, sino que incluyen nexos internos dentro de cada capa que conectan un vector con otro. Nada de esto existe en el modelo actual de inteligencia artificial, y para que exista se requiere replantear todo el modelo.
Fuentes sobre redes neuro-simbólicas:
Textos y papers
- Allen Newell & Herbert A. Simon, “Computer Science as Empirical Inquiry: Symbols and Search”
https://courses.media.mit.edu/2004spring/mas966/Newell%20Simon%20Physical%20symbol%20systems.pdf - Po-Wei Wang et al., “SATNet: Bridging Deep Learning and Logical Reasoning Using a Differentiable Satisfiability Solver”
https://arxiv.org/abs/1905.12149 - Jingyi Xu et al., “A Semantic Loss Function for Deep Learning with Symbolic Knowledge”
https://arxiv.org/abs/1711.11157 - Bernhard Ganter & Rudolf Wille, “Formal Concept Analysis: Mathematical Foundations”
https://link.springer.com/book/10.1007/978-3-642-59830-2 - Sergei Kuznetsov, “Mathematical Aspects of Concept Analysis”
https://link.springer.com/chapter/10.1007/3-540-45499-2_29
Videos
- “Learning with Logical Constraints”
https://www.youtube.com/watch?v=10gERXLjzYU - IBM Technology, “What Is NeuroSymbolic AI? Bridging Reasoning & Neural Networks”
https://www.youtube.com/watch?v=ZfWDVO3rzeA
La retropropagación merece una discusión aparte. Ahora bien, aclaro: el backpropagation no es “el mal”, no es una estupidez. Hay que aclararlo por si acaso. Es cierto que es una de las herramientas más poderosas de la historia del aprendizaje automático basado en un modelo neural. El problema es que se volvió el centro de un régimen conceptual. Es una concepción casi tiránica que identifica aprendizaje con un ajuste masivo de parámetros por gradiente en modelos entrenados offline. Desde el punto de vista biológico, el backprop es un callejón sin salida: se requiere una forma de asignación de crédito global, simetrías o transportes de información que no están en ningún modelo posible de cerebro biológico. Implican, además, una separación entre fase de entrenamiento e inferencia que no se parece en nada a la forma continua y local en que aprenden los organismos.
¿Cuáles son las alternativas? Aun dentro de nuestras IAs de modelos estocásticos (véase: con transferencia de información numérica, con variables continuas de estimulación en vez de saltos discretos en cada neurona, y con información digital discreta en vez de impulsos continuos en su comunicación, además sin deducción fuerte ni lógica interna al proceso), se puede al menos lograr algo al respecto, con distintas opciones, entre otras: el predictive coding como aproximación local al backprop; el más que interesante equilibrium propagation como aprendizaje en modelos de energía; el feedback alignment como uso de señales de error no simétricas o incluso aleatorias, e incluso el Forward-Forward de Hinton como reemplazo del pase backward por dos pases forward, reglas de tres factores en redes spiking, neuromodulación, STDP, reservoirs y liquid state machines. Entiendo muy por arriba la idea, pero al menos me deja tranquilo que haya consciencia del problema incluso en los defensores de los modelos actuales de perceptrón.
Obviamente estas líneas no son equivalentes ni todas igualmente prometedoras, pero comparten una intuición, y es que el aprendizaje puede organizarse de modo más local, temporal, dinámico, e incorporado en la propia actividad del sistema. Las PCNs, o predictive coding networks, son interesantes porque convierten la predicción y el error de predicción en la moneda de la red (¡al fin!). Equilibrium propagation sugiere que inferencia y aprendizaje pueden surgir de una misma dinámica. Feedback alignment muestra que no hace falta copiar de manera exacta los pesos de retroalimentación para asignar crédito útil. Forward-Forward intenta evitar el backward clásico. Las reglas de tres factores recuerdan que, en biología, la plasticidad, en vez de depender de dos neuronas que se activan juntas, se basa en señales moduladoras globales, como recompensa, sorpresa o novedad.
Cada una de estas técnicas permite una modalidad de inteligencia distinta, pero al menos es algo. Si bien no es una red natural, es al menos una red más natural, y si bien “calcula”, no es que use spikes por estética, ni que la memoria esté congelada como un conjunto de pesos actualizados en enormes sesiones de entrenamiento. Al tener una memoria distribuida con plasticidad local, el error no será una señal abstracta que llega desde una pérdida global, y tendrá que implicar un aprendizaje que vaya más de ser un evento de fábrica a ser una propiedad permanente del estar-en-el-mundo del sistema, si queremos decirlo en términos casi heideggerianos. No importa, al menos en esto, que la red sea sintética, que esté hecha de silicio, memristores o cualquier otro sustrato, como quieren algunos fetichistas del carbono, sino que lo que importa es que sea más orgánica, o sea, que su organización una el cómputo con la memoria, y la acción con la modificación. Recuérdese que lo orgánico no significa biológico: puede ser sintético, pero el punto es que esté integrado, que no sea un mero artefacto que ni siquiera imite a un organismo.
Aclaración: estas propuestas de sistemas neurales no llegan a los modelos biológicos, ni mucho menos; no solucionan varios de los problemas mencionados en los otros apartados de este mismo posteo, pero al menos son soluciones de simulación de características de los resultados de las redes neurales biológicas, siempre dentro del modelo de perceptrones. Sigamos...
Fuentes sobre la retropropagación y sus alternativas:
Textos y papers
- Alex Millidge et al., “Predictive Coding Approximates Backprop along Arbitrary Computation Graphs”
https://arxiv.org/abs/2006.04182 - Benjamin Scellier & Yoshua Bengio, “Equilibrium Propagation: Bridging the Gap between Energy-Based Models and Backpropagation”
https://arxiv.org/abs/1602.05179 - Timothy Lillicrap et al., “Random feedback weights support learning in deep neural networks”
https://arxiv.org/abs/1411.0247 - Geoffrey Hinton, “The Forward-Forward Algorithm: Some Preliminary Investigations”
https://arxiv.org/abs/2212.13345 - Nicolas Frémaux & Wulfram Gerstner, “Neuromodulated Spike-Timing-Dependent Plasticity, and Theory of Three-Factor Learning Rules”
https://www.frontiersin.org/articles/10.3389/fncir.2015.00085/full - Wolfgang Maass et al., “Real-Time Computing Without Stable States: A New Framework for Neural Computation Based on Perturbations”
https://igi-web.tugraz.at/PDF/130.pdf
Videos
- Artem Kirsanov, “The Brain’s Learning Algorithm Isn’t Backpropagation”
https://www.youtube.com/watch?v=l-OLgbdZ3kk - Charles Simon, “Reaction to Predictive Coding: Biologically Plausible? Not So Fast!”
https://www.youtube.com/watch?v=YLy2QclpNKg - Serge Massar, “Machine Learning through Equilibrium Propagation: Extending the framework to quantum, thermal, and time dependent systems”
https://scivideos.org/pirsa/25120038
Ahora bien, una red puede volverse más temporal, local, eficiente, todo lo que se quiera, y aun así no tener “mundo”. Es decisivo que haya un eje en la agencia, y no que la agencia sea una mera simulación por imitación en ráfagas de procesos recursivos. Mucha gente confunde predicción con lo que hace un LLM al “predecir” tokens, pero en realidad no hay verdadera predicción aquí, como bien plantea Friston, ni siquiera en este sentido restringido. No hay en realidad salidas erróneas de la capa de salida, sino salidas más o menos parecidas en coherencia a lo escrito en los tokens ya existentes leídos por la capa de entrada. Es precisamente esa coherencia lo que queda en la forma del modelo: una fotocopia de la naturaleza del, Popper dixit, “mundo 3 humano”, y recién ahí una apariencia de reflexión del “mundo 2”. Vale la pena conocer estas categorías, que no deberían confundirse con la idea de mundo en general, que es como venimos usándolo, y que sin embargo sirve mucho para entenderlo en su relación con la cuestión de la inteligencia. Veamos: el mundo 3 popperiano es algo así como la “Idea” en Hegel (aunque sin necesariamente un desarrollo ontogenético internamente determinado en forma sistémica), o sea: es el plano o “capa social” de la estructura de la realidad donde se pueden entender los productos del intelecto humano: teorías, mitos, arte, instituciones sociales y lenguaje, que son ese conocimiento objetivo e independiente del hombre, que en lo corpóreo se plasma en soportes como libros, computadoras, partituras, o transmisión oral; el mundo 2 popperiano es el plano o “capa sensible” de la estructura de la realidad donde se puede entender el universo de las experiencias, la conciencia, la psicología y los procesos mentales de los individuos relacionados, y finalmente el mundo 1 popperiano es el plano o “capa física” de la estructura de la realidad donde se pueden entender el universo “material”, los objetos, la energía y los seres vivos, etc. Puestos en conjunto estos tres “mundos”, se nos aparece más clara la idea de mundo, en sentido amplio, vital, que es de lo que aquí hablamos. Y predecir tokens no es predecir el mundo.
En active inference y predictive processing, el modelo generativo anticipa consecuencias sensoriales de acciones, minimiza errores de predicción y regula su acoplamiento con el entorno. Pezzulo, Friston y otros distinguen así entre la IA generativa pasiva y los organismos que adquieren y usan modelos generativos en interacción propositiva con el mundo. Sutton lo formula admirablemente: un world model debería permitir predecir qué va a pasar, no qué diría una persona. Si hace esto último sin lo primero, en realidad sólo estará “recordando”, sin siquiera saberlo, el patrón de comportamiento de personas pasadas, en base a sus producciones. La diferencia es abismal.
Otra referencia inevitable, LeCun, propone algo cercano, aunque quizás desde un enfoque bastante más ingenieril, planteando world models (modelos basados en el mundo), sistemas de motivación intrínseca, JEPA, predicción en espacios latentes, etc. La idea de JEPA sería predecir representaciones y no quedarse en la generación superficial de píxeles o tokens, que sólo servirían teniendo que reconstruir cada detalle sensorial, que no es la idea. En vez de eso lo que se intenta es la captación de las variables latentes que estructuran el mundo. Está también Hasani con las liquid neural networks agregando otro ingrediente en esta salsa: modelos con dinámica continua capaces de adaptarse a entornos cambiantes. Luego están HOPE y Nested Learning, desde el lado de Google que, ni lento ni perezoso, apunta al aprendizaje continuo, a la memoria en base a la auto-modificación. Todas estas líneas son distintas; algunas siguen dentro del deep learning convencional, pero empujan contra la misma muralla del mainstream basado en el modelo estático, pasivo, entrenado de una vez y sin experiencia propia.
En resumen para esta cuestión: la verdadera IA predictiva fuerte tendría que tener agencia real en vez de agencia simulada. Agencia real significa que el sistema actúa, que sus acciones modifican el mundo, que el mismo mundo le devuelve error (que recién ahí aparece el direccionamiento de la observación, como en las redes neurales biológicas, humanas o no), que ese error actualice el modelo, y que el sistema aprenderá de las consecuencias, lo cual exige distinción del error y por ende una idea misma de verdad como adecuación a la realidad (sería gracioso, si no fuera triste, que los creadores de la IA neural hayan tenido que pensar en esto dándose un palazo ellos mismos contra ésta). Vale insistir: esto no exige necesariamente un robot humanoide que tenga corporeidad clásica, ya que puede haber agencia en entornos digitales, científicos, económicos o simulados; lo que sí exige es un lazo causal. Que el output del sistema no sea un texto que se pierde en una pantalla sino una intervención a la que se siga el rastro y le vuelva como evidencia. Sin eso la IA podrá parecer un científico escribiendo hipótesis, pero no será un científico, porque hará imitaciones de hipótesis, las que no podrá contrastar porque no tiene laboratorio propio, y no podrá abstraer porque no será capaz de discernir su objeto de estudio, ya que se lo habrán provisto.
Fuentes sobre los modelos del mundo:
Textos y papers
- Giovanni Pezzulo et al., “Active inference and the scope and limits of passive AI”
https://www.cell.com/trends/cognitive-sciences/fulltext/S1364-6613(23)00260-7 - Karl Friston, “The free-energy principle: a unified brain theory?”
https://www.nature.com/articles/nrn2787 - Richard Sutton, “Father of RL thinks LLMs are a dead end”
https://www.dwarkesh.com/p/richard-sutton - Yann LeCun, “A Path Towards Autonomous Machine Intelligence”
https://openreview.net/pdf?id=BZ5a1r-kVsf - Mahmoud Assran et al., “Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture”
https://arxiv.org/abs/2301.08243 - Ramin Hasani et al., “Liquid Time-constant Networks”
https://arxiv.org/abs/2006.04439 - Ali Behrouz et al., “Nested Learning: The Illusion of Deep Learning Architectures”
https://arxiv.org/abs/2512.24695
Videos
- Richard Sutton, “Can humans make AI any better?”
https://www.youtube.com/watch?v=2hcsmtkSzIw - Richard Sutton, “Rich Sutton discusses The Bitter Lesson and how human and …”
https://www.youtube.com/watch?v=OMjAuwWyP44 - Richard Sutton, “Father of RL thinks LLMs are a dead end”
https://www.youtube.com/watch?v=21EYKqUsPfg - Yann LeCun, “A Path Towards Autonomous Machine Intelligence”
https://www.youtube.com/watch?v=OKkEdTchsiE - Yann LeCun, “The LLM Revolution Is Over. The Physical AI Revolution Is …”
https://www.youtube.com/watch?v=MWMe7yjPYpE - “Davos 2024 Yann LeCun and Karl Friston at Casper Labs Live”
https://www.youtube.com/watch?v=vb4iu4KOCAM
En este nivel de análisis de las IA, llegamos a la cuestión del lenguaje. Esto, por su parte, exige un excurso, porque acá se juega una parte importante de la confusión contemporánea. Hinton ha dicho que las redes neuronales son mucho mejores procesando lenguaje que cualquier cosa producida por la escuela chomskyana, y en AI4 afirmó que entendemos el lenguaje de un modo muy similar al de los grandes modelos de lenguaje. En la entrevista del Nobel repitió que la escuela lingüística de Chomsky se equivoca al negar que estos sistemas entiendan. Esto puede leerse como una especie de giro wittgensteiniano implícito: el significado no estaría en una gramática innata y abstracta, sino en patrones de uso, en el aprendizaje de regularidades de contexto y en la participación efectiva en juegos del lenguaje. Y es tentador, porque Wittgenstein efectivamente desplaza el significado hacia el uso, las prácticas, los juegos de lenguaje y las formas de vida. Pero ahí está justamente el error: si uno invoca a Wittgenstein contra Chomsky para defender a los LLMs, no puede quedarse sólo con “uso” como una regularidad estadística. En Wittgenstein, un juego de lenguaje no es un corpus de secuencias, sino una práctica que se teje con acciones y normas, a través de criterios y formas de vida. Decir “el significado es uso” no equivale a decir “el significado es distribución”. El uso wittgensteiniano implica estar dentro de una actividad donde las palabras hacen cosas: ordenar, pedir, prometer, contar, medir, preguntar, obedecer, equivocarse, corregir. Por eso una lectura wittgensteiniana seria debería volverse contra Hinton: si los LLMs carecen de una real forma de vida, con un cuerpo, que tiene consecuencias prácticas propias y una responsabilidad en el juego de lenguaje, entonces no basta con que reproduzcan muy lindos a los patrones de uso lingüístico. En cualquier caso, la crítica a Chomsky es una caricaturización vulgar: Chomsky no sostuvo que “el lenguaje no se aprende”, como si un bebé naciera sabiendo español o japonés. También las matemáticas se aprenden, y hay diferentes formas de codificarlo en lenguajes y hasta posee en ramas en conflicto, pero eso no significa que no haya una universalidad lógico-estructural de la cognición lingüística que sea la que lo valide y la que, de hecho, en una sucesión histórica, sea esta gramática universal la que haya generado sus formas concretas a través de los diferentes juegos del lenguaje: las diferentes matemáticas, las diferentes geometrías, etc. así como el árbol gigantesco de los lenguajes naturales de la humanidad.
Hinton convierte así una tesis compleja sobre la pobreza del estímulo, en una caricatura fácilmente celebrable por un público ya predispuesto a festejarle todo. El argumento chomskiano apunta, precisamente, a la explicación misma del desarrollo del lenguaje, y a la evidencia lingüística disponible de que el niño subdetermina ciertas competencias gramaticales, por lo cual la mente es la que guía el proceso aportando una estructura lógica universal previa, sin importar sus variantes y las posibles relaciones lógicas distintas (aunque no contradictorias) que aparecen en unos lenguajes y en otros no. Y no se refuta a Chomsky mostrando que una red gigantesca, entrenada con cantidades sobrehumanas de texto, produce lenguaje fluido. Un niño aprende lengua sin el corpus de internet, sin backprop, sin millones de actualizaciones sobre tokens, y lo hace con cuerpo y con una comunidad humana de corrección práctica. Esta comunidad no le enseña a manejar su cuerpo mediante entrenamiento sobre una tabula rasa, ni a entender las palabras mediante electroshocks y chocolates, como premios y castigos de un pre-entrenamiento conductista para guiar a la red neural del infante hasta la replicación de regularidades adecuadas, prácticas a posteriori, con las cuales entender el resto del lenguaje por entrenamiento. Y, sin embargo, el chico aprehende el mundo y aprende a entender las primeras palabras, contextualmente, lo cual sobra decir no puede ser producto de un condicionamiento previo que provenga del lenguaje, porque éste requiere palabras. Y, si es ajeno al lenguaje, entonces resulta paródica la reducción del aprendizaje de la lengua, a la lectura de Wittgenstein que hace Hinton.
Fuentes sobre lenguaje y aprendizaje:
Textos y papers
- Geoffrey Hinton, “Nobel Prize Interview”
https://www.nobelprize.org/prizes/physics/2024/hinton/interview/ - RD World, “Hinton explains at AI4 how language models mirror human understanding”
https://www.rdworldonline.com/hinton-ai4-conference-language-model-insights-rd-impact/ - Noam Chomsky, Ian Roberts & Jeffrey Watumull, “The False Promise of ChatGPT”
https://www.nytimes.com/2023/03/08/opinion/noam-chomsky-chatgpt-ai.html - Noam Chomsky, Ian Roberts & Jeffrey Watumull, “La falsa promesa de ChatGPT”
https://fundacionfilosofica.com/wp-content/uploads/2023/04/Chomsky-La-falsa-promesa-de-ChatGPT.pdf - Howard Lasnik, “The Argument from the Poverty of the Stimulus”
https://shotam.github.io/LING611_papers/Lasnik_2016.pdf - Laurence & Margolis, “The Poverty of the Stimulus Argument”
https://philarchive.org/archive/LAUTPO - Stanford Encyclopedia of Philosophy, “Ludwig Wittgenstein”
https://plato.stanford.edu/entries/wittgenstein/ - Yosef Grodzinsky, “How Deeply Human Is Language?”
https://mitpress.mit.edu/9780262052009/how-deeply-human-is-language/
Videos
- Emily M. Bender, “On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?”
https://www.youtube.com/watch?v=2Hro71IlAGw - Melanie Mitchell, “The Debate Over ‘Understanding’ in AI’s Large Language Models”
https://www.youtube.com/watch?v=bV0Y2LhdNFk
Ahora nos adentramos ya en el nivel de la noción de creatividad artificial que tocamos someramente arriba. Si por creatividad entendemos producir combinaciones nuevas, entonces obvio que sí: los modelos generan novedad. Si por creatividad entendemos producir hipótesis, formas, reglas o mundos que abren posibilidades no contenidas en el régimen estadístico existente, la cuestión es otra. El famoso model collapse muestra empíricamente que un sistema que se alimenta demasiado de su propio output pierde colas de la distribución: Shumailov y coautores muestran que los modelos entrenados recursivamente con datos generados por modelos tienden a olvidar la distribución original; Alemohammad y Baraniuk hablan directamente de autophagy disorder en modelos generativos; Bohacek y Farid estudian generadores de imágenes que se autoenvenenan; Martínez y otros analizan bucles entre IA generativa e internet. Gerstgrasser y Schaeffer muestran que mezclar y acumular datos reales y sintéticos puede evitar o reducir ciertos colapsos, sí, pero la lección general es la misma: la supuesta generación de la IA generativa es eco con emergencia de patrones. Sin datos frescos del mundo (humano o natural), donde se preserven las rarezas y se establezcan criterios de procedencia, la creatividad se reduce a un descubrimiento sofisticado de promedios estadísticos. Acá entrarían Bender, Gebru y Crawford: “Stochastic Parrots” apunta a una ecología de escala donde al devorarse corpus sin documentación adecuada, la IA oscurece las procedencias y el receptor confunde el tamaño con la comprensión. La autofagia informacional y la extracción material son dos caras de la misma expansión: el sistema absorbe patrones del mundo, lo convierte en datos, lo procesa, lo devuelve como outputs, y luego empieza a procesar sus propios residuos. La IA puede parecer inmaterial en la pantalla, pero su metabolismo es material y semiótico a la vez. Las novedades científicas creadas por IA son novedades sólo para el área científica contemplada, no para los criterios cognitivos humanos. Es sólo una cuestión de aplicaciones no descubiertas de criterios análogos utilizados en otras áreas, captados y reutilizados inconscientemente por la red artificial. No es el descubrimiento abductivo de criterios ulteriores del desarrollo científico. Nada de esto implica ser “hater” de la IA. De hecho, el planteo de los loros estocásticos viene no sólo de los autores mencionados en este bloque, sino que está presente en casi todos los demás mencionados en este posteo.
Hay una segunda dimensión de la autofagia que conviene distinguir del colapso técnico del modelo. El colapso técnico aparece cuando un sistema generativo se entrena sobre contenidos generados por sistemas anteriores y pierde progresivamente información sobre la distribución real de la cual dependía. En imágenes, esto ya fue estudiado bajo el nombre de Model Autophagy Disorder: si no entra suficiente dato real fresco en cada ciclo, el modelo tiende a pagar el proceso con pérdida de calidad o de diversidad. En el lenguaje, la generación de imágenes y otros dominios, el mismo mecanismo general aparece como pérdida de colas de la distribución estadística: desaparecen los casos raros, las variantes poco frecuentes, los estilos menores, las combinaciones improbables y todo aquello que no queda protegido por la masa central de la distribución. No se trata de errores, en realidad sólo percibible por nosotros (las IA sólo lo pueden detectar sin seguridad infiriendo contradicciones respecto a comparar el resultado de otras inducciones), sino de algo que está siempre presente, haya o no alucinaciones, y es un empobrecimiento de la variabilidad disponible. En rigor, todo el material generado es una alucinación, y desde dentro de la IA no hay solución de continuidad entre lo verdadero y lo falso, lo posible y lo imposible. Directamente esa distinción no existe, que es, precisamente, de lo que todo este problema se trata.
Este fenómeno técnico tiene una proyección cultural bastante difícil de medir, pero no por eso menos relevante. Cuando la circulación pública de textos, imagénes, audio y video se llena de productos sintéticos, cambian simultáneamente los futuros datasets y la experiencia cotidiana de los usuarios humanos. Los modelos aprenden de esos residuos, y los usuarios también. Cada exposición repetida a materiales generados estadísticamente modifica los criterios con los que después se juzgará la escritura, la imagen, la voz, y los estilos de los mismos. Todo esto lleva a la degradación del entorno cognitivo-cultural: falsos recuerdos, contaminación epistémica, estética promedio, dificultad para distinguir evidencia de simulacro y, lo peor, retroalimentación entre outputs generados y expectativas humanas. Muchas personas describen estas imágenes como prototípicas, extrañas o difíciles de ubicar dentro de una experiencia estética ordinaria. Generan una relación perceptiva alterada, que va más allá del problema de si “son lindas” o “son feas”, aunque, de hecho, son feas, porque hay una diferencia ontológica entre algo que lleva el rastro de su origen natural, incluso en aquello que es artificial pero fue creado por humanos (como el CGI). En las imágenes segregadas por las redes neurales artificiales, podemos notar ese no-se-qué desagradable, una imitación incoherente de coherencia, y antinatural de lo natural, que se potencia más cuando las redes se entrenan con una mixtura de tareas genéricas y estilos infinitos. Es una forma de producción sin mundo propio, y sin siquiera partir de mundo ninguno. La imagen no sale de una cámara situada, ni de un cuerpo en un lugar, ni de una escena que se recuerda y que se asimilara en un lugar, donde la realidad tiene patrones propios que se reflejan en el recuerdo. Sale de una distribución aprendida sobre imágenes anteriores, y genera una recreación que devuelve una ficción acomodada por una red para no ser castigada. Puede producir una escena cinematográfica, un retrato, una fantasía o una ilustración infantil con gran eficacia, porque aprendió a devolver versiones altamente reconocibles de esas clases visuales, pero sólo gracias al destilado en bruto de aquellas cosas que le dijeron que coincidían lo suficiente con las ideas concretas a las que refería. La consecuencia es una clase de imagen con composición, color, foco y acabado, pero sin relación real con cualquier proceso material singular. Su eficacia nace de una abstracción estadística de estilos previos, y no de una confrontación sensible estilística con el objeto visual que inspirara la imagen.
Los modelos texto-imagen pueden aumentar el volumen de productividad para los creativos, y para mucha gente el atractivo superficial de los productos rápidos y sencillos de alcanzar, pero al costo de una caída de novedad promedio y de convergencia hacia motivos dominantes. El caso de los bucles autónomos lenguaje-imagen es especialmente ilustrativo: al iterar generación con descripción, los sistemas convergen hacia motivos visuales agradables, reconocibles, comercialmente seguros y pobres en sorpresa. Ni siquiera es una sobrerrepresentación, que ya sucede, sino de un intento de la imagen de representar, forzadamente, una referencia a lo agradable y lo reconocible en la cosa mostrada, en una suerte de abyección convertida en falsedad estética. No es de extrañar que las imágenes generadas por IA, cuando se les pide algo sin siquiera un filtro estético por parte del que escribe el prompt, tengan ese estilo grasa circense, plástico comercial y groseramente falso, cada vez más cercano a la chatarra cultural de los bingos, los casinos o la publicidad política de Trump. La expresión “visual elevator music” cierra mucho, porque no describe una imagen necesariamente mal hecha, sino una imagen digerida, conscientemente mediocre, sin estilo ni trasfondo cultural, sin referencias humanas salvo a la estimulación más vulgar, y desprovista de tensión o simbolismo. Una cultura visual saturada, más abundante y más estrecha.
El texto sufre un proceso análogo. Los modelos generativos elevan el piso formal de muchos usuarios: les ordenan frases, les corrigen errores, les proponen transiciones y les hacen sonar más profesional una idea que sería igualmente estúpida y pobremente formulada. Este beneficio individual puede producir, repetido por todos, un costo colectivo para ese mismo individuo, cuando millones de textos empiezan a pasar por la nueva normalización. La escritura asistida borra giros regionales, sintaxis personales, brusquedades, cambios de ritmo, zonas de vacilación, errores que reflejan una armonía propia, un caos natural, y en su lugar nos aparece una prosa competente, amable, conectiva y bien organizada, con menor o ninguna densidad ni procedencia. Mejora el texto de un usuario aislado convirtiéndolo en un promedio aceptable (ni siquiera un promedio mejor), pero es artificial: reduce la diversidad estilística efectiva del entorno escrito, y el promedio creado tampoco tiene una identidad propia. No es ni siquiera algo en el medio de todos, que se acerque al promedio. Está construido para que no quede ningún reflejo de aquello que causó el promedio, más o menos como conscientemente la humanidad viene haciendo con la cultura, especialmente en lo audiovisual, que vació el mundo y lo convirtió en variaciones de un videoclip de K-Pop, especialmente desde 2013. Necesito hacer un excurso al respecto de este problema paralelo, porque explica en gran medida que haya proliferado tan rápido el AI Slop. Hoy hemos llegado a una suerte de final de camino para la cultura en todas sus manifiestaciones: tenemos un patchwork sintético y sin alma de todas las estéticas de la historia, que sólo puede resolverse en un ambiente minimalista, donde los elementos no pidan un contexto mutuo, lo cual implica, en lo arquitectónico, convertir todo lugar, incluso hogares, en imitaciones de Starbucks, bares pseudo-irlandeses y restaurantes que parecen oficinas empresariales: referencias sin contexto para lugares de tránsito, que evocan y falsifican la calidez combinándola con una sequedad industrial, vintage, amigable y con imitación de esnobismo. A este aburguesamiento terminal, elitista sin contenido, ideal para clase media aspiracional y para las masas top de country, la IA le contrapone el regreso visual de la estética de Las Vegas, ideal para nuevos ricos que ascendieron la pirámide social por vías más lúmpenes. La degradación cultural que el capitalismo genera en las clases populares, es reflejada directamente por la IA, en vez de disfrazada con la estética de ese emprendedorismo post-millenial, mezcla de minimalismo moderno mainstream y brutalismo soft sin gusto. O sea: las masas no quieren la tilinguería shopping de Taylor Swift sino la enajenación estética de Bad Bunny. Y los modelos nos siguen la corriente: la inconsecuencia cognitiva se transforma en repetición, como forma estandarizada de esquivar las detecciones humanas de incongruencia. El lector se acostumbra a textos que presentan la información con una forma homogénea de claridad, y el escritor delega cada vez más la organización retórica de lo que piensa. La ganancia en eficiencia viene acompañada de una transferencia de criterio: el usuario deja de decidir aspectos de la forma y acepta como “natural” el ordenamiento que el modelo le devuelve. La homogeneización avanza como una comodidad repetida al trabajarla, cada vez más incómoda al consumirse.
Hace más de un siglo, una fotografía, una grabación de voz o una filmación funcionaron como indicios relativamente fuertes de que algo había ocurrido, allí. No eran pruebas absolutas y sin embargo sostenían una parte importante de la economía pública de la evidencia. La generación sintética debilita esa función documental, ya que una voz puede ser clonada, una escena puede ser fabricada y un gesto puede ser simulado con suficiente verosimilitud como para exigir verificación constante. El costo social de verificar cada pieza crece más rápido que la capacidad institucional de hacerlo, y una sociedad en esa situación debe dejar de creer en documentos verdaderos, o bien elegir con la misma facilidad terminar creyendo en documentos falsos. O las dos cosas.
Los estudios sobre falsos recuerdos y desinformación visual muestran una zona donde el daño cognitivo ya no es sólo especulativo. Imágenes y videos editados o generados por IA pueden aumentar falsos recuerdos y aumentar la confianza subjetiva en esos recuerdos. Y el cansancio cognitivo lleva a una aceptación light de la información: “todo lo que veo debe de ser real, pero no tanto”, y de ahí al “da igual que sea real”. La expresión “AI slop” apunta a esta contaminación del ambiente comunicativo. Hay una acumulación masiva de contenido sintético de baja o mediana calidad ocupando el espacio comunicacional e infectando los canales de circulación. Incluso cuando la calidad superficial mejore, el problema persiste, porque una parte creciente del entorno textual, visual y sonoro empieza a provenir de modelos entrenados sobre materiales similares y ajustados con criterios parecidos de aceptabilidad. La variedad temática puede permanecer, pero la variedad formal y perceptiva se reduce. El usuario recibe muchas fuentes distintas atravesadas por la misma lógica de producción regurgitada.
El caso del material educativo generado por IA muestra otro costado del mismo problema. Cuando videos, textos o imágenes se producen con bajo cuidado por su valor instructivo, el material tiene una apariencia didáctica aceptable pero presenta incoherencias, simplificaciones, errores de forma y finalmente violaciones de principios básicos de enseñanza multimedia. El estudiante además de poder recibir una explicación falsa indiferenciable, se acostumbra a un flujo de baja densidad semántica: material que parece educativo, ordenado, suficiente, pero no inspira al sostenimiento de la memoria, no exige criterio, tiene una reducción que no compele al pensamiento abstracto ni promueve el contraste entre diferentes estilos retóricos y la insinuación tras sus detalles (que sólo pueden ser elaborados conociendo el efecto psicológico de las palabras), y entonces no pueden despertar el juicio crítico, ni la secuenciación conceptual ni la comprensión. La mente del receptor se declara en huelga y ya no tiene contra qué resistirse. En ese sentido, el slop educativo es más grave que el entretenimiento pobre, porque ocupa el lugar de un proceso formativo, que parece estar afinando el ojo crítico cuando en realidad lo está adormeciendo.
Fuentes sobre autofagia, colapso del modelo, contaminación sintética, daño cognitivo parcial y homogeneización cultural:
Textos y papers
- Ilia Shumailov et al., “AI models collapse when trained on recursively generated data”
https://www.nature.com/articles/s41586-024-07566-y - Sina Alemohammad et al., “Self-Consuming Generative Models Go MAD”
https://arxiv.org/abs/2307.01850 - Matyáš Boháček & Hany Farid, “Nepotistically Trained Generative-AI Models Collapse”
https://arxiv.org/abs/2311.12202 - Gerardo Martínez et al., “Towards Understanding the Interplay of Generative Artificial Intelligence and the Internet”
https://arxiv.org/abs/2306.06130 - Matthias Gerstgrasser et al., “Is Model Collapse Inevitable? Breaking the Curse of Recursion by Accumulating Real and Synthetic Data”
https://arxiv.org/abs/2404.01413 - Rylan Schaeffer et al., “Model Collapse Demystified”
https://arxiv.org/abs/2503.03150 - Pat Pataranutaporn et al., “Synthetic Human Memories: AI-Edited Images and Videos Can Implant False Memories and Distort Recollection”
https://arxiv.org/abs/2409.08895 - Pat Pataranutaporn et al., “Synthetic Human Memories: AI-Edited Images and Videos Can Implant False Memories and Distort Recollection”
https://dl.acm.org/doi/full/10.1145/3706598.3713697 - Shiyu Guo, “People are more susceptible to misinformation with realistic AI-synthesized images that provide strong evidence to headlines”
https://misinforeview.hks.harvard.edu/article/people-are-more-susceptible-to-misinformation-with-realistic-ai-synthesized-images-that-provide-strong-evidence-to-headlines/ - Jules van Hees et al., “Human perception of art in the age of artificial intelligence”
https://www.frontiersin.org/journals/psychology/articles/10.3389/fpsyg.2024.1497469/full - Amon Rapp et al., “How do people experience the images created by generative artificial intelligence?”
https://www.sciencedirect.com/science/article/pii/S1071581924001587 - Ionela Bara, Richard Ramsey & Emily S. Cross, “AI contextual information shapes moral and aesthetic judgments of AI-generated visual art”
https://www.sciencedirect.com/science/article/pii/S0010027725000034 - Ionela Bara et al., “Algorithmic aesthetics: Cognitive perspectives on AI-generated visual art”
https://www.cell.com/iscience/fulltext/S2589-0042(25)02087-5 - Eunice Zhou & Dokyun Lee, “Generative artificial intelligence, human creativity, and art”
https://academic.oup.com/pnasnexus/article/3/3/pgae052/7618478 - Doshi & Hauser, “Generative AI enhances individual creativity but reduces the collective diversity of novel content”
https://pmc.ncbi.nlm.nih.gov/articles/PMC11244532/ - Anderson, Shah & Kreminski, “Homogenization Effects of Large Language Models on Human Creative Ideation”
https://arxiv.org/abs/2402.01536 - Alice Hintze et al., “Autonomous language-image generation loops converge to visual elevator music”
https://www.sciencedirect.com/science/article/pii/S2666389925002995 - Emily Bender, Timnit Gebru et al., “On the Dangers of Stochastic Parrots”
https://s10251.pcdn.co/pdf/2021-bender-parrots.pdf - Kate Crawford & Vladan Joler, “Anatomy of an AI System”
https://anatomyof.ai/ - Knight First Amendment Institute, “AI Slop I: Pollution in Our Communication Environment”
https://knightcolumbia.org/content/ai-slop-i-pollution-in-our-communication-environment - Eric M. Jones et al., “AI-Generated ‘Slop’ in Online Biomedical Science Educational Videos”
https://mededu.jmir.org/2025/1/e80084 - Brennan Center, “Deepfakes, Elections, and Shrinking the Liar’s Dividend”
https://www.brennancenter.org/our-work/research-reports/deepfakes-elections-and-shrinking-liars-dividend - Microsoft Research, “The Impact of Generative AI on Critical Thinking”
https://www.microsoft.com/en-us/research/publication/the-impact-of-generative-ai-on-critical-thinking-self-reported-reductions-in-cognitive-effort-and-confidence-effects-from-a-survey-of-knowledge-workers/ - Michael Gerlich, “AI Tools in Society: Impacts on Cognitive Offloading and the Future of Critical Thinking”
https://www.mdpi.com/2075-4698/15/1/6 - Acemoglu, Kong & Ozdaglar, “AI, Human Cognition and Knowledge Collapse”
https://economics.mit.edu/sites/default/files/2026-02/AI%2C%20Human%20Cognition%20and%20Knowledge%20Collapse%2002-20-26.pdf
Videos
- Computerphile, “Has Generative AI Already Peaked?”
https://www.youtube.com/watch?v=dDUC-LqVrPU - George Montañez, “Model Collapse Ends AI Hype”
https://www.youtube.com/watch?v=ShusuVq32hc - “What is Generative AI Model Collapse? How Can We Stop It?”
https://www.youtube.com/watch?v=knVIecsI-OM - Hany Farid, “How to spot fake AI photos”
https://www.ted.com/talks/hany_farid_how_to_spot_fake_ai_photos - Last Week Tonight with John Oliver (HBO), “AI Slop”
https://www.youtube.com/watch?v=TWpg1RmzAbc
El envenenamiento de datos se sigue de las causas que posibilitan el colapso recursivo. En el colapso, el deterioro aparece porque el modelo se entrena sobre contenido sintético generado por modelos anteriores y pierde progresivamente información sobre la distribución original. En el envenenamiento, la contaminación es intencional: alguien introduce o modifica muestras para alterar el comportamiento futuro del sistema. El ataque no manipula una respuesta ya generada mediante un prompt injection, sino que altera directamente el material con el que el sistema aprende.
Los modelos texto-imagen permiten ver el mecanismo con claridad perturbadora. Herramientas como Glaze y Nightshade modifican imágenes de manera calculada para interferir con el aprendizaje del modelo. Por ejemplo, Glaze busca dificultar que un sistema copie el estilo de un artista. Nightshade en cambio ataca de forma más agresiva las asociaciones que el modelo aprende entre una imagen y una etiqueta o prompt. La imagen envenenada puede seguir siendo reconocible para una persona y, al mismo tiempo, producir efectos distintos dentro del espacio de representación de la IA. Esa divergencia entre percepción humana y representación artificial concentra el problema. Precisamente, el envenenamiento funciona porque el modelo procesa la imagen de un modo distinto al humano, y en general al de cualquier animal. Un humano reconoce un perro, una silla o un estilo pictórico a partir de experiencias relativamente estables: objetos vistos en contextos distintos, usos, movimientos, interacciones, palabras, memorias, escalas, funciones y expectativas prácticas. Una perturbación casi invisible en la imagen rara vez altera ese sistema conceptual, y lo que resulta un condimento imperceptible para nosotros, es arsénico para la IA. El modelo, en cambio, aprende relaciones estadísticas entre patrones visuales, descripciones textuales, embeddings y distribuciones de entrenamiento. Una perturbación diseñada sobre esas relaciones puede desviar el aprendizaje aunque la imagen siga pareciéndonos normal. Ergo, esto demuestra que un modelo puede generar imágenes convincentes porque aprendió regularidades visuales complejas, pero esas regularidades no equivalen a una comprensión visual anclada en una intuición eidética. La categoría “perro”, para una persona, está unida, no a un equilibrio estocástico, sino a un concepto real, constructivo. Para un modelo texto-imagen, queda estabilizada por relaciones en un espacio estadístico de alta dimensión.
El envenenamiento muestra una diferencia de fondo entre mente humana e IA generativa. La percepción humana y, en general, de cualquier mente animal, depende de conceptos formados en interacción con acciones y objetos, en una reconstrucción a base de relaciones congruentes de lógica espaciotemporal que el cerebro intenta que la mente llegue a reflejar. La representación generativa depende de asociaciones con categorías vacías y aprendidas a partir de datos vía inducción de impresiones. El modelo es muy eficaz y, precisamente porque lo es en la forma menos ideal, es manipulable de maneras que no coinciden con nuestros errores perceptivos habituales. Aun en el error, como en el caso de las ilusiones ópticas de tipo cognitivo, la imaginación y la sensibilidad de los cerebros biológicos, busca la reconstrucción inconsciente de algo que pueda existir realmente, con un sentido interno y externo a la cosa. No se engaña a una IA igual que a un animal o una persona, porque ésta no organiza lo percibido reflejando la naturaleza de lo real.
También hay una cuestión política y jurídica. Cuando artistas usan herramientas de protección como Glaze o Nightshade, responden a un régimen de extracción parasitaria que convirtió obras disponibles públicamente en material de entrenamiento sin consentimiento claro, y el envenenamiento es un medio de resistencia que introduce fricción donde antes había absorción automática por parte de las empresas de IA. Si el modelo depende de datos abundantes, limpios y semánticamente estables para una red neural artificial, los productores de esos datos intentan volverlos escasos, sucios y semánticamente inestables. La IA generativa necesita apropiarse de regularidades culturales, pero no puede garantizar que esas regularidades sigan estando disponibles en forma confiable. Como usuarios de LLMs y LRMs, tal vez salgamos perdiendo, pero como creadores de cultura, y finalmente como consumidores de la misma, salimos ganando del envenenamiento del material que parasitan los modelos.
Fuentes sobre envenenamiento de datos, Glaze, Nightshade y ataques contra modelos texto-imagen:
Textos y papers
- IBM, “What Is Data Poisoning?”
https://www.ibm.com/think/topics/data-poisoning - Shan et al., “Glaze: Protecting Artists from Style Mimicry by Text-to-Image Models”
https://arxiv.org/abs/2302.04222 - Shan et al., “Glaze: Protecting Artists from Style Mimicry by Text-to-Image Models”, USENIX Security
https://www.usenix.org/system/files/usenixsecurity23-shan.pdf - Shan et al., “Nightshade: Prompt-Specific Poisoning Attacks on Text-to-Image Generative Models”
https://arxiv.org/abs/2310.13828 - Ding et al., “Understanding Implosion in Text-to-Image Generative Models”
https://arxiv.org/abs/2409.12314
Videos
- “The New Tool That Breaks Text-to-Image AI (Nightshade …)”
https://www.youtube.com/watch?v=fXhJkAGck8U - Ben Zhao, “Nightshade: Data Poisoning to Fight Generative AI”
https://www.youtube.com/watch?v=dAox1MUzP0A
Como se podrá notar a esta altura, todos los problemas precedentes no son independientes, y el que le sigue no lo es menos. Si fuera solamente un problema de eficiencia energética, de arquitectura computacional o de verdad epistémica, ya sería bastante. Pero no lo es. Una tecnología que entra en la producción, en la administración, en la guerra, en la educación, en la vigilancia, en los mercados culturales y en la decisión pública no puede juzgarse únicamente por su elegancia técnica ni por su productividad marginal. Una IA “estadísticamente competente” pero epistémicamente débil reorganizará a la sociedad en forma deletérea. No podrá servir de obstáculo que compense el daño que genere, y a los muchos perjudicados agregará un dilema del prisionero suicida para élites gobernantes y clases dominantes, sin que ni siquiera sus propietarios y administradores, de empresas privadas o públicas en pugna, puedan hacer nada para detenerlo salvo buscar maximizar sus probabilidades de supervivencia.
El primer problema es el laboral. El FMI calculó que en las economías avanzadas alrededor del 60% de los empleos podrían verse impactados por la IA, y que aproximadamente la mitad de esos empleos expuestos podrían beneficiarse por integración de IA, mientras que la otra mitad podría sufrir reducción de demanda laboral, menores salarios o desaparición de tareas. Esto no significa necesariamente “desempleo total inmediato”, que sería una caricatura, pero sí una reorganización del poder de negociación. Si la IA aumenta productividad en manos de quienes ya controlan capital, datos e infraestructura, pero reduce el valor relativo de ciertas competencias humanas, la consecuencia no sería simplemente desempleo. De por sí no es garantía que el aumento de productividad genere nueva demanda de empleo humano, si la tasa de demanda de nuevo trabajo artificial supera la demanda de trabajo humano. Pero, como si no bastara, para la mano de obra que permanezca ocupada, significará una disminución de la productividad marginal del trabajo humano asalariado (también del restante, pero en tanto a ese resto el ingreso le provenga de sus propiedades sobre capitales en base a IA, y éstos sigan teniendo demanda, que su trabajo pueda ser reemplazado les será indiferente). En consecuencia tendremos degradación de las tareas, presión salarial a la baja, precarización e intensificación laboral, vigilancia algorítmica y pérdida de autonomía profesional. La ILO, además, advierte que la exposición no se distribuye de manera uniforme: tareas administrativas, clericales y de oficina aparecen especialmente expuestas, y las mujeres pueden quedar más afectadas por su concentración en ocupaciones automatizables y su subrepresentación en áreas tecnológicas. La desigualdad no surge sólo porque unos pierdan el empleo y otros no; si algunos trabajadores son complementados por la IA y otros son convertidos en residuo funcional de sistemas automatizados, ambas partes perderán porque su mercado habrá ampliado el ejército de reserva de los desocupados, incluso aunque fueran asistidos con migajas de una renta básica universal en vez de una participación en las ganancias del capital. O, mejor dicho, quizás precisamente por ello, ya que matar de hambre a grandes porciones de población significaría una separación radical entre empleados y desempleados, de forma que la población con potencial de ser laboralmente activa se reduciría, paradójicamente, sin un subsidio, lo cual detendría el descenso interminable del salario, aunque sólo para unos pocos ocupados temerosos de caer a un pozo sin retorno. En cualquier caso, una competencia desregulada que forzara a pagar a un trabajador empleado con la productividad marginal del último de los desempleados de potencial reemplazo, significaría que el precio de equilibrio del menor salario caería por debajo de la línea de capacidad de subsistencia y reproducción social del trabajador en tanto tal, lo cual generaría, o bien una crisis cíclica constante en el mercado de trabajo por rotación irregular de mano de obra incapaz de completar eficazmente la jornada laboral, o bien una tragedia de los comunes de sobreexplotación que tomaría la forma de realimentación positiva entre tasa de desempleados en aumento y reducción de la productividad marginal del trabajador activo, a un nivel insuficiente para su sustento.
Acá conviene evitar dos simplificaciones simétricas. La primera es la fantasía tecnófila de que todo aumento de productividad se derrama naturalmente hacia salarios, tiempo libre o bienestar social. La segunda es el catastrofismo automático de imaginar que toda IA destruye trabajo en bloque. Lo más probable es una combinación desigual: sectores donde la IA aumente capacidades humanas, sectores donde las sustituya, sectores donde fragmente oficios complejos en microtareas supervisadas, y sectores donde el trabajador quedará convertido en operador o responsable legal de decisiones que en la práctica ya fueron preformateadas por sistemas opacos. Profesionales que antes deliberaban pasarán probablemente a validar outputs de modelos generativos. Docentes que antes formaban pasarían a solo detectar trampas. Periodistas que antes investigaban, a editar síntesis. Empleados administrativos que antes conocían procesos, a alimentar sistemas que luego los vuelvan prescindibles. Esto es deskilling, pero no en el viejo sentido industrial, sino en una pérdida de dominio cognitivo sobre el propio trabajo. Un general intellect en potencia, pero sólo para pocos. O bien para un disimulado y parasitario capital muerto encarnado en los modelos de lenguaje.
Ese proceso aumentaría la desigualdad social incluso si la productividad agregada sube. La OCDE viene señalando que los beneficios de la IA tienden a favorecer más a ocupaciones de altos ingresos, alta calificación y uso intensivo de computadoras, mientras que los trabajadores menos calificados o con menor capacidad de apropiación tecnológica pocas veces participan de la misma mejora salarial. En otras palabras: que puede reforzar una división entre quienes usan la IA como multiplicador del capital humano autónomo o ajeno, y quienes son medidos, monitoreados, reemplazados o disciplinados por ella. En una sociedad ya fragmentada, aumentará la existente desigualdad cognitiva, y en una forma nueva: no sólo desigualdad de capital cultural e intelectual, sino desigualdad en la capacidad de comprender y gobernar los sistemas que organizan la vida cotidiana, lo cual reducirá a prácticamente cero la posibilidad de crear medios de producción propios en economías paralelas sumergidas, y ya ni digamos para competir contra los mercados principales.
De acá pasamos al problema político. Una tecnología que ayuda a concentrar toda la infraestructura, manejo de datos, los modelos y capacidad de automatización en los pocos actores económicos que se mantengan en pie, tiende a concentrar también la influencia en el poder de decisión. Esto no ocurre únicamente en el sector privado por mayor posibilidad de sindicación y negociación de los empleadores con IA frente a los asalariados que utilizan IA, sino también para que estos actores económicos más reducidos y coordinados, operen mucho más fácilmente como factor de poder sin contrapesos frente al poder político, así como de los gobernantes de los diferentes poderes del Estado —en unión con sus partidos convertidos ya hoy en empresas políticas— por sobre el resto de sus burocracias subalternas. Para los Estados la IA sirve perfectamente para clasificar poblaciones, para predecir conductas, distribuir mejor beneficios, detectar riesgos rápidamente, vigilar fronteras, procesar inteligencia, producir propaganda, automatizar burocracias y hacer inaccesible las cuentas de responsabilidad. La frontera entre eficiencia administrativa y autoritarismo técnico terminaría de disolverse. Los sistemas automatizados permiten tomar decisiones a escala, con apariencia de neutralidad —o, mejor dicho, neutralidad para la eficiencia de un sistema hecho para pocos—, desplazando la deliberación hacia modelos que la ciudadanía no entiende, no controla y a menudo ni siquiera puede auditar. La anarquía y el autoritarismo no son opuestos absolutos en este punto: pueden alternarse o incluso combinarse. Por un lado, proliferarán herramientas de desinformación, estafas, deepfakes, ataques automatizados y erosión de la confianza pública, y, por el otro, se justificará más vigilancia y más control en nombre de contener ese caos. La IA ya está produciendo el incendio, y es obvio que producirá el extintor.
El International AI Safety Report describe este dilema con una expresión sombría: “evidence dilemma”. Los sistemas avanzan rápido, pero la evidencia sobre riesgos llega tarde, es difícil de evaluar y muchas veces aparece recién cuando el sistema ya fue desplegado. Si los gobiernos actúan demasiado temprano, pueden fijar regulaciones inútiles o capturadas, pero si esperan evidencia concluyente, pueden dejar a la sociedad expuesta a daños permanentes. Este dilema es político incluso para los grupos de poder: la velocidad privada de despliegue no coincide con la velocidad pública de comprensión. Y cuando una sociedad no entiende a tiempo una tecnología que la reorganiza (desempleo, desinformación, inseguridad y guerra), la institucionalización política de los conflictos queda en desventaja temporal. Deliberar requiere tiempo y la carrera armamentística de las big tech premia velocidad.
La dimensión geopolítica agrava todo lo anterior. Los Estados la leen como ventaja estratégica. La industria militar, la ciberseguridad, servicios de inteligencia, armamento autónomo, propaganda enemiga, automatización de la defensa nuclear, vigilancia satelital, etc., impiden poner un pie en el freno, y el dilema se extiende por ende a la esfera pública. Cada actor podrá presentar su aceleración como defensiva, pero todos saben que estarán compelidos a agredir si a corto plazo ganan más por hacerlo. SIPRI advierte que incluso aplicaciones militares no nucleares de IA pueden comprimir los tiempos de decisión y aumentar los riesgos de cálculos erróneos en crisis nucleares. Trabajos sobre LLMs en wargames muestran patrones de escalada difíciles de predecir y, en casos raros, incluso decisiones que llegan al uso de armas nucleares en simulación. El genocidio consciente a lo Skynet no es la peor amenaza, aunque este pueda ser parte de una fase de desarrollo. Bastaría ya con la automatización parcial de recomendaciones, los sesgos de confianza compulsivos en máquinas y las doctrinas militares que premien anticiparse al adversario, para extender fácilmente la destrucción del enemigo desde su población civil hasta a sus silos nucleares. Así como el poder civil se reduce frente al poder político-militar y sus diferentes complejos industriales, la aceleración en la cadena de decisión también hace disminuir el control humano, tanto de los altos mandos como los subordinados, sobre las operaciones manejadas con IA. En una crisis, si un sistema recomienda responder antes de que el adversario lo haga, y si el adversario usa sistemas parecidos, la estabilidad dependerá de modelos y sensores cuyas señales puedan ser erróneas o incompletas, o manipuladas. La IA tiende a erosionar todos los “firebreaks” humanos que enfrían la escalada: pausas por protocolo, demoras administrativas, ambigüedades a dilucidar, prudencias humanitarias y resistencias psicológicas.
La inestabilidad política también puede venir por degradación del espacio público. Si los costos de producir texto, imágenes, audio y video convincentes tienden a cero, la confianza social se vuelve más cara de comprar, ya que la abundancia de contenido sintético, además de generar desinformación, genera cansancio cognitivo. No es mejor que la imposición de una mentira, el hacer que todos sospechen de todo. La adhesión fanática y el escepticismo apático llevan a caminos parecidos, y en cualquier caso mutuamente funcionales. La combinación de cinismo anárquico, donde nadie cree nada, y el autoritarismo epistémico, donde se pide a una autoridad fuerte que certifique qué es real, ha sido la fórmula perfecta para la imposición de controles inconstitucionales. El antecedente más cercano y conocido simultáneamente por todos los países del mundo, ha sido el de la última cuarentena global con confinamiento. Vale la pena repasarlo con un breve excurso. Recordemos cómo la información se manipuló para agigantar la emergencia sanitaria, la cual a su vez se priorizó por sobre todas las libertades civiles (las garantías para la integridad biológica personal frente a contraindicaciones y otros problemas médicos, el aislamiento preventivo por sobre la subsistencia económica y la salud psicológica), así como implicó medidas típicas de los autoritarismos y totalitarismos (instigación a la delación, inducción de la reacción mecánica ante el medio, y acusación de irresponsabilidad social al disidente). Mediante un discurso homogéneo de todos los medios de comunicación, se llegó a la conversión por colectivización de toda cuestión de salud personal en un problema de salud pública (de ahí a la imposición de un pasaporte interno, que luego sería usado como coacción para que se violara masivamente el Código de Nuremberg y la Declaración de Helsinki sobre experimentación humana, salvo fácticamente para minorías económicas y políticas que no dependían para subsistir de un pase sanitario o que no temían ninguna amenaza de cierre o despido). Si esta experiencia de disciplinamiento social, que logró doblegar y confinar a la mayor parte de la población civil, y cuya abyección humillante ha quedado como un trauma del que aun ahora es difícil hablar, ha sido posible sin inteligencia artificial, no cuesta imaginar lo que esos mismos poderes públicos y privados podrán hacer con una. La IA generativa, al degradar la frontera entre documento y ficción, contribuye a la privatización, tanto empresarial como partidaria, de la política y de la verdad pública, lo que lleva inmediatamente a su fragmentación inestable en facciones inorgánicas, y a la vez a su concentración en menor cantidad de agentes, a la vez que facilita y agiliza la gobernabilidad por encima de los mecanismos de contralor constitucional, así como por sobre la participación y deliberación democrática (los pocos que existen y tienen relevancia todavía), o sea, frente a libertades negativas y positivas por igual (Berlin dixit).
Como si faltara algo, queda la relación entre la economía de plataformas y el problema de la concentración económica y política. La desigualdad entre empleadores y empleados, gobernantes y gobernados, ya no será sólo distributiva de recursos materiales o de coacción, sino estratégica. Quien controla los modelos de razonamiento, la fabricación de chips, las bases de datos y los canales de distribución, acapara también las mayores capacidades de predicción y persuasión (cuya utilidad es sólo positiva si supera a la competencia en un juego de suma cero), así como vigilancia y coacción individualizadas y colectivas, con lo cual la soberanía tecnológica se vuelve condición de la independencia material y, por lo mismo, tanto países como empresas como los mismos trabajadores sin acceso a infraestructura de IA, quedarán inevitablemente reducidos a consumidores, etiquetadores, fuentes gratuitas de datos o directamente devenidos en mercados cautivos. Esta es la forma normal en que opera el principio de Pareto: las tecnologías de propósito general reordenan las jerarquías contra las mayorías cuando requieren condiciones de concentración para la propiedad privada y el poder político.
Fuentes sobre las implicancias sociológicas, económicas, políticas y culturales de la IA generativa:
Textos y papers
- IMF, “AI Will Transform the Global Economy. Let’s Make Sure It Benefits Humanity”
https://www.imf.org/en/blogs/articles/2024/01/14/ai-will-transform-the-global-economy-lets-make-sure-it-benefits-humanity - IMF, “Gen-AI: Artificial Intelligence and the Future of Work”
https://www.imf.org/-/media/files/publications/sdn/2024/english/sdnea2024001.pdf - ILO, “Generative AI and Jobs: A Refined Global Index of Occupational Exposure”
https://www.ilo.org/publications/generative-ai-and-jobs-refined-global-index-occupational-exposure - ILO, “New ILO data confirm women face higher workplace risks from generative AI than men”
https://www.ilo.org/resource/news/new-ilo-data-confirm-women-face-higher-workplace-risks-generative-ai-men - OECD, “What impact has AI had on wage inequality?”
https://www.oecd.org/en/publications/what-impact-has-ai-had-on-wage-inequality_7fb21f59-en.html - OECD, “AI and work”
https://www.oecd.org/en/topics/sub-issues/ai-and-work.html - Daron Acemoglu, “The AI Revolution: The Possibility of a Pro-Human Direction”
https://www.hsgac.senate.gov/wp-content/uploads/Testimony-Acemoglu-2023-11-08.pdf - International AI Safety Report 2026
https://internationalaisafetyreport.org/publication/international-ai-safety-report-2026 - International AI Safety Report 2025
https://internationalaisafetyreport.org/publication/international-ai-safety-report-2025 - SIPRI, “Impact of Military Artificial Intelligence on Nuclear Escalation Risk”
https://www.sipri.org/publications/2025/sipri-insights-peace-and-security/impact-military-artificial-intelligence-nuclear-escalation-risk - SIPRI PDF, “Impact of Military Artificial Intelligence on Nuclear Escalation Risk”
https://www.sipri.org/sites/default/files/2025-06/2025_6_ai_and_nuclear_risk.pdf - Juan-Pablo Rivera et al., “Escalation Risks from Language Models in Military and Diplomatic Decision-Making”
https://arxiv.org/abs/2401.03408 - RAND, “Strategic competition in the age of AI”
https://www.rand.org/randeurope/research/projects/2024/strategic-competition-ai-cm.html - Michael C. Horowitz et al., “Artificial Intelligence and the Future of Strategic Stability”
https://tnsr.org/roundtable/artificial-intelligence-and-the-future-of-strategic-stability/ - Bender et al., “On the Dangers of Stochastic Parrots”
https://s10251.pcdn.co/pdf/2021-bender-parrots.pdf - Kate Crawford & Vladan Joler, “Anatomy of an AI System”
https://anatomyof.ai/
Videos
- LSE, “AI and the Future of Work”
https://www.youtube.com/watch?v=McYBgZrORi4 - The Hamilton Project / Brookings, “AI + work: Building pro-worker AI”
https://www.youtube.com/watch?v=VSzmjU33dzE - Anton Korinek, “The Economics of Transformative AI”
https://www.youtube.com/watch?v=Z8K-Np6HCWE - GovAI, “AI and Inequality – Joseph Stiglitz in conversation with Anton Korinek”
https://www.youtube.com/watch?v=EDpzqeMpmbc - Chema Alonso, “[2025] Cybersecurity & Artificial Intelligence in Nerdearla Spain 2025”
https://www.youtube.com/watch?v=WdZUg9wRgy8 - Brookings Institution, “The geopolitics of generative AI”
https://www.youtube.com/watch?v=xPsIO2NAySk
El lock-in económico favorece la infraestructura dominante; la infraestructura dominante favorece modelos pasivos y masivos; los modelos pasivos y masivos tienen hambre de datos; el hambre de datos empuja al scraping y luego a la contaminación sintética; la contaminación sintética empobrece la ecología informacional; la falta de mundo obliga a simular agencia en texto; la falta de causalidad degrada la abducción a soluciones por fuerza bruta; la falta de validez endógena degrada la deducción a imitación de argumentación; la separación memoria-cómputo vuelve carísima la plasticidad continua; la lógica de mercado premia el despliegue útil antes que la comprensión fuerte. Esto prueba que el régimen actual está condenado, pero ese no es el peor problema: el peor problema es que sea un callejón sin salida.
La conclusión no tiene por qué ser, sin embargo, necesariamente “anti-IA”. Quizá sea una crítica a la pobreza de imaginar que esta IA es el destino de toda inteligencia artificial. Mi miedo no es que las máquinas no hagan nada, sino que hagan lo suficiente como para desplazar las preguntas correctas. Que escriban lo bastante bien como para hacernos olvidar la diferencia entre lenguaje y mundo. Que razonen lo bastante bien como para hacernos olvidar la diferencia entre probabilidad y validez. Que generen imágenes lo bastante pulcras como para hacernos olvidar la diferencia entre recombinación y creación. Que automaticen lo bastante como para hacernos olvidar la diferencia entre eficiencia particular y desarrollo general. Y que escalen lo bastante como para hacernos olvidar que relacionar no es comprender, así como fabricar no es crear.
Mientras tanto, la IA actual seguirá siendo un artefacto espectacular, pero sin cambiar por una inteligencia real, casi todos sus perjuicios quedarán intactos, y sus beneficios tenderán a una reducción constante. No se volverá pues una inteligencia en sentido fuerte, con una naturaleza inteligente. Y quizá lo más grave no sea que no la tenga, sino que su éxito nos haga dejar de querer construir algo que sí pueda.
Fuentes sobre el presente y futuro de la inteligencia artificial:
Textos y papers
- Paul Thagard, “Artificial Intelligence: Philosophical and Social Issues”
https://cs.uwaterloo.ca/~jhoey/teaching/cogsci600/papers/Thagard-AI-2026.pdf - Daron Acemoglu, “Redesigning AI”
https://www.oxfordmartin.ox.ac.uk/videos/redesigning-ai - OECD, “AI across the stack: Competition issues in AI infrastructure”
https://www.oecd.org/en/publications/competition-in-artificial-intelligence-infrastructure_623d1874-en.html - “An Alternative Trajectory for Generative AI”
https://arxiv.org/html/2603.14147v1#S12
