El patio baldío

domingo, 12 de julio de 2026

Must-reads para sociólogos, economistas y politólogos

Recomendación personal de lecturas obligatorias para entender la sociedad en tanto objeto de estudio de la sociología, y para entender las cuestiones de metodología en las ciencias sociales en general:

La sociedad

Su historia

Alfred Weber, Historia de la cultura, FCE
Norbert Elias, El proceso de la civilización, FCE
Susana Bianchi, Historia social del mundo occidental, UNQ

Su concepto

Ely Chinoy, La sociedad, FCE
Kingsley Davis, La sociedad humana, Eudeba
R. M. MacIver y Charles H. Page, Society: An Introductory Analysis, Macmillan

Su estudio

Nicholas S. Timasheff, La teoría sociológica, FCE
Philippe Corcuff, Las nuevas sociologías, Siglo XXI

Tratados

Max Weber, Economía y sociedad, FCE
Michael Mann, Las fuentes del poder social, Alianza
Randall Collins, Conflict Sociology: Toward an Explanatory Science, Academic Press

Resumen

Zygmunt Bauman y Tim May, Pensando sociológicamente, Nueva Visión

Manuales

John J. Macionis y Ken Plummer, Sociología, Pearson
Anthony Giddens y Philip W. Sutton, Sociología, Alianza
George Ritzer, Teoría sociológica clásica / Teoría sociológica moderna, McGraw-Hill

Recomendación personal de lecturas obligatorias para entender la economía en tanto objeto de estudio de la teoría económica o economics, y para entender las cuestiones de metodología en las diferentes ramas de esta ciencia social, también llamadas "ciencias económicas":

La economía

Su historia

Douglass C. North y Robert Paul Thomas, El nacimiento del mundo occidental, Siglo XXI
Fernand Braudel, Civilización material, economía y capitalismo, Alianza
Alec Nove, An Economic History of the USSR, 1917-1991, Penguin

Su concepto

Joseph Lajugie, Los sistemas económicos, Eudeba
Karl Polanyi, El sustento del hombre, Mondadori
Lionel Robbins, Ensayo sobre la naturaleza y significación de la ciencia económica, FCE

Su estudio

Robert B. Ekelund Jr. y Robert F. Hébert, A History of Economic Theory and Method, McGraw-Hill
Mark Blaug, The Methodology of Economics: Or How Economists Explain, Cambridge University Press

Tratados

John Maynard Keynes, Teoría general de la ocupación, el interés y el dinero, FCE
Joseph A. Schumpeter, Teoría del desenvolvimiento económico, FCE
Geoffrey M. Hodgson, Conceptualizing Capitalism: Institutions, Evolution, Future, University of Chicago Press

Resumen

John Quiggin, Economics in Two Lessons, Princeton University Press

Manuales

Paul Krugman, Robin Wells y Kathryn Graddy, Fundamentos de economía, Reverté
Joseph E. Stiglitz y Carl E. Walsh, Economics, W. W. Norton
Samuel Bowles, Microeconomics: Behavior, Institutions, and Evolution, Princeton University Press
Wendy Carlin y David Soskice, Macroeconomics: Institutions, Instability, and the Financial System, Oxford University Press

Recomendación personal de lecturas obligatorias para entender la política en tanto objeto de estudio de la teoría política o "politología", y para entender la cuestiones de metodología en las diferentes ramas de esta ciencia social, también llamadas "ciencias políticas":

La política

Su historia

Bertrand de Jouvenel, Sobre el poder: historia natural de su crecimiento, Unión Editorial
Gianfranco Poggi, El desarrollo del Estado moderno, UNQ
Charles Tilly, Coerción, capital y los Estados europeos, 990-1992, Alianza

Su concepto

Hannah Arendt, ¿Qué es la política?, Paidós
Seymour Martin Lipset, El hombre político, Tecnos
Giovanni Sartori, La política, FCE

Su estudio

Leo Strauss y Joseph Cropsey, Historia de la filosofía política, FCE
Anthony de Crespigny y Kenneth Minogue, Contemporary Political Philosophers, Methuen & Co.

Tratados

Giovanni Sartori, Teoría de la democracia, Alianza
Norberto Bobbio, Teoría general de la política, Trotta
Charles E. Lindblom, Politics and Markets: The World’s Political-Economic Systems, Basic Books

Resumen

Kenneth Minogue, Politics: A Very Short Introduction, Oxford University Press

Manuales

Josep Mª Vallès y Salvador Martí Puig, Ciencia política. Un manual, Ariel
Mario Héctor Resnik, Paradigmas en ciencia política, Eudeba
Robert E. Goodin y Hans-Dieter Klingemann, Nuevo manual de ciencia política, Istmo

Por qué estos libros

La sociedad

Su historia

Alfred Weber, Historia de la cultura. Este libro abre la sección con una historia social de la cultura humana que es a la vez una historia cultural de la sociedad, cosa que casi no se ha hecho desde Spengler y Ortega. No es una historia social empírica común, ni una historia política, ni una historia institucional, y capta la lógica interna de las formas culturales que hacen que cada época tenga un significado propio y único. Es una obra especulativa que se podría considerar anterior a la sociología profesionalizada contemporánea en sentido estrecho, y por lo mismo la encuentro de un gran valor.

Norbert Elias, El proceso de la civilización. Una obra ejemplar de sociología histórica de largo plazo. Elias logra explicar cómo la subjetividad ha sido moldeada por estructuras sociales: transformaciones de la autoridad y del monopolio estatal de la violencia con cambios aparentemente íntimos en la conducta y el autocontrol. Se le puede criticar un posible exceso de confianza en la difusión desde las elites, pero aun así su lectura es imprescindible a día de hoy.

Susana Bianchi, Historia social del mundo occidental. El de Bianchi no es el libro más original de la sección, pero da una base histórica manejable para conectar las visiones sociológicas, históricas y estructurales, de gran escala, con el particular y clave desarrollo de Occidente hasta y a través de la modernidad. Es un buen complemento que evita que la lista quede demasiado dominada por obras de gran interpretación teórica de la sociedad occidental, y en cualquier caso se vale un poco de todos los grandes autores como fuentes secundarias. El de Bianchi es un libro usado frecuentemente como entrada para los cursos de historia social general, pero sirve acá para entender el desarrollo social moderno sin una especialización previa.

Su concepto

Ely Chinoy, La sociedad. Un libro formativo, sobrio y clásico. No es una obra que haya cambiado la teoría sociológica, pero a pesar de su limitación es una obra austeramente eficaz para discriminar mejor el concepto de "sociedad" que comparten en común todas las perspectivas de las ciencias sociales, manejado sin sesgarlo con ninguna escuela de pensamiento específica.

Kingsley Davis, La sociedad humana. Este libro encara la sociedad humana como una totalidad organizada. Suena antiguo en tono, y en parte lo es, pero precisamente por eso conserva algo valioso de la sociología clásica: no fragmenta el objeto de estudio antes de haberlo presentado. Es un trabajo ambicioso, amplio, muy representativo de su época: firme confianza en las grandes categorías, y una impronta funcionalista y sistémica. Ideal para bajar un poco los humos analíticos de la sociología contemporánea.

R. M. MacIver y Charles H. Page, Society: An Introductory Analysis. Estos autores me son útiles porque entran como más adecuados que otros para esbozar en forma inteligente y desglosada un "concepto de sociedad". No trabajan un tema particular sino el objeto general, pero analizado en todos sus aspectos y formas, revisitando conceptos de la sociología clásica: sociedad frente a comunidad, asociativo frente a corporativo, estructura social frente a relación social, etc. Imprescindible.

Su estudio

Nicholas S. Timasheff, La teoría sociológica. A mi juicio el mejor manual histórico de teoría sociológica: es claro, ordenado y útil para recorrer la formación y desarrollo de la disciplina. No es un libro que se lea por ser una tesis propia especialmente disruptiva o jugada -como podría ser el del argentino Agulla que también recomiendo- pero tiene la capacidad de convertir esta tradición dispersa de la academia en una progresión secuencial comprensible, analíticamente desglosada. Como ocurre con muchos manuales de teoría de mediados del siglo XX, puede quedar muy marcado por el énfasis en ciertos autores y temáticas, pero tiene un enorme valor como mapa inicial, en tanto este tipo de trabajos de autocomprensión "clásicos" son inseparables del entendimiento de la actual sociología, y que por eso mismo al día de hoy toma de referencia.

Philippe Corcuff, Las nuevas sociologías. Con una aproximación detallista bastante similar a la de Timasheff, este libro pasa directamente a la sociología contemporánea, y cubre casi a la perfección el espacio no llenado por la obra anterior. Su libro permite ver qué pasó cuando las grandes díadas de la sociología empezaron a resultar insuficientes, y acerca al lector hacia este nuevo tipo de sociología, abierta a mediaciones y menos monumental. Este libro y el anterior se deben leer juntos.

Tratados

Max Weber, Economía y sociedad. La recepción general es casi unánime: una obra fundacional e inagotable, y a la vez una obra difícil, fragmentaria pero que revela un orden subyacente. Si bien parece no partir de sustancialismos sociológicos, termina llegando a ellos por vía empírica, siguiendo la intuición teórica de la comprensión por relaciones causales con sentido (verstehen), poniendo a prueba las raíces de las grandes cosmovisiones de la idea de lo social: la sistémica de Hegel y Marx aunque sin llegar a su determinismo ontogenético, así como la contingencial de Nietzsche y Freud pero sin llegar a aquel evolucionismo filogenético. Puso también a prueba los dos grandes métodos en pugna del Methodenstreit en uno superador: el individualismo metodológico del marginalismo austríaco pero sólo utilizado para esbozar neokantianamente tipos ideales que deben testearse contra los fenómenos históricos directamente desde sus horizontes interpretativos a la manera del historicismo alemán. La crítica habitual que se la hecho es para mí un elogio, a saber: su densidad, con muchos frutos incluso no contemplados por el autor, y aunque incompleta, una enorme arquitectura de análisis, que exigen muchísimo del lector al día de hoy. La mejor edición crítica de este tratado es la de Gil Villegas, que dedicó prácticamente su vida a analizar la obra weberiana, la cual en gran medida gracias a él se revela como uno de los más grandes arsenales conceptuales de las ciencias sociales. Frente a otros grandes sistemas, Weber lleva de lejos ventaja a contemporáneos como Durkheim y Pareto. Su trabajo sigue funcionando como una enorme caja de herramientas, que no exige comprar una doctrina cerrada, y que puede ser aprovechada por cualquiera. Es difícil pensar una formación sociológica fuerte sin pasar por esta lectura, que cuando se hace bien lleva a adoptar su hábito implacable de distinguir y compararlo todo.

Michael Mann, Las fuentes del poder social. Agrego aquí este trabajo para evitar un riesgo en el que se cae con una mala lectura de Weber, a saber que la teoría social parezca demasiado conceptual y con poca comprensión diacrónica de los procesos de gran escala. Evitando explicaciones monocausales, Mann observa las sociedades por combinaciones históricas de capacidades organizativas dispares, donde el factor del poder tiene un elemento causal y generativo.

Randall Collins, Conflict Sociology. A la manera de Wright o Tilly, este autor mantiene el conflicto en el centro sin llegar al análisis marxista de clase ni a una mera sociología de la desigualdad. Este es un tratado sociológico que intenta explicar la dinámica social desde las luchas por posición de poder, de status o de clase, por reconocimiento y recursos, y no se limita a describir sólo un fenómeno en particular. Su perspectiva retoma el conflicto como principio normal de organización social, pero va más allá de considerar al mismo como un "partero" de la historia para poder hacer una transición entre dos ordenes sociales incompatibles. Sin embargo, a la vez, se aleja de las perspectivas de Weber y Mann que comienzan por el análisis institucional o macrohistórico del orden social.

Resumen

Zygmunt Bauman y Tim May, Pensando sociológicamente. Este libro no es un resumen de contenidos, sino de "formas de mirar" sociológicas, y lo que éstas tienen en común. Muchas introducciones a la sociología se vuelven catálogos de temas, pero acá Bauman y May bajan a tierra el asunto al público, partiendo desde la biografía individual vital de cada hombre, hasta descubrir las condiciones sociales independientes de su voluntad que la hacen posible. Es el libro que recomendaría a alguien que todavía no sabe si le interesa la sociología, ya que no exige erudición, aunque la inspire. Más que responder "qué es la sociología" apunta a "para qué la sociología", cosa que en general lleva a cambiar el modo de percibir lo cotidiano.

Manuales

John J. Macionis y Ken Plummer, Sociología. Macionis y Plummer cumplen la función de manual general más claro y usable. Da una entrada amplia y ordenada al campo, evitando una interpretación propia. En una lista de este tipo hace falta al menos un manual que no obligue al lector a pasar directamente de Bauman a Weber o Mann. El mérito de este manual es pedagógico: reconocer el terreno antes de internarse en textos más exigentes.

Anthony Giddens y Philip W. Sutton, Sociología. Giddens y Sutton hacen un manual parecido, pero creo que es complementario, y deberían tenerse ambos en cuenta con paciencia. Éste tiene más sensibilidad hacia la sociedad contemporánea y sus problemas particulares, y no es necesario recordar que sus autores son los que obligaron a actualizar el lenguaje sociológico. Presenta la sociología como una disciplina que todavía intenta entender el presente, y eso lo hace particular aunque no agregue más áreas de estudio.

George Ritzer, Teoría sociológica clásica / Teoría sociológica moderna. Estos son más bien manuales específico de teoría y método, de interés para la epistemología tras las ciencias sociales puras. Los manuales generales no alcanzan cuando el lector empieza a cruzarse con autores que además de decir cosas distintas construyen objetos distintos, y en esos casos es cuando viene bien libros introductorios de este tipo. Ritzer ayuda a ubicar quién es quién, cómo y qué discuten, qué problema hereda cada autor y qué problema intenta resolver, qué cambia de una tradición a otra, etc. Ambos libros forman prácticamente una sola obra, y aunque no pretenden sus autores hacer un profundo análisis crítico ni original, sí logran uno de las más útiles guías para no leer la teoría sociológica a ciegas.

La economía

Historia

Douglass C. North y Robert Paul Thomas, El nacimiento del mundo occidental. North y Thomas representan la interpretación fuerte del surgimiento del capitalismo occidental desde el institucionalismo neoclásico, aunque rechazando parcialmente el economicismo formal extrapolado fuera de los procesos de mercado aunque se utilizaran sus criterios de interés individual como si fueran universales, para aplicar un criterio por el cual los derechos de propiedad sirvieron para el desarrollo económico internalizando externalidades. El crecimiento económico ocurre cuando la tasa social de retorno (el beneficio para toda la sociedad) se equipara con la tasa privada de retorno (la ganancia del individuo que asume el riesgo). Es un libro muy discutido, en especial porque parte de la premisa de una forma de obtención de ganancias que presume el tipo de propiedad que la hace posible, pero sin embargo no deja de ser un aporte inteligente. Ponerlo en la lista es necesario para que el lector entienda una de las explicaciones más influyentes del desarrollo económico moderno. Se le ha criticado mucho que su explicación sea demasiado esquemática y que no ofrezca una prueba empírica exhaustiva de todo lo que sugiere, pero aun así es un marco sobre el que se abrieron posteriores debates y que llevó a relacionar las instituciones con el desarrollo económico.

Fernand Braudel, Civilización material, economía y capitalismo. Braudel fue el gran contrapeso para la tesis institucionalista-mercantil de North. North analiza el desarrollo desde instituciones que coordinan mejor los incentivos, pero Braudel demuestra que las formas de producción, incluyendo al capitalismo, no nacen de un criterio de eficiencia de tipo maximizadora de ingresos en el vacío, sino de condiciones que determinan los medios y los fines posibles de la eficiencia, en una historia densa basada en cambios demográficos, geográficos, socioculturales, en los cuales las instituciones no pueden explicarse por adaptaciones utilitarias abstractas a condiciones creadas por instituciones precedentes creadas de la misma forma. Su premisa fue, además, la de separar mercado y capitalismo, algo que muchas explicaciones económicas confunden. La tesis sería que las capas medias de la burguesía se basaban en el intercambio local, los talleres y ferias, en una economía de competencia regulada y transparente, dominada por la mayoría de los agentes económicos, mientras que, contra la tesis de Marx, el capitalismo estaba constituido en una simbiosis política como un estrato superior formado por grandes monopolios, finanzas internacionales y mercaderes aventureros. Para Braudel, el capitalismo es el "anti-mercado", ya que opera a gran escala eludiendo las reglas de la competencia abierta para concentrar simultáneamente riqueza y poder en mutua tensión.

Alec Nove, An Economic History of the USSR, 1917-1991. Nove ofrece una aproximación de historia económica sustantiva y formal al modelo del "socialismo real". Su libro permite entender cómo una economía revolucionaria, atrasada y devastada por la guerra y sus propios experimentos sociales de planificación militarizada, se fue transformando en un sistema de dirigismo central en la coordinación, y una colectivización forzada con ulterior apropiación estatal en cuanto a la propiedad, que habría llevado por méritos propios a un crecimiento acelerado, a la rigidez administrativa y a una crisis por esclerosis sistémica.

Su concepto

Joseph Lajugie, Los sistemas económicos. Un libro conceptual y un mapa esclarecedor que se aproxima globalmente a las formas de organización económica: primero las tradicionales economías cerradas de parentesco, luego las economías abiertas o de masas, a saber la capitalista mercantil (primero de laissez faire y luego dirigida) y finalmente la colectivista estatal autoritaria (en todas sus variantes). La economía no aparece nunca como una sola lógica universal, sino como distintos modos de organizar la propiedad y la coordinación, la producción y la circulación. Prepara al lector para que no se sorprenda cuando el conocimiento histórico lo confronte con paradigmas institucionales incomparables: liberales, socialistas e intervencionistas, sin nunca asumir de entrada que uno de esos sistemas es simplemente "la economía" y los otros sean desviaciones. Un pequeño clásico, e imprescindible.

Karl Polanyi, El sustento del hombre. Polanyi es indispensable para contraponer la economía formal con la capa material de la economía sustantiva. En vez de definir la economía como cálculo de individuos ante escasez, la piensa como el modo en que una sociedad asegura su reproducción material, y contextualiza la escasez y la abundancia en función de los recursos necesarios para el mantenimiento de las fuentes de subsistencia, para recién luego analizar su tendencia al infinito en la maximización de beneficio de las sociedades de mercado propias del capitalismo. Eso permite ver que el mercado moderno no agota lo económico y que implica un desencastramiento de un universo económico que al separarse de la cultura y así de la política, cambia de forma, de finalidad y función. La importancia dentro de esta lista es enorme, ya que impide que el concepto de economía quede enteramente colonizado por la definición formal desde Say en adelante. Este libro prolonga con mayor ecuanimidad las tesis que lo hicieron famoso, y las usa para profundizar más específicamente en las formas económicas precapitalistas en una forma que, aunque distinta a la de Marx, implica una a crítica a la reducción formalista de la economía y una insistencia sociológica en estudiar la economía en su capa subyacente. Incluso reseñas críticas lo tratan como una elaboración importante de su proyecto. El punto en común con esta lista es que Polanyi obliga a historizar el concepto de economía. El propio Douglass North elogió abiertamente a Polanyi por obligar a los historiadores económicos a salir de su zona de confort, y coincidía con él en que la economía neoclásica cometía un grave error al aplicar modelos de mercado modernos a sociedades antiguas (como la Grecia clásica o Babilonia) donde el mercado simplemente no existía. Valoraba que El sustento del hombre demostrara que, durante la mayor parte de la historia, la supervivencia humana estuvo regulada bien sea por la reciprocidad comunitaria o bien por la redistribución sinecista (vínculos culturales y políticos), y no por el sistema de precios. Sin embargo, para North, aunque este enfoque "sustantivista" de la economía era un recordatorio indispensable de que las instituciones van primero que el análisis "formalista", seguía considerando que estas formas de circulación y uso de la propiedad ocurrían por problemas para reducir costos de transacción, así como para él la imposibilidad social de búsqueda ilimitada del uso de los bienes no probaba que no operara el principio de escasez, ya que se podía presumir que los agentes económicos veían constreñida su naturaleza antropológica de agentes maximizadores de beneficio. La oposición entre la visión del mercado como optimización eficiente de la sociedad a la naturaleza humana (North, Coase), y la visión del mercado como compulsión civilizatoria determinante de los intereses en contraposición a la naturaleza humana (Polanyi, Hayek), todavía no se ha resuelto, y sigue hasta el día de hoy dirimida entre sustantivistas y formalistas, o bien desafiada por la idea marxiana de que la naturaleza humana es una materia que toma la forma de la estructura social que la canaliza. En cualquier caso, Polanyi ha sido el gran clarificador de este dilema y, paradójicamente, ha sido Hayek el que ha seguido por su senda (aunque con una visión opuesta del beneficio para la humanidad respecto a la desbiologización de la organización social).

Lionel Robbins, Ensayo sobre la naturaleza y significación de la ciencia económica. Éste es el texto clásico de la definición formal de la economía como ciencia de la elección bajo escasez. Su importancia no depende de que uno acepte esa definición, sino que ordenó el lenguaje de buena parte de la economía moderna. Las críticas posteriores —Polanyi y hasta North incluido— se entienden mejor porque Robbins formuló con precisión aquello contra lo que los sustantivistas discutían. Es un libro breve, canónico y polémico. Su fuerza está en haber vuelto extremadamente clara una frontera disciplinaria que considera que las leyes que hacen posible la economía mercantil siguen operando refrenadas en las economías premodernas. Imprescindible para constrastar las tres posiciones que aun hoy se dirimen el debate histórico económico.

Su estudio

Robert B. Ekelund Jr. y Robert F. Hébert, A History of Economic Theory and Method. Ekelund y Hébert reemplazan bien a una historia demasiado monumental porque funcionan como guía de formación. Su trabajo casi manualístico no tiene la grandeza de la obra magna de Schumpeter, pero tampoco sus excesos. Su valor está en mostrar cómo la teoría económica cambia junto con sus métodos, y aunque desde un approach algo mainstream, explican con distancia y buena hermenéutica, no sólo qué dijeron los autores, sino cómo fueron cambiando las formas aceptables de razonar en economía. En este sentido es un libro más práctico que cualquier otra historia del pensamiento puramente narrativa, y sin embargo deja en banda menos autores clave que muchos manuales más sofisticados pero más serviles a su propio sesgo.

Mark Blaug, The Methodology of Economics. Blaug complementa a Ekelund-Hébert porque se adentra más en la evolución epistemológica de las ciencias económicas, y en cómo se justifican. Es un libro algo incómodo para la disciplina porque se pone a revisar sus aspiraciones científicas y luego, acto seguido, no se las concede sin pagar peaje. Obliga a mirar el aparato de investigación económica desde su costado metodológico: qué significa explicar teóricamente, contrastar, qué es proteger un modelo (paradigma), aceptar un supuesto o declarar irrelevante una anomalía. A diferencia de muchos manuales canónicos, Blaug evita que el lector tome la versión que el economista hace de su rubro, como si fuera una ciencia natural transparente. Con prosa punzante desmenuza las teorías económicas apenas siendo injusto. Y vale mencionar que su perspectiva neoclásica-neokeynesiana nunca se confunde con las tesis de los autores que analiza, aunque intente con ella dar cuenta a su manera de las explicaciones de aquellos. Cuestiona fuertemente la cientificidad de las diferentes corrientes, y se mete con cómo explica cada economista, qué hacen con los supuestos, cuán reales o irreales son, qué significa contrastar una teoría, y ahí entra con nombres como Popper, Kuhn o Lakatos, cosa que rara vez se ve en un libro de historia del pensamiento económico. La recepción que tuvo el libro fue buena porque no viene con epistemologías obtusas aplicadas desde afuera como demarcación de lo filosóficamente viable a lo Bunge, sino una crítica metodológica con conocimiento interno desde la economía más sofisticada. Es el libro perfecto para que los estudiantes no lean ningún manual, del punto de vista que fuera, como si su modo de explicación fuera obvio.

Tratados

John Maynard Keynes, Teoría general de la ocupación, el interés y el dinero. El clásico tratado, que más que atacar el marginalismo, se saltea la cuestión partiendo de muchas de sus premisas, y pasa a concebir de vuelta, a la manera de ciertos clásicos como Smith, un todo distinto de las partes. No resume una macroeconomía ya dada, que había quedado atrapada en el clasicismo de Mill y vuelta ausente en la síntesis neoclásica de Marshall, reconstruyéndola a su manera desde el problema del empleo, la inversión y la incertidumbre en una economía monetaria. Su punto decisivo es que el nivel de ocupación no queda garantizado por el precio del trabajo ni por una tendencia automática al equilibrio de pleno empleo, sino por el gasto efectivo, las expectativas, la preferencia por la liquidez, la tasa de interés y la decisión de invertir. Mostraba que el capitalismo puede trabarse desde dentro, no por una interferencia externa ni por una falla moral de sus agentes, sino por la propia forma en que se coordinan el dinero y las expectativas futuras con la inversión. Cambió la pregunta acerca de qué debe explicar la economía. La dirección abierta por Hayek hacia una macroeconomía austríaca, chocó con los planteos de Keynes, pero lo hizo desde un paradigma aparte. Schumpeter, en cambio, le habló en su terreno. Paradójicamente, las posiciones de Keynes y Schumpeter, aunque moviéndose en un mismo nivel, terminaron enfocándose en cuestiones parcialmente distintas, mientras que Keynes y Hayek chocaron en los mismos puntos y en un diálogo explícito. Paradójicamente, sería Roepke quien formularía una síntesis pragmática de ambas interpretaciones de las causas de las depresiones económicas, dividiéndolas en dos tipos distintos.

Joseph A. Schumpeter, Teoría del desenvolvimiento económico. Schumpeter acá desarrolla su tesis sobre cómo se sale de la circularidad del proceso económico estacionario y se produce desarrollo. Su tesis central es que el capitalismo no puede entenderse sólo desde el proceso de mercado, con un punto de equilibrio o tendencia al equilibrio, o como mero espacio de intercambio y/o asignación eficiente, sino como un proceso de constante ruptura endógena producida por nuevas combinaciones estructurales entre innovaciones empresariales y producciones disruptivas en el proceso de competencia, en relación con las determinaciones del crédito, los beneficios, la tasa de interés y una propia interpretación de los ciclos económicos. A pesar de ser un heredero parcial de Eugen von Boehm-Bawerk, ve la ganancia no como una recompensa por esperar o por ahorrar, y desglosa la ganancia extraordinaria como resultado transitorio de una transformación de una unidad productiva sobre el todo, que desordena la estructura existente. A diferencia de Keynes y a la vez a diferencia de Say, Schumpeter no se queda con que la economía capitalista quede reducida al problema de la demanda o de la oferta. Echa un ojo al movimiento interno del proceso capitalista, y reabre el puente con el marginalismo, pero en una forma complicada para la misma, por lo cual la síntesis neokeynesiana de Samuelson y Hicks no tomaría su aporte como propio y sin embargo es clave para la comprensión del mainstream aun desde fuera de éste.

Geoffrey M. Hodgson, Conceptualizing Capitalism. Hodgson entró acá porque me hacía falta un tratado sobre el capitalismo que no fuera ni marxista doctrinal ni neoclásico. Este tratado investiga las condiciones institucionales que deben existir para que el capitalismo sea posible. Es una obra erudita, amplia y conceptualmente precisa sobre el capitalismo y sus instituciones. Susan Rose-Ackerman, en Journal of Economic Literature, destaca cuánto aprendió de su historia intelectual, aunque señala como limitación la falta de un análisis más profundo de la política en las democracias capitalistas. Sin embargo, las reseñas convergen en que el libro sirve para clarificar conceptos básicos del capitalismo y evitar usos vagos de términos como propiedad, capital, derecho, empresa, etc.

Resumen

John Quiggin, Economics in Two Lessons. Este libro confronta el tipo de deducciones que el sentido común económico hace al confundir un negocio particular con el conjunto de la economía, pero en sentido inverso al de Hazlitt que utilizaba otros criterios del sentido común social generado por las sociedades de mercado, de forma que no acude a repetir refutaciones panfletarias que potencian creencias erróneas igualmente tontas, y trata de acercar al lector a la complejidad del orden social en forma compleja, no con una mala lectura de los flujos circulares keynesianos o de los procesos productivos hayekianos. Toma la famosa pedagogía da Hazlitt, que transformaba en aparentemente obvias las premisas trucadas de Mises, y las utiliza para dar lecciones más serias, donde no se usan la apelación a los costos de oportunidad para negar la existencia de las externalidades, los problemas de bienes públicos y los efectos distributivos. En vez de enseñar aparentes obviedades, Quiggin llama primero a la prudencia, en tanto demasiadas explicaciones económicas parecen convincentes sólo porque recortan el problema antes de empezar. El suyo es un texto breve, que corrige simplificaciones del mainstream neoclásico, así como los axiomas encubiertos de los neo-austríacos tras un aparente sentido común. Muy relacionado con la posición de Friedrich von Wieser, el autor enfrenta a los publicistas de los aparatos axiomáticos cerrados de otros tratadistas, como lo fuera Bastiat respecto de Say y el mismo Hazlitt respecto de Mises, que terminaron representando al mercado como un espacio de coordinación neutral en el cual las fallas quedaban atribuidas a decisiones privadas o deficiencias humanas, mientras que las instituciones económicas al resultado de la búsqueda de beneficio abstracto de agentes individuales.

Manuales

Paul Krugman, Robin Wells y Kathryn Graddy, Fundamentos de economía. La ventaja de este texto es la forma narrativa y el uso de casos. El lector recibe además un mapa conceptual, y luego, en cada caso, una manera de conectar esos conceptos con problemas reconocibles. Puede tener un tono más reconocible "políticamente" que otros manuales, pero para esta lista eso no es necesariamente malo. Después de venir leyendo a Polanyi, Keynes, Schumpeter y Hodgson, conviene que el primer manual general a utilizar no esté escrito desde un mundo imaginado en un vacío institucional y sin coyunturas. A pesar de que Krugman sea un autor clave del mainstream, es serio.

Joseph E. Stiglitz y Carl E. Walsh, Economics. Este manual queda bien después de Krugman porque funciona como un segundo manual general, más sofisticado y menos dependiente de una presentación escolar de la economía. Si bien no es un tratado realmente heterodoxo, tampoco es un manual que deja las imperfecciones para el final como si fueran excepciones menores. Stiglitz es un autor ideal para exponer las tesis sobre asimetrías de información, mercados incompletos, fallas de coordinación y cuestiones de políticas públicas, que se muestren como problemas internos de la economía contemporánea y no como notas al pie del equilibrio competitivo. Walsh, por su parte, le da una base macroeconómica y monetaria más ordenada. El trabajo de ambos cumpliría acá una función de puente: enseña economía dentro del currículo tradicional, peroya no como si los mercados reales fueran sólo versiones imperfectas de un mundo ideal.

Samuel Bowles, Microeconomics: Behavior, Institutions, and Evolution. Este es un texto mitad manual mitad tratado, avanzado y alternativo, y no una mera crítica externa de la economía estándar. Es una obra avanzada de teoría microeconómica que replantea la disciplina integrando la teoría de contratos, la teoría de juegos evolutiva y experimentos de economía del comportamiento Su mérito está en disputarle el terreno desde adentro al mainstream neoclásico-neokeynesiano, conservando el análisis formal pero cambiando el paradigma que éste capta al incorporar con profundidad teórica el rol económico de las instituciones y el funcionamiento del poder social, así como cuestiones menos conocidas como las preferencias socialmente formadas y su determinación por condiciones mediadoras. Sirve para que el lector acceda a una microeconomía desatada de la empobrecida antropología de los neoclásicos o a la gramática formalista de los apriorismos.

Wendy Carlin y David Soskice, Macroeconomics: Institutions, Instability, and the Financial System. Estos autores cumplen en macro una función parecida a la que Bowles cumple en micro, aunque desde una posición menos rupturista y más cercana a un puente institucional dentro de la macro contemporánea (a diferencia de, por ejemplo, un estructuralista desarrollista kaleckiano como Taylor). Este libro no abandona el lenguaje de los modelos, pero no enseña como anexos a la macroeconomía al sistema financiero, a la inestabilidad por expectativas realimentadas o las instituciones. Trata la cuestión bancaria, el crédito, el inflación, la política monetaria, la demanda agregada y las crisis cíclicas, dentro de una arquitectura más realista que la de los manuales que siguieron enseñando como si 2008 no hubiera obligado a revisar nada.

La política

Historia

Bertrand de Jouvenel, Sobre el poder. El libro entero es una suerte de genealogía del Estado, desde sus formaciones incipientes hasta su forma cabal en el Estado moderno. Parte de su anatomía y de dinámica expansiva, y no cae en un defensa simplista de la impotencia gubernamental ni como una condena de toda autoridad. Jouvenel explica que ninguna procedencia legítima, finalidad benéfica ni constitución escrita basta para contenerlo, y que sólo puede hacerlo una sociedad provista de centros políticos de autoridad propios, con hombres habituados a defender su independencia, y un derecho que no sea mera emanación del gobierno, mediante un entramado de poderes estamentales diversos —linajes, aristocracias, corporaciones gremiales, iglesias, autonomías locales, costumbres y derechos adquiridos— capaces de oponerle resistencia efectiva. Su tesis última es que la libertad no depende tanto de quién ocupa el Poder como de cuánto poder existe fuera de él y de qué cosas, aun invocando al pueblo, la nación, la igualdad o el bienestar general, le está efectivamente prohibido hacer. Es una forma gráfica de viajar en el tiempo y graficar la evolución de esa cosa llamada poder político, que no es lo mismo que cualquier poder ni que política en sentido estricto. Cabe advertir que el autor no cae en el cuento de hadas liberal-conservador donde Estado y capitalismo aparecen como enemigos originarios. Muy por el contrario, sostiene que la aristocracia capitalista es la "hermana menor" del Estado moderno y que se desarrolló bajo su protección. Al destruir las comunidades familiares, señoriales y corporativas que retenían a los individuos dentro de relaciones personales solidificadas en un entramado de estatutos políticos propios, el poder abstracto produjo una de las condiciones fundamentales del mercado moderno: hombres disponibles individualmente como trabajadores y como consumidores. El Estado favoreció además a comerciantes, fabricantes y banqueros que, a diferencia del señor feudal, no parecían inicialmente mandar sobre una comunidad que escapara a la jurisdicción pública: el armador no sustraía a sus marineros al Estado sino que los ponía a su disposición; el banquero acumulaba una riqueza que el Estado podía convertir después, mediante préstamos e impuestos, en fuerza política y militar. La dinámica de hibridación con las altas autoridades de la sociedad burguesa, que entregaban a un centro burocrático toda posible autoridad política mientras que les aseguraba su poder social sobre una población proletarizada, se rompería en conflicto al menos por un tiempo. El gran industrial se había vuelto algo más que un propietario de una clase dominante: ahora tiene un gobierno único propio en la fábrica, organiza la ciudad obrera, controla viviendas, servicios y, en ciertos casos, incluso una policía propia; el poder financiero, por su parte, administra enormes masas de ahorros ajenos y construye organizaciones capaces de imponer decisiones a multitud de personas. En reacción, el Estado ha redirigido el poder político contra estas "células capitalistas", apelando al conflicto con las clases obreras, para reincorporar a estos capitanes burgueses a las burocracias del capitalismo, y al mismo tiempo convertirlas en una sola unidad con los intereses de la burguesía como un todo. Esto termina en sindicatos del Estado, centralizados, que dan fuerza a una clase pero a cambio de un control de la misma, cosa que luego resulta en parte de un orden estable (que conoceríamos como welfare-warfare state), útil para todas las partes al menos dentro del mismo, en tanto el empresariado se encontró momentáneamente en un dilema del prisionero al repartirse el poder político, y la clase obrera no puede tener un poder político unificado sin entregarlo a una élite revolucionaria, que es la anomalía totalitaria en la que el poder también ha terminado, primero con el jacobinismo y luego con el bolchevismo. Un libro imprescindible de la filosofía política que, aun con un tono aristocrático y muy particular de su autor, abre la puerta a una posterior ontología de la política, faltante en la historia de las ciencias sociales.

Gianfranco Poggi, El desarrollo del Estado moderno. Poggi es el contrapeso sobrio a Jouvenel. En vez de partir de la expansión del poder como una fatalidad lo analiza como una tendencia compleja, reconstruyendo las formas institucionales por las cuales el Estado europeo fue diferenciándose de la sociedad y concentrando autoridad pública: el orden feudal, la monarquía estamental, la monarquía absoluta y finalmente el Estado-república, sea en su forma constitucional-burguesa o totalitaria de partido único. Su tesis más importante es que el Estado moderno no es la forma natural de toda comunidad política, sino un arreglo histórico específico, compuesto por jurisdicciones territoriales y una pretensión creciente de soberanía. El libro puede entenderse como la historia de la política en una doble trayectoria: primero, la concentración, diferenciación y despersonalización del gobierno, desde la dispersión feudal hasta la unidad jurídico-administrativa del Estado constitucional; finalmente, la progresiva penetración mutua del Estado y una sociedad capitalista organizada, que expande las funciones públicas pero vuelve más inciertos los límites, la autonomía y la legitimidad de ambos. Poggi no describe esa trayectoria como un progreso necesario ni como el crecimiento lineal de una sustancia llamada poder, sino como la formación históricamente contingente de determinadas estructuras de gobierno, cada una de las cuales resuelve problemas heredados al precio de producir nuevas contradicciones. En forma muy resumida, Gianfranco da los siguientes pasos: el feudalismo protege derechos pero fragmenta el mando; el Estado estamental institucionaliza la negociación pero consagra privilegios; el absolutismo crea unidad política y capacidad administrativa pero personaliza la soberanía; el republicanismo libera al poder del residuo estamental del rey, por lo que desata el radicalismo revolucionario que lo hace infinito a su propia costa económica, y luego el constitucionalismo somete su poder a una ley parcialmente exógena que encubre desigualdades de poder socioeconómicas; y, finalmente, el Estado social democratiza e interviene sobre esas desigualdades, aunque desdibuja las fronteras institucionales y debilita los mecanismos liberales que debían controlar su actuación. Por eso la preocupación última de Poggi no es simplemente que el Estado se vuelva "más grande", sino que la expansión e interpenetración contemporáneas puedan destruir el equilibrio específicamente occidental entre un Estado suficientemente unitario para gobernar, suficientemente autónomo para no quedar sometido a poderes privados, y suficientemente limitado por el derecho y la participación como para no convertir su capacidad de mando en dominación arbitraria. Es un libro breve, pero muy eficaz para mostrar que aquello que hoy parece una unidad evidente —administración, derecho, gobierno y territorio— fue el resultado de una lenta recomposición institucional.

Charles Tilly, Coerción, capital y los Estados europeos, 990-1992. Tilly completa la historia del Estado moderno trasladando el centro de explicación desde las ideas jurídicas hacia los mecanismos que permitieron a ciertos gobernantes sobrevivir frente a otros: cómo la guerra obligó a extraer recursos y generar administraciones, negociando finalmente con propietarios de capital para disciplinar territorios, en una compleja combinación entre coerción concentrada y capital urbano de la que surgirían trayectorias estatales distintas. La célebre proximidad que Tilly establece entre la construcción estatal y el crimen organizado es más que una provocación: ambos ofrecen protección frente a amenazas que en parte ellos mismos producen, aunque el Estado termine legitimando y estabilizando esa relación. El autor no reduce, sin embargo, la explicación a la violencia desnuda, en tanto fueron las necesidades fiscales las que forzaron las negociaciones, y de esas negociaciones surgirían derechos civiles, económicos y de libertad política, generando nuevas formas de representación y ciudadanía. En Tilly, la historia institucional aparece como resultado no planeado de luchas por recursos y la supervivencia política, tanto entre facciones internas o de partido, como geopolítica entre los mismos Estados.

Concepto

Hannah Arendt, ¿Qué es la política? ...

domingo, 31 de mayo de 2026

Inteligencia natural

Las actuales inteligencias artificiales generativas son extraordinariamente útiles, pero su éxito comercial no demuestra que constituyan un camino hacia la inteligencia. Este ensayo examina sus límites cognitivos y materiales y recorre alternativas neuromórficas, predictivas y neurosimbólicas.

Cuando se habla de “la IA” como si fuera una sustancia histórica única, se comete ya el primer error. No existe “la IA” como algo genérico, como una sola forma, casi como si fuera una sola entidad, y no existe tampoco como un destino inevitable de la técnica, del mismo modo que no existió “la industria” como una sola forma necesaria de organizar la producción industrial. Lo que hoy se impone bajo el nombre genérico de inteligencia artificial es, más precisamente y aquí sí vale el uso del término en cierto contexto académico, un régimen técnico e histórico determinado, a saber: modelos generativos de gran escala, entrenados sobre corpus inmensos, optimizados por métodos estadísticos, ejecutados sobre infraestructuras energéticamente costosas, y desplegados por empresas; empresas que más que hacer productos construyen entornos de dependencia social, comunicacional y cultural.

La actual IA generativa es específicamente neural, basada en redes entrenables, no la IA lógica basada en secuencias de instrucciones llamados programas (que fue la dominante desde fines del siglo XX a comienzos del presente, aunque ambas emergieran casi juntas por ramas muy distintas). Y la actual, que está haciendo metástasis para todo uso en el mundo desde prácticamente 2024, no es cualquier red neural. Tampoco conforma un cerebro en ningún caso, ni en conjunto ni por separado, incluso aunque se llegara a la mistificada inteligencia artificial general (en el ambiente tecnológico se usa AGI pronunciado en inglés, para diferenciarlo de la AI que no llegaría a serlo, supuestamente). No se trata de cualquier automatización, y tampoco funciona como un gran algoritmo. No es cualquier experimento de ciencia cognitiva computacional, y tampoco es ésa la intención. Para entender las inteligencias artificiales actuales, dejo debajo una lista de videos bastante educativos, aunque técnicos. Pero lo que hoy llamamos “la inteligencia artificial”, como una gran entidad gigantesca, tal vez sí ya exista, pero no de la forma en que imaginamos. Se trata de una forma particular de articular ese cosmos artificial de hardware, software, capitales, lenguajes y, quién diría, promesas civilizatorias, que rodea al establecimiento y provisión de modelos al público basados en este tipo, muy específico, e increíblemente tosco, de redes neurales artificiales. Iré, pues, del todo a las partes. Veamos...

Para empezar, la pregunta que hay que hacerse no es si esta gigantesco servicio de IA “sirve”. Sería absurdo negar que sirve a algo. La pregunta es ¿a qué sirve? (y también ¿a quién sirve? en última instancia) Para empezar hay que recordar que sirve, en principio, para una sociedad (el término gente dejémoslo aparte por un momento) que será modificada por ésta en sus fines, porque dependerá de ella y luego la requerirá para subsistir, cosa que no es una elección previa de nadie, y lo será menos luego de que esa codependencia se establezca completamente, como ocurre con toda tecnología de uso masivo. Sin duda, la IA sirve para traducir, resumir, programar, asistir, generar imágenes, clasificar documentos, simular interlocutores, acelerar procesos administrativos, abrir zonas genuinamente fértiles de investigación, etc. Sin duda que responde bien a la pregunta utilitaria en este sentido estrecho, pero la cuestión es otra, ya que el régimen que hoy se expande como inteligencia artificial puede confundirse sin más con un camino hacia la inteligencia fuerte. ¿Se dirige hacia ahí? ¿O la AGI será sólo el zombi filosófico escalado que es ahora? Creo que estamos ante un artefacto (recuérdese esta palabra) extraordinariamente útil pero estructuralmente pobre, que por su utilidad inmediata amenaza con colonizar el espacio de las alternativas. Y el problema es que está triunfando demasiado pronto, antes de que hayamos aprendido a distinguir una competencia superficial de una verdadera comprensión, así como a no confundir correlación con causalidad, a generación con relación con el mundo, a inducción con deducción, a discernir la diferencia clave entre memoria emulada y memoria viva, así como entre agencia simulada y agencia real.

Dicho de otra forma: el problema no es que los modelos actuales no hagan nada. Hacen muchísimo, y precisamente por eso pueden instalarse como si aquello que hacen fuera equivalente a pensar. La historia de la técnica está llena de herramientas que primero resolvieron problemas parciales y luego redefinieron el horizonte de lo posible, y que al hacerlo volvieron invisible todo lo que no encajaba en su propia lógica. Acá está la cuestión que interesa: acabar con la idea de IA como noción abstracta, y que la gente tenga una somera idea de lo que sus propios inventores, creadores y desarrolladores están viendo, o sea: la metástasis de esta IA en particular.

Voy a ir por niveles del problema, yendo de los más bien prácticos y de aplicación, hasta los más teóricos y de naturaleza, para cerrar con las implicaciones humanas del asunto.

Fuentes sobre la distinción organismo-artefacto en relación con la IA neural:

Textos y papers

Iris van Rooij et al., “Reclaiming AI as a Theoretical Tool for Cognitive Science”
https://link.springer.com/article/10.1007/s42113-024-00217-5
Melanie Mitchell, “Why AI Is Harder Than We Think”
https://arxiv.org/abs/2104.12871
Gary Marcus, “The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence”
https://arxiv.org/abs/2002.06177

Videos

IBM Technology, “AI, Machine Learning, Deep Learning and Generative AI Explained”
https://www.youtube.com/watch?v=qYNweeDHiyU
3Blue1Brown, “Neural networks”
https://www.youtube.com/playlist?list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi
“What the Books Get Wrong about AI [Double Descent]”
https://www.youtube.com/watch?v=z64a7USuGX0
“The moment we stopped understanding AI [AlexNet]”
https://www.youtube.com/watch?v=UZDiGooFs54
“These Numbers Can Make AI Dangerous [Subliminal Learning]”
https://www.youtube.com/watch?v=NUAb6zHXqdI
Melanie Mitchell, “Why AI is harder than we think. Melanie Mitchell. Santa Fe Institute”
https://www.youtube.com/watch?v=WF_nm0axBzo

Dependencia del camino: la subordinación de la ciencia a la tecnología

El primer nivel de la crítica es, si se quiere, material, en sentido técnico e industrial, al menos en principio. Conviene empezar ahí porque de otro modo uno se deja hipnotizar por la interfaz: prompts a una ventanita donde una máquina responde como si fuera alguien. La “desmaterialización” conversacional es engañosa, y detrás hay data centers, electricidad, agua, chips, minerales, cadenas de suministro, capital financiero, concentración de talento, contratos de nube, y todo eso es el sustrato tanto físico como social. Se calcula que sólo en 2024 los data centers consumieron cerca del 1,5% de la electricidad mundial (más o menos 415 TWh). Una tecnología que, para sostener esta ya cada vez más fea promesa, necesita expandir de manera acelerada su infraestructura energética, y que no puede evaluarse como si fuera una mera herramienta de software. El AI Index de Stanford muestra que en 2024 alrededor del 90,2% de los modelos notables provinieron de la industria. La OCDE analizó la infraestructura de IA y descubrió sólidas barreras de salida respecto a al misma: los ecosistemas de software y hardware, como CUDA, hacen que migrar a alternativas no dependa de cambiar un componente sino de un ecosistema completo.

Debemos dejar de pensar el problema con un optimismo ingenuo de mercado, porque si una trayectoria tecnológica exige inversiones crecientes, que implica estándares de facto, que requiere un estándar de compatibilidad con herramientas ya existentes, y un despliegue de nueva infraestructura física costosa, entonces puede estabilizarse independientemente de si la trayectoria de desarrollo científico-técnico sea la más adecuada para sí misma desde su punto de inicio. El mercado no puede corregir estos componentes a semejante nivel, ya que los cristaliza: para un proceso de mercado, la dotación de recursos precedente no es neutral. He hablado de esto en ya demasiados posteos de mi blog, pero vale la pena repetirlo: no sólo se trata de que la demanda está atomizada y que genera una oferta compulsiva para las partes, sino que la demanda no es un ente abstracto con una subjetividad humana que sea independiente de otra oferta, teniendo esta última sus posibilidades determinadas objetivamente por necesidades tecnológicas, sino que es la demanda misma la que es co-creada con la oferta, ambas en conjunto en un gran proceso social-tecnológico, por ende inercial. En este proceso no es el mercado el que elige las relaciones sociales que exige la producción, sino que es el mercado el que acerca lo que se produce a la utilidad para esas relaciones. No existe una utilidad abstracta humana separada de los mercados, ya que es ese orden emergente en el que se insertan los hombres. La subjetividad individual puede tener libre albedrío, pero incluso así, en el caso de las sociedades impersonales, las agregaciones de voluntades de agentes decidiendo sin coordinación mutua cómo surfear las olas de los mercados y sus tecnologías, dan forma a la flota de empresas según esta acción pero no según su voluntad (Ferguson dixit), con lo cual no pueden determinar su dirección, y pueden terminar generándola aunque todos y cada uno se opongan a la misma: los capitanes de estas empresas ya no eligen los puertos, sino que es el viaje mismo el que tiene a sus acciones subordinadas. Ergo, si ambos polos (oferta y demanda) de un mismo proceso cuya lógica y forma (capitalista) opera sobre una misma materia (el mercado general), no se articulan entre sí conscientemente, aunque sea a nivel macro, pueden tomar rumbos fatales incluso respecto a sí mismas (esto Hayek lo tuvo que admitir respecto al derecho en el common law, y también en economía: no le tenía miedo a la palabra planificación en este sentido). El sendero rentable de corto plazo puede bloquear el sendero más fértil de largo plazo, y cuando ese sendero se materializa, se vuelve una infraestructura que cambia el marco de lo útil, o sea de lo eficaz y de lo eficiente. A dicha altura, cualquier corrección ya no dependerá de escribir un paper mejor, sino de mover capitales, suministrar energía, de fábricas, estándares, profesionales, contratos y expectativas.

El problema de la IA actual no es tanto que pueda imitar mal el razonamiento, que lo hace (en realidad, incluso cuando razona bien, porque le es indistinto, pero dejemos esto para después), sino más bien que parece estar construyendo un mundo donde los intentos de razonar de verdad ya no encuentren condiciones materiales para desarrollarse. Acemoglu lo plantea parcialmente cuando distingue entre una IA orientada a complementar capacidades humanas y una trayectoria actual volcada a la automatización y la concentración. Mi preocupación es similar pero le agregaría un detalle: que esa trayectoria además de ser socioculturalmente regresiva, sea cognitivamente regresiva, ya que se están premiando a sistemas que mejor escalan en el ecosistema existente, en vez de a los sistemas que más se acercan a una inteligencia real, que como desarrollaré un poco más abajo, debe estar basada en “el mundo”, la causalidad y la comprensión teorética, o sea: mediante una verdadera abstracción de la realidad.

Fuentes sobre las dependencias del camino sociotecnológicas:

Textos y papers

IEA, “Energy and AI – Energy demand from AI”
https://www.iea.org/reports/energy-and-ai/energy-demand-from-ai
Stanford HAI, “The 2025 AI Index Report”
https://hai.stanford.edu/ai-index/2025-ai-index-report
OECD, “Competition in Artificial Intelligence Infrastructure”
https://www.oecd.org/en/publications/competition-in-artificial-intelligence-infrastructure_623d1874-en.html
Daron Acemoglu, “The AI Revolution: The Possibility of a Pro-Human Direction”
https://www.hsgac.senate.gov/wp-content/uploads/Testimony-Acemoglu-2023-11-08.pdf
Kate Crawford, “Atlas of AI”
https://yalebooks.yale.edu/book/9780300264630/atlas-of-ai/
Kate Crawford & Vladan Joler, “Anatomy of an AI System”
https://anatomyof.ai/

Videos

Kate Crawford, “Kate Crawford: Anatomy of AI”
https://www.youtube.com/watch?v=uM7gqPnmDDc

Alternativas a la infraestructura actual: sistemas neuromórficos y otros

El segundo nivel es la arquitectura física del cómputo. La metáfora de la “red neuronal” suele ocultar que una red artificial contemporánea, aun cuando use “pesos” y “activaciones”, corre sobre máquinas con hardware (CPUs, GPUs) y software (emuladores de redes neurales haciendo procesos matemáticos en bruto) que utilizan de soporte material a, precisamente, el sistema con una lógica casi diametralmente opuesta a la neural (entrenable), o sea: el modelo lineal de cómputo lógico-algorítmico (programable), que sería llamado de “von Neumann”, en el que necesariamente está separada, por un lado, la memoria como datos discretos, y, por el otro, el procesamiento lógico-matemático que los articula y ordena. En una arquitectura von Neumann, los datos se almacenan en un lugar y se procesan en otro. El resultado es que una parte enorme del costo temporal y energético no está en la operación matemática en sí, sino en mover datos. IBM se puso al hombro el problema, y lo resumió lacónicamente con una simple aserción: el costo de tiempo y energía asociado al movimiento de datos es el obstáculo más importante del cómputo utilizado en la IA. Punto. Hay que evitar confundir una abstracción matemática con su encarnación física. Que una red artificial tenga “pesos” no la vuelve materialmente análoga al cerebro, y en el cerebro, la memoria está encarnada en la estructura misma que la procesa, o sea: cada sinapsis no es una celda de memoria externa que un procesador consulta sino que es su mecanismo base de transmisión y modificación. En una red biológica, la historia del sistema está escrita en la forma misma del sistema. En la IA contemporánea, en cambio, la red es una emulación estadística, y encima lo hace sobre una arquitectura que transporta matrices. Podrá ser una emulación asombrosa, pero sigue siendo una emulación, que opera sobre un sustrato físicamente torpe, que se da de patadas con aquello que, encima, simplemente pretende imitar.

Por eso las líneas de investigación, como ser la de compute-in-memory, in-memory computing, memristores, chips neuromórficos, SNNs, arquitecturas event-driven, etc., no son exotismos marginales a la labor científica actual en IA, sino que, muy por el contrario, son respuestas al hecho de que el régimen actual separa aquello que en la biología va unido, a saber, memoria y cómputo, estructura y proceso, estado y operación. Obviamente, un chip neuromórfico no resuelve por sí solo el problema de la inteligencia, en tanto no alcanza con hacer spikes para obtener causalidad, ni alcanza con integrar memoria para obtener deducción, pero es condición necesaria, y ya de por sí es útil con sólo esto. Sin un sustrato que haga viable el aprendizaje continuo, temporal y local (i.e. donde los ajustes de las conexiones vía pesos sinápticos se realizan utilizando solo la información disponible en la propia neurona o en sus conexiones directas, a diferencia del modelo de retropropagación), las formas más interesantes, e infinitamente mejores energéticamente, de inteligencia artificial quedan materialmente penalizadas, y hace que en vez de crearse agentes que aprendan “viviendo”, sea más barato (pero más caro luego, aunque esto el mercado nunca lo pueda mensurar) seguir fabricando modelos pasivos enormes. No se trata aquí de “digital vs. analógico” (esto también, pero es otro punto) o “sintético vs. biológico” (esto ya tiene más ribetes metafísicos respecto a la demarcación de qué es orgánico), sino de la oposición entre una memoria externa servida a un procesador versus una memoria incorporada en el proceso mismo. Una IA más natural, orgánica aunque sea sintética, tendría que acercarse a esta segunda forma, y repito: no es necesario para esto que sea de carne, ni que tenga neuronas biológicas, pero sí estar organizada como un sistema unificado donde recordar, computar, ordenar, modificar y actuar, no sean operaciones separadas.

Fuentes sobre las redes neuromórficas y las soluciones a la emulación:

Textos y papers

IBM Research, “In-memory computing”
https://research.ibm.com/projects/in-memory-computing
IBM Research, “In-memory hyperdimensional computing”
https://research.ibm.com/blog/in-memory-hyperdimensional-computing
Intel, “Neuromorphic Computing”
https://www.intel.com/content/www/us/en/research/neuromorphic-computing.html
Samuel Schmidgall et al., “Brain-inspired learning in artificial neural networks: a review”
https://arxiv.org/abs/2305.11252

Videos

IBM, “What is In-Memory Computing?”
https://www.youtube.com/watch?v=BTnr8z-ePR4
Intel, “Architecture All Access: In Conversation on Neuromorphic Computing”
https://www.youtube.com/watch?v=aIESmwxuJbE

Red de perceptrones: un callejón sin salida gnoseológico

El tercer nivel es la diferencia entre el modelo de la red basada en el perceptrón artificial y el basado en la neurona biológica. Un perceptrón, en su forma elemental, es una suma ponderada seguida de una función de activación. O sea, grosso modo: entran valores, se multiplican por pesos, se suman, y se produce una salida. Es una abstracción ingeniosa que se vuelve empobrecedora si se la toma como imagen adecuada de una neurona. La neurona biológica se basa en el tiempo, tiene una historia, opera con membranas, tiene refractariedad, y mil otros elementos cada uno con una función en un modelo radicalmente distinto: dendritas, oscilaciones, spikes, umbrales dinámicos, neuromodulación, plasticidad local y estados internos. No hace “cálculos” matemáticos sino que almacenamiento y proceso son locales aunque el conjunto lógica-memoria sea holístico (realmente holístico), y además vive en una dinámica temporal.

Charles Simon, en su serie divulgativa sobre por qué el machine learning no es como el cerebro, lo explica con una imagen bastante útil. Muchos modelos artificiales tratan el valor de una neurona como si fuera una tasa o magnitud agregada; una neurona biológica usa timing, fase y relaciones temporales entre spikes. El perceptrón ignora el timing relativo o la fase, y se queda con una magnitud agregada. Nada de esto significa que la neurociencia sea reducible al argumento de Simon, ya que la biología integra a las señales como información, pero la cuestión es que una red de perceptrones estáticos no tiene nada que ver con el modo en que el cerebro hace del tiempo una dimensión interna de la información. Buzsáki lleva esto a un modelo todavía más amplio, según el cual el cerebro no es un dispositivo pasivo que recibe inputs, sino un sistema que produce actividad desde adentro hacia afuera y usa la acción para dar significado a la percepción. Freeman, con su énfasis en la dinámica no lineal, en atractores y oscilaciones, había insistido también en que el significado emerge en estados globales de un sistema vivo, y que no reside en agregados de símbolos aislados ni en rasgos estadísticos. Una red sintética verdaderamente más orgánica no debería limitarse a imitar la apariencia general de una red.

En este punto aparece el ejemplo del niño que aprende una figura o el número “1” (cualquier ejemplo sirve). La comparación con MNIST es que una red clásica puede requerir miles o decenas de miles de imágenes etiquetadas para clasificar dígitos manuscritos con alta precisión. Un niño, en cambio, no aprende el “1” como una nube estadística de píxeles en base a una inducción de fuerza bruta de impresiones (Hume creía que de esta última forma operaba la abstracción, pero su teoría empirista nunca representó la realidad de la cognición humana). Lo ve, lo traza, sigue el trayecto de la línea, lo vectorializa, lo reconoce deformado, lo diferencia de otros signos, luego lo ubica en una serie, lo usa para contar, lo relaciona con “uno” como cantidad, con “primero” como orden, con marcas en objetos, con dedos, o sea, con prácticas de uso que modifican su sentido. Las mentes biológicas, los animales (sean o no racionales, esto va aparte), aprendemos una forma visual investigándola, buscando su esencia abstracta y luego intentando que lo visto encaje en ella (lo que Husserl llamaba intuición eidética); no aprendemos una aproximación estadística de lo que un entrenador nos marcó en el cerebro como reflejo que es “la misma cosa”, asociándonos a lo bruto millones de imágenes para lograr guardar una suma de relaciones promedio de valores enlazados con un valor de salida único. O sea, las redes biológicas en un cerebro real, ante la imposibilidad metafísica de abstraer directamente (por fuera de los sentidos) la esencia y forma de un ente dado en la realidad, nos inspiramos en esa cosa y su relación con la idea tras la misma (abducción), véase: hacemos teoría desde la coherencia lógica que la distinga, y contrastamos con qué concepto encaja mejor de los que elaboramos (deducción). Aprendemos una función dentro de un sistema de significados, de acciones y símbolos. Lake, Salakhutdinov y Tenenbaum contrastan las IA generativas con cómo las personas pueden generalizar desde uno o muy pocos ejemplos y usar conceptos para la propia acción, la imaginación o la explicación de la realidad. Zador demuestra que los animales no aprenden desde una tabula rasa estadística: traen sesgos inductivos fuertes incorporados en la arquitectura del sistema nervioso. Si bien el genoma no codifica cada aprendizaje concreto, sí establece estructuras y predisposiciones que hacen posible aprender realmente, y hacerlo por ende mucho más rápido. Así, el niño no “supera” a la red generativa porque tenga más datos.

El modelo de Simon parte de la regla de Hebb: “las neuronas que se activan juntas, se conectan entre sí”. Cuando el ojo percibe de manera reiterada la forma bilineal de un “1”, un grupo específico de neuronas sensoriales se activa simultáneamente. Al disparar impulsos eléctricos al mismo tiempo, las sinapsis se fortalecen gradualmente. Con el tiempo y la repetición del estímulo, este grupo de neuronas se autoorganiza en un ensamble o circuito cerrado. La red aprende a captar el “1” porque la activación de solo una parte de esa línea física es capaz de propagar la energía al resto del circuito cerrado, completando y reconociendo el patrón de forma automática, como un inferencia guardada. La red reactiva su aprendizaje sólo cuando la forma que se empieza a percibir nuevamente difiere de lo esperado. Para evitar que la activación se disperse sin control por todo el cerebro (provocando un caos de señales), las redes biológicas que simula Simon emplean neuronas inhibitorias. Cuando el circuito del “1” se activa con fuerza, este apaga activamente las neuronas vecinas encargadas de otras formas (como un “7” o una “L”). Esto crea un contraste que fija la percepción de la identidad única del número. A un nivel cognitivo superior, este patrón bioeléctrico de bajo nivel se mapea directamente a un nodo dentro de un grafo de conocimiento. La red biológica aprende luego (o precisamente por ello) que ese patrón visual específico es un número, y se conecta con sus respectivos significados conceptuales mediante relaciones jerárquicas directas, en lugar de ajustar millones de pesos abstractos y aleatorios para intentar disparar sólo una única neurona de salida.

De vuelta: este ejemplo del “1” de Simon me llama la atención, porque es algo demasiado evidente para que no sea algo más hablado en el ámbito. La forma de aprender a captar formas muestra una diferencia clave que le separa de la clasificación. Una cosa es reconocer una imagen como perteneciente a una clase, pero otra muy distinta es poseer un concepto visual (me refiero al gráfico en sí, no a la cantidad a la que remite) que se genera para poder aprehender un símbolo. Esto va más allá de la clasificación, o mejor dicho, es la causa de la creación de esa clasificación humana en primer lugar. Y ya yendo al concepto remitido en la palabra: si una red dice “esto es un 1” después de millones de ejemplos, puede haber aprendido una forma sofisticada de frontera de decisión, pero no entiende qué es un “1” en la trama de usos donde el signo vive. El niño, en cambio, aprende el “1” como un signo en sí mismo, a partir de la forma, y lo asocia a un gesto, luego a la cantidad, a un lugar en una serie, como idea o herramienta. El aprendizaje humano de un símbolo y del concepto asociado a él, va a una esencia estructural captada, que, sobra decir, es lo que dio origen en primer lugar a su creación, cosa que la mera red de perceptrones no puede hacer. Incluso pasando por debajo de la consciencia, toda abstracción de una red neural biológica (humana o no), es una tarea de análisis ontológico para llegar a hipótesis, y no el amoldado a toda una red a un muestreo por sugestión externa.

Fuentes sobre las redes neurales biológicas en contraste con las artificiales:

Textos y papers

Brenden Lake, Ruslan Salakhutdinov & Joshua Tenenbaum, “Human-level concept learning through probabilistic program induction”
https://www.science.org/doi/10.1126/science.aab3050
Andrew Zador, “A critique of pure learning and what artificial neural networks can learn from animal brains”
https://www.nature.com/articles/s41467-019-11786-6
György Buzsáki, “Emergence of Cognition from Action”
https://pmc.ncbi.nlm.nih.gov/articles/PMC4895837/
György Buzsáki, “The Brain from Inside Out”
https://global.oup.com/academic/product/the-brain-from-inside-out-9780190905385
Charles Simon, “Machine Learning Is Not Like Your Brain Part One: Neurons Are Slow, Slow, Slow”
https://www.kdnuggets.com/2022/04/machine-learning-like-brain-part-one-neurons-slow-slow-slow.html
Charles Simon, “Machine Learning Is Not Like Your Brain Part Two: Perceptrons and Neurons”
https://www.kdnuggets.com/2022/05/machine-learning-like-brain-part-two-perceptrons-neurons.html

Videos

Charles Simon, “Machine Learning vs Human Learning: They’re Not the Same”
https://www.youtube.com/watch?v=3YXM5Nhf5f0
Charles Simon, “How Your Brain REALLY Works: What AI Still Doesn’t…”
https://www.youtube.com/watch?v=5Crck_r2vuo
Charles Simon, “AI Can Predict—But Can It Understand? A New Architecture …”
https://www.youtube.com/watch?v=WTAMJr6mMCY

Inductivismo escalado: sucedáneo de una inferencia realista

La cuestión del aprendizaje lleva a una distinción que conviene hacer con cuidado entre inducción, deducción y abducción. La IA actual aprende por inducción estadística: a partir de ejemplos, ajusta parámetros para capturar regularidades, y como sólo puede hacer esto, el criterio para encontrar regularidades es exógeno. No es para nada una inducción ingenua ni pobre: puede descubrir estructuras latentes, composiciones parciales, analogías, regularidades sintácticas, relaciones semánticas, patrones del mundo sedimentados en texto e imágenes, y sólo en este sentido “crear”. Pero, usando términos de Popper, no es el mundo 2 popperiano, sino el mundo 3 que ha tomado “vida”. En términos de la termodinámica, no crea verdadera información nueva, por más “temperatura” que se le permita al modelo. No hay abducción ni deducción que genere sintéticamente novedad. Sigue siendo, en su base, meramente una novedad analítica: aprendizaje por regularidades observadas. La deducción fuerte es otra cosa: consiste en derivar conclusiones nuevas que se siguen necesariamente de premisas por reglas que preservan validez, pero que no están explicitadas en aquellas. Si las premisas son verdaderas y la inferencia es válida, la conclusión no puede ser falsa. La abducción fuerte, por su parte, es mucho más que inventar una explicación plausible al activar el “recuerdo” estadísticamente grabado de patrones similares, precisamente porque en la inferencia estadística no hay verdadera evocación sino un reflejo: la red no busca dentro de sí, sino que refleja en forma conductual sin tener separadas la causa de la búsqueda y el resultado. No hay verdaderas hipótesis, que impliquen derivar consecuencias esperables, diseñar pruebas discriminantes y actualizar el modelo cuando la evidencia vuelve. Y, por último, quizás lo más importante, es que no hay inducción fuerte sin una abducción fuerte que logre un criterio previo para abstraer para así poder inducir, así como tampoco la hay sin una deducción fuerte que logre relacionar lo inducido con el conocimiento previo.

Cuando un LRM “razona”, puede estar haciendo algo real en el plano funcional: una búsqueda interna, una revisión, una generación de pasos, luego auto-corrección y exploración de cadenas. Pero si no hay un mecanismo que obligue la validez de esos pasos no se puede hablar de deducción en sentido fuerte sino débil: mera producción de razonamientos probables. Y probables sólo para nosotros, no para sí mismo, ya que no tiene nada contra lo cual contrastar. Puede acertar mucho y, sin embargo, estar estructuralmente autorizado a dar un salto inválido. Puede también generar una explicación plausible sin estar haciendo abducción en sentido fuerte, porque la explicación no queda puesta en riesgo por pruebas diseñadas para refutarla. No sería un tanteo sino una reacción. Y podría “imaginar” escenarios sin que esa imaginación esté anclada en un modelo causal sometido a intervención. No agrega entropía de una heterogeneidad estructurada (desarrollable) a la cultura, sino que, no sólo preserva la entropía existente, sino que la desestructura y la homogeniza. Mejor dicho: nunca la reproduce estructurada. Toda imagen, video, sonido, melodía o texto generado por estas IA, nace sin estructura: sólo preserva inductivamente la apariencia de tal, por los rieles establecidos por inducciones previas, tendiendo siempre a que cada alucinación se propague luego. Toda producción cultural de las IA generativas es literal y más propiamente, una alucinación. Llamamos equívocamente “alucinación” a los contenidos generados que rompen con la coherencia lógica, pero sólo porque nosotros la vemos en forma flagrante, desarrollándose sin control. Precisamente, la reducción de las alucinaciones no es algo a festejar en su efecto colectivo: tendemos a no ver que toda producción de IA generativa es incoherente y “alucinatoria”. Sólo mantiene la apariencia de tal mientras la inducción estocástica de ésta mantenga los criterios de coherencia de los entrenadores, y sin esta saberlo. Y, además, siendo incapaz de diferenciarlo salvo por otras muchas inducciones que le sirvan de contraste para llegar a la conclusión del error (que es a su vez otra inducción para imitar las deducciones de testeo de errores de los entrenadores). Y decir “para” también lleva a confusión: estas redes no tienen realmente objetivos.

En menos palabras: toda imagen o texto creado por IA es una alucinación, en el particular sentido que hoy le damos al término. De hecho, una alucinación humana o animal (de una red neural biológica), si bien en tensión con la red, y además siendo una inversión del proceso de aprehensión de imágenes y sonidos, tiene una coherencia ligada con el proceso abductivo de la imaginación. La abstracción conceptual es una abducción orgánica y con coherencia estructural, y, en ese sentido, nuestras mentes también alucinan continuamente, pero las imágenes llegan directamente a la consciencia guiadas por la interrelación estructural de las abstracciones auditivas y visuales. Esa interrelación estructural no está en las redes de las IA generativas. No hay ningún anclaje en su arte, porque no hay ni arte ni artesanía: el artista no es tal sino un artefacto, y sus creaciones son la huella impresa de lo artificial, del mero artefacto. Es un artefacto generando artefactos, sin ninguna guía real. La entropía biológica de nuestras redes neurales, posibilita al creador generar mayor entropía, con mayor heterogeneidad, o sea: estructurada (jerarquizada, porque sino la complejidad se volvería insoportable, pero no demasiado, porque sino se volvería vacía) en cada obra cultural. La entropía física aumenta la información pero en forma caótica, lo cual aumenta la homogeneidad (en promedio en todo el universo, se entiende) pero al menos también aumenta la cantidad de información. Las IA no aumentan la entropía, pero en cada paso aumentan la homogeneidad en forma desestructurada desde el principio, terminando en contenidos que terminan en un callejón sin salida. Exactamente lo que pasa en el colapso del modelo.

Pearl distingue entre ver, hacer e imaginar, lo cual, otra vez, es una forma analógica del proceso interno de inducir, deducir y abducir. Ver sería observar correlaciones; hacer sería intervenir, e imaginar sería razonar contrafácticamente. El aprendizaje estadístico puede ser extraordinario en el nivel del ver, pero resulta que la ciencia y la comprensión exigen hacer e imaginar. Si una IA no tiene un operador interno equivalente a la intervención, si no puede representar qué pasaría al forzar una variable, si no puede distinguir correlación de causalidad, entonces su abducción queda degradada a una narración simulada. Puede decirnos “la causa probable es X”, pero no entiende: no piensa en qué condiciones X dejaría de ser causa, qué prueba lo separa de Y o qué mundo alternativo se seguiría de otra intervención. El problema de la “inducción” no es que inducir sea algo malo per se, ya que la inducción es condición necesaria del aprendizaje, pero precisamente es necesaria para el aprendizaje en tanto la inducción, para llevar a aprender algo, obliga a llegar a una deducción a contrastar, así como inspira a la creación de teorías mediante el mismo criterio abductivo que lleva a concebir una causalidad a partir de una correlación.

Una inteligencia fuerte sintética debería poder integrar la inducción, la deducción y la abducción (de hecho, no son separables) en un sistema donde cada forma de inferencia tenga su legalidad propia. La inducción es la vía para descubrir regularidades, mientras que la deducción preserva la validez relacional, y la abducción busca explicaciones verosímiles y las somete a riesgo (partiendo de nociones sustantivas de lo verdadero, que luego bajan como deducciones sobre más inducción). En la IA actual, estas dimensiones aparecen mezcladas en una competencia textual general, todas sostenidas sobre una inducción operando por fuerza bruta y asistida desde el exterior para que no se descarrile en su entropía ciega. Entropía que en el fondo no es entropía, ya que no hay nueva información en términos cualitativos: el único elemento neguentrópico son los entrenadores, y sólo mantienen un simulacro de neguentropía en tanto no hay relación entre los elementos estabilizados. Las alucinaciones no son accidentes subjetivos de una tendencia a la objetividad. Hinton y su amigo Dawkins se equivocan, pues, de cabo a rabo: existe un teatro de la mente (así como el dolor de una lastimadura existe sólo en la mente y la lastimadura en sí sólo fuera de ella, siendo que ésta no pasa en tanto tal a través del sistema nervioso), pero en las IA es un teatro sin guión teatral y ciego al público, donde los actores son como autómatas que se colocan con recuerdos ajenos, para luego improvisar continuamente, en un groove trucho, por asociación mecánica con esos recuerdos.

La fenomenología de las IA generativas es siempre la misma: no hay ninguna arquitectura donde la validez lógica, la intervención causal y la búsqueda de explicación sean parte del proceso mismo. Éstas entran de vez en cuando por el techo del pre-entrenamiento, como filtros externos o estilos de respuesta, manteniéndose siempre adelante y como base condicionante de un entrenamiento que nunca le supera como parámetro guía (los descarrilamientos son sólo productos emergentes, con suficiente tiempo, de los carriles previos, lo cual muestra además que no emergen equilibrios metaestables, y por esto no hay nada peor para entrenar una IA que lo generado por sí misma o por otra IA), muy a diferencia del aprendizaje real que, contra lo que nos dice la nefasta educación positivista desde hace un par de siglos a esta parte, es siempre primero creación teorética del sujeto, inspirada por el mundo y guiada por la distinción de lo verdadero –y aquí remito a los textos sobre epistemología y pedagogía de Zanotti padre e hijo, haciendo la salvedad de que no adhiero a la posibilidad en ciencias sociales de modelos apriorísticos (ni por agregación, ni sistémicos), salvo y exclusivamente en las ciencias formales (que precisamente son formales por ser un desarrollo autoconsciente de la racionalidad misma).

Fuentes sobre los modelos generativos en base a fuerza bruta inductiva:

Textos y papers

Judea Pearl & Dana Mackenzie, “The Book of Why – Chapter 1: The Ladder of Causation”
https://bayes.cs.ucla.edu/WHY/why-ch1.pdf
Judea Pearl, “Causality: Models, Reasoning, and Inference”
http://bayes.cs.ucla.edu/BOOK-2K/
Artur d’Avila Garcez et al., “Neural-Symbolic Learning and Reasoning”
https://arxiv.org/abs/1711.03902
Robin Manhaeve et al., “DeepProbLog: Neural Probabilistic Logic Programming”
https://arxiv.org/abs/1805.10872

Videos

Judea Pearl, “The New Science of Cause and Effect”
https://www.youtube.com/watch?v=ZaPV1OSEpHw

Una real convergencia entre computación y redes: la opción neurosimbólica

La investigación de Newell y Herbert Simon vuelve a este punto con una increíble actualidad, resolviendo el cómo se inserta la lógica en la “materialidad” en el modelo originario y genuino (biológico) de una red neural. La Physical Symbol System Hypothesis sostenía que un sistema físico de símbolos posee los medios necesarios y suficientes para la acción inteligente general. Uno puede no aceptar la tesis en su literalidad fuerte y, de hecho, gran parte de la historia posterior de la inteligencia artificial y de las ciencias cognitivas fue una revisión de esta hipótesis, pero... el problema que Newell y Simon plantearon no cambió en nada: la inteligencia real parece necesitar manipulación de una estructura de conceptos en base a reglas, puesto que sin algún tipo de estructura real, discreta, la red puede producir regularidades pero no necesariamente legalidad.

Ahora bien, esto no implica volver sin más a la IA simbólica clásica: el problema no se resuelve reemplazando una red por el clásico sistema experto, rígido, que confunde inteligencia con manipulación explícita de símbolos escritos, al estilo del lenguaje de programación Prolog. Este modelo representa el problema opuesto al neural perceptrón, en la imitación del pensamiento humano: un edificio procedimental lógico que convierte el lenguaje en hechos y reglas como variables y condicionales, sin percepción global simultánea y de conjunto. La cuestión es la integración de ambos mundos de IA: cómo hacer que la validez, la operación lógica de unidades de sentido, sea endógena a un sistema neural. O sea: neural-simbólico. En otras palabras, nadie quiere seguir con los actuales modelos neurales para hacer IA generativas, donde los perceptrones son como perros de Pavlov puestos en columnas esperando disciplinariamente una penalidad; que conforman un orden espontáneo del que emerge una respuesta, que luego el sistema se la pasa a un verificador externo como quien manda un texto a corregir. Lo que se busca es precisamente lo contrario: una arquitectura en la que ciertas transiciones inferenciales inválidas sean directamente imposibles, inestables o penalizadas por la dinámica interna. Que sean “molestas” para la red, por lo mismo que a nuestras mentes nos provoca rechazo ver un triángulo de Penrose. Una deducción fuerte endógena implica una propiedad del espacio de estados dentro de la red, y no es una decoración formal agregada al final.

SATNet, DeepProbLog, semantic loss y otras líneas neuro-simbólicas son intentos parciales de acercarse a eso. SATNet integra un solver para buscar grados de satisfacción dentro del loop de deep learning. DeepProbLog combina programación lógica probabilística con predicados neuronales. La semantic loss introduce una función de pérdida que conecta salidas neuronales con restricciones lógicas. Estas soluciones todavía no son, ni de lejos, la forma final de una inteligencia sintética orgánica, pero al menos siguen siendo híbridos con piezas formales explícitas que muestran el vacío que las actuales IA no pueden llenar, demostrando que la estructura no tiene que venir de un auditor externo, sino que es parte misma del cómputo.

Por una dirección ya más matemática aparecen, y enumero a grosso modo: Birkhoff, los retículos, luego Wille y Ganter con el análisis formal de conceptos, y Kuznetsov en líneas afines. Nos recuerdan que el conocimiento va más allá de una nube de vectores en campos multidimensionales continuos y sin relación interna, en tanto implican un orden, una interrelación mutua, y una interrelación objeto-atributo. La lógica de retículos y los cierres de Galois si bien no son una receta para reemplazar transformers, logra advertir que hay formas de estructura conceptual que no se reducen a proximidades en un embedding. Si una IA fuerte debe abstraer, clasificar y deducir, necesitará de un sistema de legalidad conceptual. El mapa multidimensional de los conceptos que iluminan el trayecto hasta las neuronas de salida de los tokens finales, no se basa meramente en trayectos afianzados, que discurren a través de las capas, sino que incluyen nexos internos dentro de cada capa que conectan un vector con otro. Nada de esto existe en el modelo actual de inteligencia artificial, y para que exista se requiere replantear todo el modelo.

Fuentes sobre redes neuro-simbólicas:

Textos y papers

Allen Newell & Herbert A. Simon, “Computer Science as Empirical Inquiry: Symbols and Search”
https://courses.media.mit.edu/2004spring/mas966/Newell%20Simon%20Physical%20symbol%20systems.pdf
Po-Wei Wang et al., “SATNet: Bridging Deep Learning and Logical Reasoning Using a Differentiable Satisfiability Solver”
https://arxiv.org/abs/1905.12149
Jingyi Xu et al., “A Semantic Loss Function for Deep Learning with Symbolic Knowledge”
https://arxiv.org/abs/1711.11157
Bernhard Ganter & Rudolf Wille, “Formal Concept Analysis: Mathematical Foundations”
https://link.springer.com/book/10.1007/978-3-642-59830-2
Sergei Kuznetsov, “Mathematical Aspects of Concept Analysis”
https://link.springer.com/chapter/10.1007/3-540-45499-2_29

Videos

“Learning with Logical Constraints”
https://www.youtube.com/watch?v=10gERXLjzYU
IBM Technology, “What Is NeuroSymbolic AI? Bridging Reasoning & Neural Networks”
https://www.youtube.com/watch?v=ZfWDVO3rzeA

Alternativas dentro del modelo actual: cambiar backprop por modelos predictivos

La retropropagación merece una discusión aparte. Ahora bien, aclaro: el backpropagation no es “el mal”, no es una estupidez. Hay que aclararlo por si acaso. Es cierto que es una de las herramientas más poderosas de la historia del aprendizaje automático basado en un modelo neural. El problema es que se volvió el centro de un régimen conceptual. Es una concepción casi tiránica que identifica aprendizaje con un ajuste masivo de parámetros por gradiente en modelos entrenados offline. Desde el punto de vista biológico, el backprop es un callejón sin salida: se requiere una forma de asignación de crédito global, simetrías o transportes de información que no están en ningún modelo posible de cerebro biológico. Implican, además, una separación entre fase de entrenamiento e inferencia que no se parece en nada a la forma continua y local en que aprenden los organismos.

¿Cuáles son las alternativas? Aun dentro de nuestras IAs de modelos estocásticos (véase: con transferencia de información numérica, con variables continuas de estimulación en vez de saltos discretos en cada neurona, y con información digital discreta en vez de impulsos continuos en su comunicación, además sin deducción fuerte ni lógica interna al proceso), se puede al menos lograr algo al respecto, con distintas opciones, entre otras: el predictive coding como aproximación local al backprop; el más que interesante equilibrium propagation como aprendizaje en modelos de energía; el feedback alignment como uso de señales de error no simétricas o incluso aleatorias, e incluso el Forward-Forward de Hinton como reemplazo del pase backward por dos pases forward, reglas de tres factores en redes spiking, neuromodulación, STDP, reservoirs y liquid state machines. Entiendo muy por arriba la idea, pero al menos me deja tranquilo que haya consciencia del problema incluso en los defensores de los modelos actuales de perceptrón.

Obviamente estas líneas no son equivalentes ni todas igualmente prometedoras, pero comparten una intuición, y es que el aprendizaje puede organizarse de modo más local, temporal, dinámico, e incorporado en la propia actividad del sistema. Las PCNs, o predictive coding networks, son interesantes porque convierten la predicción y el error de predicción en la moneda de la red (¡al fin!). Equilibrium propagation sugiere que inferencia y aprendizaje pueden surgir de una misma dinámica. Feedback alignment muestra que no hace falta copiar de manera exacta los pesos de retroalimentación para asignar crédito útil. Forward-Forward intenta evitar el backward clásico. Las reglas de tres factores recuerdan que, en biología, la plasticidad, en vez de depender de dos neuronas que se activan juntas, se basa en señales moduladoras globales, como recompensa, sorpresa o novedad.

Cada una de estas técnicas permite una modalidad de inteligencia distinta, pero al menos es algo. Si bien no es una red natural, es al menos una red más natural, y si bien “calcula”, no es que use spikes por estética, ni que la memoria esté congelada como un conjunto de pesos actualizados en enormes sesiones de entrenamiento. Al tener una memoria distribuida con plasticidad local, el error no será una señal abstracta que llega desde una pérdida global, y tendrá que implicar un aprendizaje que vaya más de ser un evento de fábrica a ser una propiedad permanente del estar-en-el-mundo del sistema, si queremos decirlo en términos casi heideggerianos. No importa, al menos en esto, que la red sea sintética, que esté hecha de silicio, memristores o cualquier otro sustrato, como quieren algunos fetichistas del carbono, sino que lo que importa es que sea más orgánica, o sea, que su organización una el cómputo con la memoria, y la acción con la modificación. Recuérdese que lo orgánico no significa biológico: puede ser sintético, pero el punto es que esté integrado, que no sea un mero artefacto que ni siquiera imite a un organismo.

Aclaración: estas propuestas de sistemas neurales no llegan a los modelos biológicos, ni mucho menos; no solucionan varios de los problemas mencionados en los otros apartados de este mismo posteo, pero al menos son soluciones de simulación de características de los resultados de las redes neurales biológicas, siempre dentro del modelo de perceptrones.

Fuentes sobre la retropropagación y sus alternativas:

Textos y papers

Alex Millidge et al., “Predictive Coding Approximates Backprop along Arbitrary Computation Graphs”
https://arxiv.org/abs/2006.04182
Benjamin Scellier & Yoshua Bengio, “Equilibrium Propagation: Bridging the Gap between Energy-Based Models and Backpropagation”
https://arxiv.org/abs/1602.05179
Timothy Lillicrap et al., “Random feedback weights support learning in deep neural networks”
https://arxiv.org/abs/1411.0247
Geoffrey Hinton, “The Forward-Forward Algorithm: Some Preliminary Investigations”
https://arxiv.org/abs/2212.13345
Nicolas Frémaux & Wulfram Gerstner, “Neuromodulated Spike-Timing-Dependent Plasticity, and Theory of Three-Factor Learning Rules”
https://www.frontiersin.org/articles/10.3389/fncir.2015.00085/full
Wolfgang Maass et al., “Real-Time Computing Without Stable States: A New Framework for Neural Computation Based on Perturbations”
https://igi-web.tugraz.at/PDF/130.pdf

Videos

Artem Kirsanov, “The Brain’s Learning Algorithm Isn’t Backpropagation”
https://www.youtube.com/watch?v=l-OLgbdZ3kk
Charles Simon, “Reaction to Predictive Coding: Biologically Plausible? Not So Fast!”
https://www.youtube.com/watch?v=YLy2QclpNKg
Serge Massar, “Machine Learning through Equilibrium Propagation: Extending the framework to quantum, thermal, and time dependent systems”
https://scivideos.org/pirsa/25120038

Modelos de mundo: la pieza faltante

Ahora bien, una red puede volverse más temporal, local, eficiente, todo lo que se quiera, y aun así no tener “mundo”. Es decisivo que haya un eje en la agencia, y no que la agencia sea una mera simulación por imitación en ráfagas de procesos recursivos. Mucha gente confunde predicción con lo que hace un LLM al “predecir” tokens, pero en realidad no hay verdadera predicción aquí, como bien plantea Friston, ni siquiera en este sentido restringido. No hay en realidad salidas erróneas de la capa de salida, sino salidas más o menos parecidas en coherencia a lo escrito en los tokens ya existentes leídos por la capa de entrada. Es precisamente esa coherencia lo que queda en la forma del modelo: una fotocopia de la naturaleza del, Popper dixit, “mundo 3 humano”, y recién ahí una apariencia de reflexión del “mundo 2”. Vale la pena conocer estas categorías, que no deberían confundirse con la idea de mundo en general, que es como venimos usándolo, y que sin embargo sirve mucho para entenderlo en su relación con la cuestión de la inteligencia. Veamos: el mundo 3 popperiano es algo así como la “Idea” en Hegel (aunque sin necesariamente un desarrollo ontogenético internamente determinado en forma sistémica), o sea: es el plano o “capa social” de la estructura de la realidad donde se pueden entender los productos del intelecto humano: teorías, mitos, arte, instituciones sociales y lenguaje, que son ese conocimiento objetivo e independiente del hombre, que en lo corpóreo se plasma en soportes como libros, computadoras, partituras, o transmisión oral; el mundo 2 popperiano es el plano o “capa sensible” de la estructura de la realidad donde se puede entender el universo de las experiencias, la conciencia, la psicología y los procesos mentales de los individuos relacionados, y finalmente el mundo 1 popperiano es el plano o “capa física” de la estructura de la realidad donde se pueden entender el universo “material”, los objetos, la energía y los seres vivos, etc. Puestos en conjunto estos tres “mundos”, se nos aparece más clara la idea de mundo, en sentido amplio, vital, que es de lo que aquí hablamos. Y predecir tokens no es predecir el mundo.

En active inference y predictive processing, el modelo generativo anticipa consecuencias sensoriales de acciones, minimiza errores de predicción y regula su acoplamiento con el entorno. Pezzulo, Friston y otros distinguen así entre la IA generativa pasiva y los organismos que adquieren y usan modelos generativos en interacción propositiva con el mundo. Sutton lo formula admirablemente: un world model debería permitir predecir qué va a pasar, no qué diría una persona. Si hace esto último sin lo primero, en realidad sólo estará “recordando”, sin siquiera saberlo, el patrón de comportamiento de personas pasadas, en base a sus producciones. La diferencia es abismal.

Otra referencia inevitable, LeCun, propone algo cercano, aunque quizás desde un enfoque bastante más ingenieril, planteando world models (modelos basados en el mundo), sistemas de motivación intrínseca, JEPA, predicción en espacios latentes, etc. La idea de JEPA sería predecir representaciones y no quedarse en la generación superficial de píxeles o tokens, que sólo servirían teniendo que reconstruir cada detalle sensorial, que no es la idea. En vez de eso lo que se intenta es la captación de las variables latentes que estructuran el mundo. Está también Hasani con las liquid neural networks agregando otro ingrediente en esta salsa: modelos con dinámica continua capaces de adaptarse a entornos cambiantes. Luego están HOPE y Nested Learning, desde el lado de Google que, ni lento ni perezoso, apunta al aprendizaje continuo, a la memoria en base a la auto-modificación. Todas estas líneas son distintas; algunas siguen dentro del deep learning convencional, pero empujan contra la misma muralla del mainstream basado en el modelo estático, pasivo, entrenado de una vez y sin experiencia propia.

En resumen para esta cuestión: la verdadera IA predictiva fuerte tendría que tener agencia real en vez de agencia simulada. Agencia real significa que el sistema actúa, que sus acciones modifican el mundo, que el mismo mundo le devuelve error (que recién ahí aparece el direccionamiento de la observación, como en las redes neurales biológicas, humanas o no), que ese error actualice el modelo, y que el sistema aprenderá de las consecuencias, lo cual exige distinción del error y por ende una idea misma de verdad como adecuación a la realidad (sería gracioso, si no fuera triste, que los creadores de la IA neural hayan tenido que pensar en esto dándose un palazo ellos mismos contra ésta). Vale insistir: esto no exige necesariamente un robot humanoide que tenga corporeidad clásica, ya que puede haber agencia en entornos digitales, científicos, económicos o simulados; lo que sí exige es un lazo causal. Que el output del sistema no sea un texto que se pierde en una pantalla sino una intervención a la que se siga el rastro y le vuelva como evidencia. Sin eso la IA podrá parecer un científico escribiendo hipótesis, pero no será un científico, porque hará imitaciones de hipótesis, las que no podrá contrastar porque no tiene laboratorio propio, y no podrá abstraer porque no será capaz de discernir su objeto de estudio, ya que se lo habrán provisto.

Fuentes sobre los modelos del mundo:

Textos y papers

Giovanni Pezzulo et al., “Active inference and the scope and limits of passive AI”
https://www.cell.com/trends/cognitive-sciences/fulltext/S1364-6613(23)00260-7
Karl Friston, “The free-energy principle: a unified brain theory?”
https://www.nature.com/articles/nrn2787
Richard Sutton, “Father of RL thinks LLMs are a dead end”
https://www.dwarkesh.com/p/richard-sutton
Yann LeCun, “A Path Towards Autonomous Machine Intelligence”
https://openreview.net/pdf?id=BZ5a1r-kVsf
Mahmoud Assran et al., “Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture”
https://arxiv.org/abs/2301.08243
Ramin Hasani et al., “Liquid Time-constant Networks”
https://arxiv.org/abs/2006.04439
Ali Behrouz et al., “Nested Learning: The Illusion of Deep Learning Architectures”
https://arxiv.org/abs/2512.24695

Videos

Richard Sutton, “Can humans make AI any better?”
https://www.youtube.com/watch?v=2hcsmtkSzIw
Richard Sutton, “Rich Sutton discusses The Bitter Lesson and how human and …”
https://www.youtube.com/watch?v=OMjAuwWyP44
Richard Sutton, “Father of RL thinks LLMs are a dead end”
https://www.youtube.com/watch?v=21EYKqUsPfg
Yann LeCun, “A Path Towards Autonomous Machine Intelligence”
https://www.youtube.com/watch?v=OKkEdTchsiE
Yann LeCun, “The LLM Revolution Is Over. The Physical AI Revolution Is …”
https://www.youtube.com/watch?v=MWMe7yjPYpE
“Davos 2024 Yann LeCun and Karl Friston at Casper Labs Live”
https://www.youtube.com/watch?v=vb4iu4KOCAM

Un modelo de lenguaje no es un modelo de pensamiento

En este nivel de análisis de las IA, llegamos a la cuestión del lenguaje. Esto, por su parte, exige un excurso, porque acá se juega una parte importante de la confusión contemporánea. Hinton ha dicho que las redes neuronales son mucho mejores procesando lenguaje que cualquier cosa producida por la escuela chomskyana, y en AI4 afirmó que entendemos el lenguaje de un modo muy similar al de los grandes modelos de lenguaje. En la entrevista del Nobel repitió que la escuela lingüística de Chomsky se equivoca al negar que estos sistemas entiendan. Esto puede leerse como una especie de giro wittgensteiniano implícito: el significado no estaría en una gramática innata y abstracta, sino en patrones de uso, en el aprendizaje de regularidades de contexto y en la participación efectiva en juegos del lenguaje. Y es tentador, porque Wittgenstein efectivamente desplaza el significado hacia el uso, las prácticas, los juegos de lenguaje y las formas de vida. Pero ahí está justamente el error: si uno invoca a Wittgenstein contra Chomsky para defender a los LLMs, no puede quedarse sólo con “uso” como una regularidad estadística. En Wittgenstein, un juego de lenguaje no es un corpus de secuencias, sino una práctica que se teje con acciones y normas, a través de criterios y formas de vida. Decir “el significado es uso” no equivale a decir “el significado es distribución”. El uso wittgensteiniano implica estar dentro de una actividad donde las palabras hacen cosas: ordenar, pedir, prometer, contar, medir, preguntar, obedecer, equivocarse, corregir. Por eso una lectura wittgensteiniana seria debería volverse contra Hinton: si los LLMs carecen de una real forma de vida, con un cuerpo, que tiene consecuencias prácticas propias y una responsabilidad en el juego de lenguaje, entonces no basta con que reproduzcan muy lindos a los patrones de uso lingüístico. En cualquier caso, la crítica a Chomsky es una caricaturización vulgar: Chomsky no sostuvo que “el lenguaje no se aprende”, como si un bebé naciera sabiendo español o japonés. También las matemáticas se aprenden, y hay diferentes formas de codificarlo en lenguajes y hasta posee en ramas en conflicto, pero eso no significa que no haya una universalidad lógico-estructural de la cognición lingüística que sea la que lo valide y la que, de hecho, en una sucesión histórica, sea esta gramática universal la que haya generado sus formas concretas a través de los diferentes juegos del lenguaje: las diferentes matemáticas, las diferentes geometrías, etc. así como el árbol gigantesco de los lenguajes naturales de la humanidad.

Hinton convierte así una tesis compleja sobre la pobreza del estímulo, en una caricatura fácilmente celebrable por un público ya predispuesto a festejarle todo. El argumento chomskiano apunta, precisamente, a la explicación misma del desarrollo del lenguaje, y a la evidencia lingüística disponible de que el niño subdetermina ciertas competencias gramaticales, por lo cual la mente es la que guía el proceso aportando una estructura lógica universal previa, sin importar sus variantes y las posibles relaciones lógicas distintas (aunque no contradictorias) que aparecen en unos lenguajes y en otros no. Y no se refuta a Chomsky mostrando que una red gigantesca, entrenada con cantidades sobrehumanas de texto, produce lenguaje fluido. Un niño aprende lengua sin el corpus de internet, sin backprop, sin millones de actualizaciones sobre tokens, y lo hace con cuerpo y con una comunidad humana de corrección práctica. Esta comunidad no le enseña a manejar su cuerpo mediante entrenamiento sobre una tabula rasa, ni a entender las palabras mediante electroshocks y chocolates, como premios y castigos de un pre-entrenamiento conductista para guiar a la red neural del infante hasta la replicación de regularidades adecuadas, prácticas a posteriori, con las cuales entender el resto del lenguaje por entrenamiento. Y, sin embargo, el chico aprehende el mundo y aprende a entender las primeras palabras, contextualmente, lo cual sobra decir no puede ser producto de un condicionamiento previo que provenga del lenguaje, porque éste requiere palabras. Y, si es ajeno al lenguaje, entonces resulta paródica la reducción del aprendizaje de la lengua, a la lectura de Wittgenstein que hace Hinton.

Fuentes sobre lenguaje y aprendizaje:

Textos y papers

Geoffrey Hinton, “Nobel Prize Interview”
https://www.nobelprize.org/prizes/physics/2024/hinton/interview/
RD World, “Hinton explains at AI4 how language models mirror human understanding”
https://www.rdworldonline.com/hinton-ai4-conference-language-model-insights-rd-impact/
Noam Chomsky, Ian Roberts & Jeffrey Watumull, “The False Promise of ChatGPT”
https://www.nytimes.com/2023/03/08/opinion/noam-chomsky-chatgpt-ai.html
Noam Chomsky, Ian Roberts & Jeffrey Watumull, “La falsa promesa de ChatGPT”
https://fundacionfilosofica.com/wp-content/uploads/2023/04/Chomsky-La-falsa-promesa-de-ChatGPT.pdf
Howard Lasnik, “The Argument from the Poverty of the Stimulus”
https://shotam.github.io/LING611_papers/Lasnik_2016.pdf
Laurence & Margolis, “The Poverty of the Stimulus Argument”
https://philarchive.org/archive/LAUTPO
Stanford Encyclopedia of Philosophy, “Ludwig Wittgenstein”
https://plato.stanford.edu/entries/wittgenstein/
Yosef Grodzinsky, “How Deeply Human Is Language?”
https://mitpress.mit.edu/9780262052009/how-deeply-human-is-language/

Videos

Emily M. Bender, “On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?”
https://www.youtube.com/watch?v=2Hro71IlAGw
Melanie Mitchell, “The Debate Over ‘Understanding’ in AI’s Large Language Models”
https://www.youtube.com/watch?v=bV0Y2LhdNFk

IA Slop y autofagia: contaminación realimentada de la ecología cultural humana

Ahora nos adentramos ya en el nivel de la noción de creatividad artificial que tocamos someramente arriba. Si por creatividad entendemos producir combinaciones nuevas, entonces obvio que sí: los modelos generan novedad. Si por creatividad entendemos producir hipótesis, formas, reglas o mundos que abren posibilidades no contenidas en el régimen estadístico existente, la cuestión es otra. El famoso model collapse muestra empíricamente que un sistema que se alimenta demasiado de su propio output pierde colas de la distribución: Shumailov y coautores muestran que los modelos entrenados recursivamente con datos generados por modelos tienden a olvidar la distribución original; Alemohammad y Baraniuk hablan directamente de autophagy disorder en modelos generativos; Bohacek y Farid estudian generadores de imágenes que se autoenvenenan; Martínez y otros analizan bucles entre IA generativa e internet. Gerstgrasser y Schaeffer muestran que mezclar y acumular datos reales y sintéticos puede evitar o reducir ciertos colapsos, sí, pero la lección general es la misma: la supuesta generación de la IA generativa es eco con emergencia de patrones. Sin datos frescos del mundo (humano o natural), donde se preserven las rarezas y se establezcan criterios de procedencia, la creatividad se reduce a un descubrimiento sofisticado de promedios estadísticos. Acá entrarían Bender, Gebru y Crawford: “Stochastic Parrots” apunta a una ecología de escala donde al devorarse corpus sin documentación adecuada, la IA oscurece las procedencias y el receptor confunde el tamaño con la comprensión. La autofagia informacional y la extracción material son dos caras de la misma expansión: el sistema absorbe patrones del mundo, lo convierte en datos, lo procesa, lo devuelve como outputs, y luego empieza a procesar sus propios residuos. La IA puede parecer inmaterial en la pantalla, pero su metabolismo es material y semiótico a la vez. Las novedades científicas creadas por IA son novedades sólo para el área científica contemplada, no para los criterios cognitivos humanos. Es sólo una cuestión de aplicaciones no descubiertas de criterios análogos utilizados en otras áreas, captados y reutilizados inconscientemente por la red artificial. No es el descubrimiento abductivo de criterios ulteriores del desarrollo científico. Nada de esto implica ser “hater” de la IA. De hecho, el planteo de los loros estocásticos viene no sólo de los autores mencionados en este bloque, sino que está presente en casi todos los demás mencionados en este posteo.

Hay una segunda dimensión de la autofagia que conviene distinguir del colapso técnico del modelo. El colapso técnico aparece cuando un sistema generativo se entrena sobre contenidos generados por sistemas anteriores y pierde progresivamente información sobre la distribución real de la cual dependía. En imágenes, esto ya fue estudiado bajo el nombre de Model Autophagy Disorder: si no entra suficiente dato real fresco en cada ciclo, el modelo tiende a pagar el proceso con pérdida de calidad o de diversidad. En el lenguaje, la generación de imágenes y otros dominios, el mismo mecanismo general aparece como pérdida de colas de la distribución estadística: desaparecen los casos raros, las variantes poco frecuentes, los estilos menores, las combinaciones improbables y todo aquello que no queda protegido por la masa central de la distribución. No se trata de errores, en realidad sólo perceptible por nosotros (las IA sólo lo pueden detectar sin seguridad infiriendo contradicciones respecto a comparar el resultado de otras inducciones), sino de algo que está siempre presente, haya o no alucinaciones, y es un empobrecimiento de la variabilidad disponible. En rigor, y como dije antes, todo el material generado es una alucinación, y desde dentro de la IA no hay solución de continuidad entre lo verdadero y lo falso, lo posible y lo imposible. Directamente esa distinción no existe, que es, precisamente, de lo que todo este problema se trata.

Este fenómeno técnico tiene una proyección cultural bastante difícil de medir, pero no por eso menos relevante. Cuando la circulación pública de textos, imagénes, audio y video se llena de productos sintéticos, cambian simultáneamente los futuros datasets y la experiencia cotidiana de los usuarios humanos. Los modelos aprenden de esos residuos, y los usuarios también. Cada exposición repetida a materiales generados estadísticamente modifica los criterios con los que después se juzgará la escritura, la imagen, la voz, y los estilos de los mismos. Todo esto lleva a la degradación del entorno cognitivo-cultural: falsos recuerdos, contaminación epistémica, estética promedio, dificultad para distinguir evidencia de simulacro y, lo peor, retroalimentación entre outputs generados y expectativas humanas. Muchas personas describen estas imágenes como prototípicas, extrañas o difíciles de ubicar dentro de una experiencia estética ordinaria. Generan una relación perceptiva alterada, que va más allá del problema de si “son lindas” o “son feas”, aunque, de hecho, son feas, porque hay una diferencia ontológica entre algo que lleva el rastro de su origen natural, incluso en aquello que es artificial pero fue creado por humanos (como el CGI). En las imágenes segregadas por las redes neurales artificiales, podemos notar ese no-se-qué desagradable, una imitación incoherente de coherencia, y antinatural de lo natural, que se potencia más cuando las redes se entrenan con una mixtura de tareas genéricas y estilos infinitos. Es una forma de producción sin mundo propio, y sin siquiera partir de mundo ninguno. La imagen no sale de una cámara situada, ni de un cuerpo en un lugar, ni de una escena que se recuerda y que se asimilara en un lugar, donde la realidad tiene patrones propios que se reflejan en el recuerdo. Sale de una distribución aprendida sobre imágenes anteriores, y genera una recreación que devuelve una ficción acomodada por una red para no ser castigada. Puede producir una escena cinematográfica, un retrato, una fantasía o una ilustración infantil con gran eficacia, porque aprendió a devolver versiones altamente reconocibles de esas clases visuales, pero sólo gracias al destilado en bruto de aquellas cosas que le dijeron que coincidían lo suficiente con las ideas concretas a las que refería. La consecuencia es una clase de imagen con composición, color, foco y acabado, pero sin relación real con cualquier proceso material singular. Su eficacia nace de una abstracción estadística de estilos previos, y no de una confrontación sensible estilística con el objeto visual que inspirara la imagen.

Los modelos texto-imagen pueden aumentar el volumen de productividad para los creativos, y para mucha gente el atractivo superficial de los productos rápidos y sencillos de alcanzar, pero al costo de una caída de novedad promedio y de convergencia hacia motivos dominantes. El caso de los bucles autónomos lenguaje-imagen es especialmente ilustrativo: al iterar generación con descripción, los sistemas convergen hacia motivos visuales agradables, reconocibles, comercialmente seguros y pobres en sorpresa. Ni siquiera es una sobrerrepresentación, que ya sucede, sino de un intento de la imagen de representar, forzadamente, una referencia a lo agradable y lo reconocible en la cosa mostrada, en una suerte de abyección convertida en falsedad estética. No es de extrañar que las imágenes generadas por IA, cuando se les pide algo sin siquiera un filtro estético por parte del que escribe el prompt, tengan ese estilo grasa circense, plástico comercial y groseramente falso, cada vez más cercano a la chatarra cultural de los bingos, los casinos o la publicidad política de Trump. La expresión “visual elevator music” cierra mucho, porque no describe una imagen necesariamente mal hecha, sino una imagen digerida, conscientemente mediocre, sin estilo ni trasfondo cultural, sin referencias humanas salvo a la estimulación más vulgar, y desprovista de tensión o simbolismo. Una cultura visual saturada, más abundante y más estrecha.

El texto sufre un proceso análogo. Los modelos generativos elevan el piso formal de muchos usuarios: les ordenan frases, les corrigen errores, les proponen transiciones y les hacen sonar más profesional una idea que sería igualmente estúpida y pobremente formulada. Este beneficio individual puede producir, repetido por todos, un costo colectivo para ese mismo individuo, cuando millones de textos empiezan a pasar por la nueva normalización. La escritura asistida borra giros regionales, sintaxis personales, brusquedades, cambios de ritmo, zonas de vacilación, errores que reflejan una armonía propia, un caos natural, y en su lugar nos aparece una prosa competente, amable, conectiva y bien organizada, con menor o ninguna densidad ni procedencia. Mejora el texto de un usuario aislado convirtiéndolo en un promedio aceptable (ni siquiera un promedio mejor), pero es artificial: reduce la diversidad estilística efectiva del entorno escrito, y el promedio creado tampoco tiene una identidad propia. No es ni siquiera algo en el medio de todos, que se acerque al promedio. Está construido para que no quede ningún reflejo de aquello que causó el promedio, más o menos como conscientemente la humanidad viene haciendo con la cultura, especialmente en lo audiovisual, que vació el mundo y lo convirtió en variaciones de un videoclip de K-Pop, especialmente desde 2013. Necesito hacer un excurso al respecto de este problema paralelo, porque explica en gran medida que haya proliferado tan rápido el AI Slop. Hoy hemos llegado a una suerte de final de camino para la cultura en todas sus manifiestaciones: tenemos un patchwork sintético y sin alma de todas las estéticas de la historia, que sólo puede resolverse en un ambiente minimalista, donde los elementos no pidan un contexto mutuo, lo cual implica, en lo arquitectónico, convertir todo lugar, incluso hogares, en imitaciones de Starbucks, bares pseudo-irlandeses y restaurantes que parecen oficinas empresariales: referencias sin contexto para lugares de tránsito, que evocan y falsifican la calidez combinándola con una sequedad industrial, vintage, amigable y con imitación de esnobismo. A este aburguesamiento terminal, elitista sin contenido, ideal para clase media aspiracional y para las masas top de country, la IA le contrapone el regreso visual de la estética de Las Vegas, ideal para nuevos ricos que ascendieron la pirámide social por vías más lúmpenes. La degradación cultural que el capitalismo genera en las clases populares, es reflejada directamente por la IA, en vez de disfrazada con la estética de ese emprendedorismo post-millenial, mezcla de minimalismo moderno mainstream y brutalismo soft sin gusto. O sea: las masas no quieren la tilinguería shopping de Taylor Swift sino la enajenación estética de Bad Bunny. Y los modelos nos siguen la corriente: la inconsecuencia cognitiva se transforma en repetición, como forma estandarizada de esquivar las detecciones humanas de incongruencia. El lector se acostumbra a textos que presentan la información con una forma homogénea de claridad, y el escritor delega cada vez más la organización retórica de lo que piensa. La ganancia en eficiencia viene acompañada de una transferencia de criterio: el usuario deja de decidir aspectos de la forma y acepta como “natural” el ordenamiento que el modelo le devuelve. La homogeneización avanza como una comodidad repetida al trabajarla, cada vez más incómoda al consumirse.

Hace más de un siglo, una fotografía, una grabación de voz o una filmación funcionaron como indicios relativamente fuertes de que algo había ocurrido, allí. No eran pruebas absolutas y sin embargo sostenían una parte importante de la economía pública de la evidencia. La generación sintética debilita esa función documental, ya que una voz puede ser clonada, una escena puede ser fabricada y un gesto puede ser simulado con suficiente verosimilitud como para exigir verificación constante. El costo social de verificar cada pieza crece más rápido que la capacidad institucional de hacerlo, y una sociedad en esa situación debe dejar de creer en documentos verdaderos, o bien elegir con la misma facilidad terminar creyendo en documentos falsos. O las dos cosas.

Los estudios sobre falsos recuerdos y desinformación visual muestran una zona donde el daño cognitivo ya no es sólo especulativo. Imágenes y videos editados o generados por IA pueden aumentar falsos recuerdos y aumentar la confianza subjetiva en esos recuerdos. Y el cansancio cognitivo lleva a una aceptación light de la información: “todo lo que veo debe de ser real, pero no tanto”, y de ahí al “da igual que sea real”. La expresión “AI slop” apunta a esta contaminación del ambiente comunicativo. Hay una acumulación masiva de contenido sintético de baja o mediana calidad ocupando el espacio comunicacional e infectando los canales de circulación. Incluso cuando la calidad superficial mejore, el problema persiste, porque una parte creciente del entorno textual, visual y sonoro empieza a provenir de modelos entrenados sobre materiales similares y ajustados con criterios parecidos de aceptabilidad. La variedad temática puede permanecer, pero la variedad formal y perceptiva se reduce. El usuario recibe muchas fuentes distintas atravesadas por la misma lógica de producción regurgitada.

El caso del material educativo generado por IA muestra otro costado del mismo problema. Cuando videos, textos o imágenes se producen con bajo cuidado por su valor instructivo, el material tiene una apariencia didáctica aceptable pero presenta incoherencias, simplificaciones, errores de forma y finalmente violaciones de principios básicos de enseñanza multimedia. El estudiante además de poder recibir una explicación falsa indiferenciable, se acostumbra a un flujo de baja densidad semántica: material que parece educativo, ordenado, suficiente, pero no inspira al sostenimiento de la memoria, no exige criterio, tiene una reducción que no compele al pensamiento abstracto ni promueve el contraste entre diferentes estilos retóricos y la insinuación tras sus detalles (que sólo pueden ser elaborados conociendo el efecto psicológico de las palabras), y entonces no pueden despertar el juicio crítico, ni la secuenciación conceptual ni la comprensión. La mente del receptor se declara en huelga y ya no tiene contra qué resistirse. En ese sentido, el slop educativo es más grave que el entretenimiento pobre, porque ocupa el lugar de un proceso formativo, que parece estar afinando el ojo crítico cuando en realidad lo está adormeciendo.

Fuentes sobre autofagia, colapso del modelo, contaminación sintética, daño cognitivo parcial y homogeneización cultural:

Textos y papers

Ilia Shumailov et al., “AI models collapse when trained on recursively generated data”
https://www.nature.com/articles/s41586-024-07566-y
Sina Alemohammad et al., “Self-Consuming Generative Models Go MAD”
https://arxiv.org/abs/2307.01850
Matyáš Boháček & Hany Farid, “Nepotistically Trained Generative-AI Models Collapse”
https://arxiv.org/abs/2311.12202
Gerardo Martínez et al., “Towards Understanding the Interplay of Generative Artificial Intelligence and the Internet”
https://arxiv.org/abs/2306.06130
Matthias Gerstgrasser et al., “Is Model Collapse Inevitable? Breaking the Curse of Recursion by Accumulating Real and Synthetic Data”
https://arxiv.org/abs/2404.01413
Rylan Schaeffer et al., “Model Collapse Demystified”
https://arxiv.org/abs/2503.03150
Pat Pataranutaporn et al., “Synthetic Human Memories: AI-Edited Images and Videos Can Implant False Memories and Distort Recollection”
https://arxiv.org/abs/2409.08895
Pat Pataranutaporn et al., “Synthetic Human Memories: AI-Edited Images and Videos Can Implant False Memories and Distort Recollection”
https://dl.acm.org/doi/full/10.1145/3706598.3713697
Shiyu Guo, “People are more susceptible to misinformation with realistic AI-synthesized images that provide strong evidence to headlines”
https://misinforeview.hks.harvard.edu/article/people-are-more-susceptible-to-misinformation-with-realistic-ai-synthesized-images-that-provide-strong-evidence-to-headlines/
Jules van Hees et al., “Human perception of art in the age of artificial intelligence”
https://www.frontiersin.org/journals/psychology/articles/10.3389/fpsyg.2024.1497469/full
Amon Rapp et al., “How do people experience the images created by generative artificial intelligence?”
https://www.sciencedirect.com/science/article/pii/S1071581924001587
Ionela Bara, Richard Ramsey & Emily S. Cross, “AI contextual information shapes moral and aesthetic judgments of AI-generated visual art”
https://www.sciencedirect.com/science/article/pii/S0010027725000034
Ionela Bara et al., “Algorithmic aesthetics: Cognitive perspectives on AI-generated visual art”
https://www.cell.com/iscience/fulltext/S2589-0042(25)02087-5
Eunice Zhou & Dokyun Lee, “Generative artificial intelligence, human creativity, and art”
https://academic.oup.com/pnasnexus/article/3/3/pgae052/7618478
Doshi & Hauser, “Generative AI enhances individual creativity but reduces the collective diversity of novel content”
https://pmc.ncbi.nlm.nih.gov/articles/PMC11244532/
Anderson, Shah & Kreminski, “Homogenization Effects of Large Language Models on Human Creative Ideation”
https://arxiv.org/abs/2402.01536
Alice Hintze et al., “Autonomous language-image generation loops converge to visual elevator music”
https://www.sciencedirect.com/science/article/pii/S2666389925002995
Emily Bender, Timnit Gebru et al., “On the Dangers of Stochastic Parrots”
https://s10251.pcdn.co/pdf/2021-bender-parrots.pdf
Kate Crawford & Vladan Joler, “Anatomy of an AI System”
https://anatomyof.ai/
Knight First Amendment Institute, “AI Slop I: Pollution in Our Communication Environment”
https://knightcolumbia.org/content/ai-slop-i-pollution-in-our-communication-environment
Eric M. Jones et al., “AI-Generated ‘Slop’ in Online Biomedical Science Educational Videos”
https://mededu.jmir.org/2025/1/e80084
Brennan Center, “Deepfakes, Elections, and Shrinking the Liar’s Dividend”
https://www.brennancenter.org/our-work/research-reports/deepfakes-elections-and-shrinking-liars-dividend
Microsoft Research, “The Impact of Generative AI on Critical Thinking”
https://www.microsoft.com/en-us/research/publication/the-impact-of-generative-ai-on-critical-thinking-self-reported-reductions-in-cognitive-effort-and-confidence-effects-from-a-survey-of-knowledge-workers/
Michael Gerlich, “AI Tools in Society: Impacts on Cognitive Offloading and the Future of Critical Thinking”
https://www.mdpi.com/2075-4698/15/1/6
Acemoglu, Kong & Ozdaglar, “AI, Human Cognition and Knowledge Collapse”
https://economics.mit.edu/sites/default/files/2026-02/AI%2C%20Human%20Cognition%20and%20Knowledge%20Collapse%2002-20-26.pdf

Videos

Computerphile, “Has Generative AI Already Peaked?”
https://www.youtube.com/watch?v=dDUC-LqVrPU
James Carson, “AI Trained on the Internet. Now It's Destroying It.”
https://www.youtube.com/watch?v=ZAn8PX99kw0
Sreedath Panat, “AI models collapse when trained on recursively generated data | Nature | Research paper review”
https://www.youtube.com/watch?v=uHUSSgW4mdI
George Montañez, “Model Collapse Ends AI Hype”
https://www.youtube.com/watch?v=ShusuVq32hc
“What is Generative AI Model Collapse? How Can We Stop It?”
https://www.youtube.com/watch?v=knVIecsI-OM
Hany Farid, “How to spot fake AI photos”
https://www.ted.com/talks/hany_farid_how_to_spot_fake_ai_photos
Last Week Tonight with John Oliver (HBO), “AI Slop”
https://www.youtube.com/watch?v=TWpg1RmzAbc

El envenenamiento como revelación y rebelión: el test contra el parasitismo de las falsas Gestalt

El envenenamiento de datos se sigue de las causas que posibilitan el colapso recursivo. En el colapso, el deterioro aparece porque el modelo se entrena sobre contenido sintético generado por modelos anteriores y pierde progresivamente información sobre la distribución original. En el envenenamiento, la contaminación es intencional: alguien introduce o modifica muestras para alterar el comportamiento futuro del sistema. El ataque no manipula una respuesta ya generada mediante un prompt injection, sino que altera directamente el material con el que el sistema aprende.

Los modelos texto-imagen permiten ver el mecanismo con claridad perturbadora. Herramientas como Glaze y Nightshade modifican imágenes de manera calculada para interferir con el aprendizaje del modelo. Por ejemplo, Glaze busca dificultar que un sistema copie el estilo de un artista. Nightshade en cambio ataca de forma más agresiva las asociaciones que el modelo aprende entre una imagen y una etiqueta o prompt. La imagen envenenada puede seguir siendo reconocible para una persona y, al mismo tiempo, producir efectos distintos dentro del espacio de representación de la IA. Esa divergencia entre percepción humana y representación artificial concentra el problema. Precisamente, el envenenamiento funciona porque el modelo procesa la imagen de un modo distinto al humano, y en general al de cualquier animal. Un humano reconoce un perro, una silla o un estilo pictórico a partir de experiencias relativamente estables: objetos vistos en contextos distintos, usos, movimientos, interacciones, palabras, memorias, escalas, funciones y expectativas prácticas. Una perturbación casi invisible en la imagen rara vez altera ese sistema conceptual, y lo que resulta un condimento imperceptible para nosotros, es arsénico para la IA. El modelo, en cambio, aprende relaciones estadísticas entre patrones visuales, descripciones textuales, embeddings y distribuciones de entrenamiento. Una perturbación diseñada sobre esas relaciones puede desviar el aprendizaje aunque la imagen siga pareciéndonos normal. Ergo, esto demuestra que un modelo puede generar imágenes convincentes porque aprendió regularidades visuales complejas, pero esas regularidades no equivalen a una comprensión visual anclada en una intuición eidética. La categoría “perro”, para una persona, está unida, no a un equilibrio estocástico, sino a un concepto real, constructivo. Para un modelo texto-imagen, queda estabilizada por relaciones en un espacio estadístico de alta dimensión.

El envenenamiento muestra una diferencia de fondo entre mente humana e IA generativa. La percepción humana y, en general, de cualquier mente animal, depende de conceptos formados en interacción con acciones y objetos, en una reconstrucción a base de relaciones congruentes de lógica espaciotemporal que el cerebro intenta que la mente llegue a reflejar. La representación generativa depende de asociaciones con categorías vacías y aprendidas a partir de datos vía inducción de impresiones. El modelo es muy eficaz y, precisamente porque lo es en la forma menos ideal, es manipulable de maneras que no coinciden con nuestros errores perceptivos habituales. Aun en el error, como en el caso de las ilusiones ópticas de tipo cognitivo, la imaginación y la sensibilidad de los cerebros biológicos, busca la reconstrucción inconsciente de algo que pueda existir realmente, con un sentido interno y externo a la cosa. No se engaña a una IA igual que a un animal o una persona, porque ésta no organiza lo percibido reflejando la naturaleza de lo real.

También hay una cuestión política y jurídica. Cuando artistas usan herramientas de protección como Glaze o Nightshade, responden a un régimen de extracción parasitaria que convirtió obras disponibles públicamente en material de entrenamiento sin consentimiento claro, y el envenenamiento es un medio de resistencia que introduce fricción donde antes había absorción automática por parte de las empresas de IA. Si el modelo depende de datos abundantes, limpios y semánticamente estables para una red neural artificial, los productores de esos datos intentan volverlos escasos, sucios y semánticamente inestables. La IA generativa necesita apropiarse de regularidades culturales, pero no puede garantizar que esas regularidades sigan estando disponibles en forma confiable. Como usuarios de LLMs y LRMs, tal vez salgamos perdiendo, pero como creadores de cultura, y finalmente como consumidores de la misma, salimos ganando del envenenamiento del material que parasitan los modelos.

Fuentes sobre envenenamiento de datos, Glaze, Nightshade y ataques contra modelos texto-imagen:

Textos y papers

IBM, “What Is Data Poisoning?”
https://www.ibm.com/think/topics/data-poisoning
Shan et al., “Glaze: Protecting Artists from Style Mimicry by Text-to-Image Models”
https://arxiv.org/abs/2302.04222
Shan et al., “Glaze: Protecting Artists from Style Mimicry by Text-to-Image Models”, USENIX Security
https://www.usenix.org/system/files/usenixsecurity23-shan.pdf
Shan et al., “Nightshade: Prompt-Specific Poisoning Attacks on Text-to-Image Generative Models”
https://arxiv.org/abs/2310.13828
Ding et al., “Understanding Implosion in Text-to-Image Generative Models”
https://arxiv.org/abs/2409.12314

Videos

“The New Tool That Breaks Text-to-Image AI (Nightshade …)”
https://www.youtube.com/watch?v=fXhJkAGck8U
Ben Zhao, “Nightshade: Data Poisoning to Fight Generative AI”
https://www.youtube.com/watch?v=dAox1MUzP0A

“Tecnofeudalismo” potenciado: la “sociedad de la IA” y su metabolismo fallido

Como se podrá notar a esta altura, todos los problemas precedentes no son independientes, y el que le sigue no lo es menos. Si fuera solamente un problema de eficiencia energética, de arquitectura computacional o de verdad epistémica, ya sería bastante. Pero no lo es. Una tecnología que entra en la producción, en la administración, en la guerra, en la educación, en la vigilancia, en los mercados culturales y en el ámbito de la decisión pública, no puede juzgarse únicamente por su elegancia técnica ni por su productividad marginal. Una IA “estadísticamente competente” pero epistémicamente débil reorganizará a la sociedad en forma deletérea. No servirá de obstáculo que compense el daño que genere, y a los muchos perjudicados agregará un dilema del prisionero suicida para élites gobernantes y clases dominantes, sin que ni siquiera sus propietarios y administradores, de empresas privadas o públicas en pugna, puedan hacer nada para detenerlo salvo buscar maximizar sus probabilidades de supervivencia.

El primer problema es el laboral. El FMI calculó que en las economías avanzadas alrededor del 60% de los empleos podrían verse impactados por la IA, y que aproximadamente la mitad de esos empleos expuestos podrían beneficiarse por integración de IA, mientras que la otra mitad podría sufrir reducción de demanda laboral, menores salarios o desaparición de tareas. Esto no significa necesariamente “desempleo total inmediato”, que sería una caricatura, pero sí una reorganización del poder de negociación. Si la IA aumenta una productividad que se encuentra en manos de quienes ya controlan el capital, o sea, los datos y la infraestructura, y reduce el valor relativo de ciertas competencias humanas, la consecuencia no sería simplemente desempleo. Ya de por sí no es garantía que el aumento de productividad genere nueva demanda de empleo humano, si la tasa de demanda de nuevo trabajo artificial supera la demanda de trabajo humano. Pero, como si no bastara, para la mano de obra que permanezca ocupada, significará una disminución de la productividad marginal del trabajo humano asalariado (también del restante, pero en tanto a ese resto el ingreso le provenga de sus propiedades sobre capitales en base a IA, y éstos sigan teniendo demanda, que su trabajo pueda ser reemplazado les será indiferente). En consecuencia tendremos degradación de las tareas, presión salarial a la baja, precarización e intensificación laboral, vigilancia algorítmica y pérdida de autonomía profesional. La ILO, además, advierte que la exposición no se distribuye de manera uniforme: tareas administrativas, clericales y de oficina aparecen especialmente expuestas, y las mujeres pueden quedar más afectadas por su concentración en ocupaciones automatizables y su subrepresentación en áreas tecnológicas. La desigualdad no surge sólo porque unos pierdan el empleo y otros no; si algunos trabajadores son complementados por la IA y otros son convertidos en residuo funcional de sistemas automatizados, ambas partes perderán porque su mercado habrá ampliado el ejército de reserva de los desocupados, incluso aunque fueran asistidos con migajas de una renta básica universal en vez de una participación en las ganancias del capital. O, mejor dicho, quizás precisamente por ello, ya que matar de hambre a grandes porciones de población significaría una separación radical entre empleados y desempleados, de forma que la población con potencial de ser laboralmente activa se reduciría, paradójicamente, sin un subsidio, lo cual detendría el descenso interminable del salario, aunque sólo para unos pocos ocupados temerosos de caer a un pozo sin retorno. En cualquier caso, una competencia desregulada que forzara a pagar a un trabajador empleado con la productividad marginal del último de los desempleados de potencial reemplazo, significaría que el precio de equilibrio del menor salario caería por debajo de la línea de capacidad de subsistencia y reproducción social del trabajador en tanto tal, lo cual generaría, o bien una crisis cíclica constante en el mercado de trabajo por rotación irregular de mano de obra incapaz de completar eficazmente la jornada laboral, o bien una tragedia de los comunes de sobreexplotación que tomaría la forma de realimentación positiva entre tasa de desempleados en aumento y reducción de la productividad marginal del trabajador activo, a un nivel insuficiente para su sustento.

Acá conviene evitar dos simplificaciones simétricas. La primera es la fantasía tecnófila de que todo aumento de productividad se derrama naturalmente hacia salarios, tiempo libre o bienestar social. La segunda es el catastrofismo automático de imaginar que toda IA destruye trabajo en bloque. Lo más probable es una combinación desigual: sectores donde la IA aumente capacidades humanas, sectores donde las sustituya, sectores donde fragmente oficios complejos en microtareas supervisadas, y sectores donde el trabajador quedará convertido en operador o responsable legal de decisiones que en la práctica ya fueron preformateadas por sistemas opacos. Profesionales que antes deliberaban pasarán probablemente a validar outputs de modelos generativos. Docentes que antes formaban pasarían a solo detectar trampas. Periodistas que antes investigaban, a editar síntesis. Empleados administrativos que antes conocían procesos, a alimentar sistemas que luego los vuelvan prescindibles. Esto es deskilling, pero no en el viejo sentido industrial, sino en una pérdida de dominio cognitivo sobre el propio trabajo. Un general intellect en potencia, pero sólo para pocos. O bien para un disimulado y parasitario capital muerto encarnado en los modelos de lenguaje.

Ese proceso aumentaría la desigualdad social incluso si la productividad agregada sube. La OCDE viene señalando que los beneficios de la IA tienden a favorecer más a ocupaciones de altos ingresos, alta calificación y uso intensivo de computadoras, mientras que los trabajadores menos calificados o con menor capacidad de apropiación tecnológica pocas veces participan de la misma mejora salarial. En otras palabras: que puede reforzar una división entre quienes usan la IA como multiplicador del capital humano autónomo o ajeno, y quienes son medidos, monitoreados, reemplazados o disciplinados por ella. En una sociedad ya fragmentada, aumentará la existente desigualdad cognitiva, y en una forma nueva: no sólo desigualdad de capital cultural e intelectual, sino desigualdad en la capacidad de comprender y gobernar los sistemas que organizan la vida cotidiana, lo cual reducirá a prácticamente cero la posibilidad de crear medios de producción propios en economías paralelas sumergidas, y ya ni digamos para competir contra los mercados principales.

De acá pasamos al problema político. Una tecnología que ayuda a concentrar toda la infraestructura, manejo de datos, los modelos y capacidad de automatización en los pocos actores económicos que se mantengan en pie, tiende a concentrar también la influencia en el poder de decisión. Esto no ocurre únicamente en el sector privado por mayor posibilidad de sindicación y negociación de los empleadores con IA frente a los asalariados que utilizan IA, sino también para que estos actores económicos más reducidos y coordinados, operen mucho más fácilmente como factor de poder sin contrapesos frente al poder político, así como de los gobernantes de los diferentes poderes del Estado —en unión con sus partidos convertidos ya hoy en empresas políticas— por sobre el resto de sus burocracias subalternas. Para los Estados la IA sirve perfectamente para clasificar poblaciones, para predecir conductas, distribuir mejor beneficios, detectar riesgos rápidamente, vigilar fronteras, procesar inteligencia, producir propaganda, automatizar burocracias y hacer inaccesible las cuentas de responsabilidad. La frontera entre eficiencia administrativa y autoritarismo técnico terminaría de disolverse. Los sistemas automatizados permiten tomar decisiones a escala, con apariencia de neutralidad —o, mejor dicho, neutralidad para la eficiencia de un sistema hecho para pocos—, desplazando la deliberación hacia modelos que la ciudadanía no entiende, no controla y a menudo ni siquiera puede auditar. La anarquía y el autoritarismo no son opuestos absolutos en este punto: pueden alternarse o incluso combinarse. Por un lado, proliferarán herramientas de desinformación, estafas, deepfakes, ataques automatizados y erosión de la confianza pública, y, por el otro, se justificará más vigilancia y más control en nombre de contener ese caos. La IA ya está produciendo el incendio, y es obvio que producirá el extintor.

El International AI Safety Report describe este dilema con una expresión sombría: “evidence dilemma”. Los sistemas avanzan rápido, pero la evidencia sobre riesgos llega tarde, es difícil de evaluar y muchas veces aparece recién cuando el sistema ya fue desplegado. Si los gobiernos actúan demasiado temprano, pueden fijar regulaciones inútiles o capturadas, pero si esperan evidencia concluyente, pueden dejar a la sociedad expuesta a daños permanentes. Este dilema es político incluso para los grupos de poder: la velocidad privada de despliegue no coincide con la velocidad pública de comprensión. Y cuando una sociedad no entiende a tiempo una tecnología que la reorganiza (desempleo, desinformación, inseguridad y guerra), la institucionalización política de los conflictos queda en desventaja temporal. Deliberar requiere tiempo y la carrera armamentística de las big tech premia velocidad.

La dimensión geopolítica agrava todo lo anterior. Los Estados la leen como ventaja estratégica. La industria militar, la ciberseguridad, servicios de inteligencia, armamento autónomo, propaganda enemiga, automatización de la defensa nuclear, vigilancia satelital, etc., impiden poner un pie en el freno, y el dilema se extiende por ende a la esfera pública. Cada actor podrá presentar su aceleración como defensiva, pero todos saben que estarán compelidos a agredir si a corto plazo ganan más por hacerlo. SIPRI advierte que incluso aplicaciones militares no nucleares de IA pueden comprimir los tiempos de decisión y aumentar los riesgos de cálculos erróneos en crisis nucleares. Trabajos sobre LLMs en wargames muestran patrones de escalada difíciles de predecir y, en casos raros, incluso decisiones que llegan al uso de armas nucleares en simulación. El genocidio consciente a lo Skynet no es la peor amenaza, aunque este pueda ser parte de una fase de desarrollo. Bastaría ya con la automatización parcial de recomendaciones, los sesgos de confianza compulsivos en máquinas y las doctrinas militares que premien anticiparse al adversario, para extender fácilmente la destrucción del enemigo desde su población civil hasta a sus silos nucleares. Así como el poder civil se reduce frente al poder político-militar y sus diferentes complejos industriales, la aceleración en la cadena de decisión también hace disminuir el control humano, tanto de los altos mandos como los subordinados, sobre las operaciones manejadas con IA. En una crisis, si un sistema recomienda responder antes de que el adversario lo haga, y si el adversario usa sistemas parecidos, la estabilidad dependerá de modelos y sensores cuyas señales puedan ser erróneas o incompletas, o manipuladas. La IA tiende a erosionar todos los “firebreaks” humanos que enfrían la escalada: pausas por protocolo, demoras administrativas, ambigüedades a dilucidar, prudencias humanitarias y resistencias psicológicas.

La inestabilidad política también puede venir por degradación del espacio público. Si los costos de producir texto, imágenes, audio y video convincentes tienden a cero, la confianza social se vuelve más cara de comprar, ya que la abundancia de contenido sintético, además de generar desinformación, genera cansancio cognitivo. No es mejor que la imposición de una mentira, el hacer que todos sospechen de todo. La adhesión fanática y el escepticismo apático llevan a caminos parecidos, y en cualquier caso mutuamente funcionales. La combinación de cinismo anárquico, donde nadie cree nada, y el autoritarismo epistémico, donde se pide a una autoridad fuerte que certifique qué es real, ha sido la fórmula perfecta para la imposición de controles inconstitucionales. El antecedente más cercano y conocido simultáneamente por todos los países del mundo, ha sido el de la última cuarentena global con confinamiento. Vale la pena repasarlo con un breve excurso. Recordemos cómo la información se manipuló para agigantar la emergencia sanitaria, la cual a su vez se priorizó por sobre todas las libertades civiles (las garantías para la integridad biológica personal frente a contraindicaciones y otros problemas médicos, el aislamiento preventivo por sobre la subsistencia económica y la salud psicológica), así como implicó medidas típicas de los autoritarismos y totalitarismos (instigación a la delación, inducción de la reacción mecánica ante el medio, y acusación de irresponsabilidad social al disidente). Mediante un discurso homogéneo de todos los medios de comunicación, se llegó a la conversión por colectivización de toda cuestión de salud personal en un problema de salud pública (de ahí a la imposición de un pasaporte interno, que luego sería usado como coacción para que se violara masivamente el Código de Nuremberg y la Declaración de Helsinki sobre experimentación humana, salvo fácticamente para minorías económicas y políticas que no dependían para subsistir de un pase sanitario o que no temían ninguna amenaza de cierre o despido). Si esta experiencia de disciplinamiento social, que logró doblegar y confinar a la mayor parte de la población civil, y cuya abyección humillante ha quedado como un trauma del que aun ahora es difícil hablar, ha sido posible sin inteligencia artificial, no cuesta imaginar lo que esos mismos poderes públicos y privados podrán hacer con una. La IA generativa, al degradar la frontera entre documento y ficción, contribuye a la privatización, tanto empresarial como partidaria, de la política y de la verdad pública, lo que lleva inmediatamente a su fragmentación inestable en facciones inorgánicas, y a la vez a su concentración en menor cantidad de agentes, a la vez que facilita y agiliza la gobernabilidad por encima de los mecanismos de contralor constitucional, así como por sobre la participación y deliberación democrática (los pocos que existen y tienen relevancia todavía), o sea, frente a libertades negativas y positivas por igual (Berlin dixit).

Como si faltara algo, queda la relación entre la economía de plataformas y el problema de la concentración económica y política. La desigualdad entre empleadores y empleados, gobernantes y gobernados, ya no será sólo distributiva de recursos materiales o de coacción, sino estratégica. Quien controla los modelos de razonamiento, la fabricación de chips, las bases de datos y los canales de distribución, acapara también las mayores capacidades de predicción y persuasión (cuya utilidad es sólo positiva si supera a la competencia en un juego de suma cero), así como vigilancia y coacción individualizadas y colectivas, con lo cual la soberanía tecnológica se vuelve condición de la independencia material y, por lo mismo, tanto países como empresas como los mismos trabajadores sin acceso a infraestructura de IA, quedarán inevitablemente reducidos a consumidores, etiquetadores, fuentes gratuitas de datos o directamente devenidos en mercados cautivos. Esta es la forma normal en que opera el principio de Pareto: las tecnologías de propósito general reordenan las jerarquías contra las mayorías cuando requieren condiciones de concentración para la propiedad privada y el poder político.

Fuentes sobre las implicancias sociológicas, económicas, políticas y culturales de la IA generativa:

Textos y papers

IMF, “AI Will Transform the Global Economy. Let’s Make Sure It Benefits Humanity”
https://www.imf.org/en/blogs/articles/2024/01/14/ai-will-transform-the-global-economy-lets-make-sure-it-benefits-humanity
IMF, “Gen-AI: Artificial Intelligence and the Future of Work”
https://www.imf.org/-/media/files/publications/sdn/2024/english/sdnea2024001.pdf
ILO, “Generative AI and Jobs: A Refined Global Index of Occupational Exposure”
https://www.ilo.org/publications/generative-ai-and-jobs-refined-global-index-occupational-exposure
ILO, “New ILO data confirm women face higher workplace risks from generative AI than men”
https://www.ilo.org/resource/news/new-ilo-data-confirm-women-face-higher-workplace-risks-generative-ai-men
OECD, “What impact has AI had on wage inequality?”
https://www.oecd.org/en/publications/what-impact-has-ai-had-on-wage-inequality_7fb21f59-en.html
OECD, “AI and work”
https://www.oecd.org/en/topics/sub-issues/ai-and-work.html
Daron Acemoglu, “The AI Revolution: The Possibility of a Pro-Human Direction”
https://www.hsgac.senate.gov/wp-content/uploads/Testimony-Acemoglu-2023-11-08.pdf
International AI Safety Report 2026
https://internationalaisafetyreport.org/publication/international-ai-safety-report-2026
International AI Safety Report 2025
https://internationalaisafetyreport.org/publication/international-ai-safety-report-2025
SIPRI, “Impact of Military Artificial Intelligence on Nuclear Escalation Risk”
https://www.sipri.org/publications/2025/sipri-insights-peace-and-security/impact-military-artificial-intelligence-nuclear-escalation-risk
SIPRI PDF, “Impact of Military Artificial Intelligence on Nuclear Escalation Risk”
https://www.sipri.org/sites/default/files/2025-06/2025_6_ai_and_nuclear_risk.pdf
Juan-Pablo Rivera et al., “Escalation Risks from Language Models in Military and Diplomatic Decision-Making”
https://arxiv.org/abs/2401.03408
RAND, “Strategic competition in the age of AI”
https://www.rand.org/randeurope/research/projects/2024/strategic-competition-ai-cm.html
Michael C. Horowitz et al., “Artificial Intelligence and the Future of Strategic Stability”
https://tnsr.org/roundtable/artificial-intelligence-and-the-future-of-strategic-stability/
Bender et al., “On the Dangers of Stochastic Parrots”
https://s10251.pcdn.co/pdf/2021-bender-parrots.pdf
Kate Crawford & Vladan Joler, “Anatomy of an AI System”
https://anatomyof.ai/

Videos

LSE, “AI and the Future of Work”
https://www.youtube.com/watch?v=McYBgZrORi4
The Hamilton Project / Brookings, “AI + work: Building pro-worker AI”
https://www.youtube.com/watch?v=VSzmjU33dzE
Anton Korinek, “The Economics of Transformative AI”
https://www.youtube.com/watch?v=Z8K-Np6HCWE
GovAI, “AI and Inequality – Joseph Stiglitz in conversation with Anton Korinek”
https://www.youtube.com/watch?v=EDpzqeMpmbc
Chema Alonso, “[2025] Cybersecurity & Artificial Intelligence in Nerdearla Spain 2025”
https://www.youtube.com/watch?v=WdZUg9wRgy8
Brookings Institution, “The geopolitics of generative AI”
https://www.youtube.com/watch?v=xPsIO2NAySk

¿Habrá desvíos del camino a un escenario cyperpunk? ¿Serán mejores? (para la humanidad)

El lock-in económico favorece la infraestructura dominante; la infraestructura dominante favorece modelos pasivos y masivos; los modelos pasivos y masivos tienen hambre de datos; el hambre de datos empuja al scraping y luego a la contaminación sintética; la contaminación sintética empobrece la ecología informacional; la falta de mundo obliga a simular agencia en texto; la falta de causalidad degrada la abducción a soluciones por fuerza bruta; la falta de validez endógena degrada la deducción a imitación de argumentación; la separación memoria-cómputo vuelve carísima la plasticidad continua; la lógica de mercado premia el despliegue útil antes que la comprensión fuerte. Esto prueba que el régimen actual está condenado, pero ese no es el peor problema: el peor problema es que sea un callejón sin salida.

La conclusión no tiene por qué ser, sin embargo, necesariamente “anti-IA”. Quizá sea una crítica a la pobreza de imaginar que esta IA es el destino de toda inteligencia artificial. Mi miedo no es que las máquinas no hagan nada, sino que hagan lo suficiente como para desplazar las preguntas correctas. Que escriban lo bastante bien como para hacernos olvidar la diferencia entre lenguaje y mundo. Que razonen lo bastante bien como para hacernos olvidar la diferencia entre probabilidad y validez. Que generen imágenes lo bastante pulcras como para hacernos olvidar la diferencia entre recombinación y creación. Que automaticen lo bastante como para hacernos olvidar la diferencia entre eficiencia particular y desarrollo general. Y que escalen lo bastante como para hacernos olvidar que relacionar no es comprender, así como fabricar no es crear.

Mientras tanto, la IA actual seguirá siendo un artefacto espectacular, pero sin cambiar por una inteligencia real, casi todos sus perjuicios quedarán intactos, y sus beneficios tenderán a una reducción constante. No se volverá pues una inteligencia en sentido fuerte, con una naturaleza inteligente. Y quizá lo más grave no sea que no la tenga, sino que su éxito nos haga dejar de querer construir algo que sí pueda.

Fuentes sobre el presente y futuro de la inteligencia artificial:

Textos y papers

Paul Thagard, “Artificial Intelligence: Philosophical and Social Issues”
https://cs.uwaterloo.ca/~jhoey/teaching/cogsci600/papers/Thagard-AI-2026.pdf
Daron Acemoglu, “Redesigning AI”
https://www.oxfordmartin.ox.ac.uk/videos/redesigning-ai
OECD, “AI across the stack: Competition issues in AI infrastructure”
https://www.oecd.org/en/publications/competition-in-artificial-intelligence-infrastructure_623d1874-en.html
“An Alternative Trajectory for Generative AI”
https://arxiv.org/html/2603.14147v1#S12

Citas

“Como en las sociedades aristocráticas todos los ciudadanos ocupan una posición fija, más o menos elevada, de ello resulta que cada uno percibe siempre más arriba que él a alguien cuya protección le es necesaria, y más abajo a otro a quien le puede reclamar asistencia. La aristocracia había hecho de todos los ciudadanos una larga cadena que se remontaba desde el aldeano hasta el rey; la democracia rompe la cadena y coloca cada eslabón aparte. Éstos no le deben nada a nadie, ni tampoco esperan, por decirlo así, nada de nadie; se acostumbran a considerarse siempre aisladamente y están convencidos de que su destino se encuentra totalmente en sus manos. Así, la democracia no sólo hace que los hombres olviden a sus abuelos, sino que les oculta a sus descendientes y los separa de sus contemporáneos; los conduce constantemente hacia sí mismos y, en fin, amenaza encerrarlos en la soledad de su propio corazón.”

Tocqueville, 1835

“Este espantoso organismo parasitario que se ciñe como una red al cuerpo de la sociedad francesa y le tapona todos los poros, surgió en la época de la monarquía absoluta, de la decadencia del régimen feudal, que dicho organismo contribuyó a acelerar. Los privilegios señoriales de las ciudades se convirtieron en otros tantos atributos del poder del Estado, los dignatarios feudales en funcionarios retribuidos, y el abigarrado mapa muestrario de las soberanías medievales en pugna fue reemplazado por el plan reglamentado de un poder estatal cuya labor está dividida y centralizada como en una fábrica. La primera revolución francesa, con su misión de romper todos los poderes particulares locales, territoriales, municipales y provinciales, para crear la unidad civil de la nación, tenía necesariamente que desarrollar lo que la monarquía absoluta había iniciado: la centralización; pero al mismo tiempo amplió el volumen, las atribuciones y el número de servidores del poder del Gobierno. Cada interés se desglosaba inmediatamente de la sociedad, y se contraponía a ésta como interés superior, general, se sustraía a la propia iniciativa de los individuos de la sociedad y se convertía en objeto de la actividad del Gobierno, desde el puente, la escuela y los bienes comunales de un municipio rural cualquiera, hasta los ferrocarriles, la riqueza nacional y las universidades de Francia. Todas las revoluciones perfeccionaban esta máquina, en vez de destrozarla.”

Marx, 1852

“También los cristianos primitivos sabían muy exactamente que el mundo está regido por los demonios y que quien se mete en política, es decir, quien accede a utilizar como medios el poder y la violencia, ha sellado un pacto con el diablo, de tal modo que ya no es cierto que en su actividad lo bueno sólo produzca el bien y lo malo el mal, sino que frecuentemente sucede lo contrario. Quien no ve esto es un niño, políticamente hablando.
Quien de cualquier modo pacte con este medio y para cualquier fin que lo haga, y esto es lo que todo político hace, está condenado a sufrir sus consecuencias específicas. Esta condena recae muy especialmente sobre quien lucha por su fe, sea ésta religiosa o revolucionaria. Tomemos la actualidad como ejemplo. Quien quiera imponer sobre la tierra la justicia absoluta valiéndose del poder necesita para ello seguidores, un «aparato» humano. Para que éste funcione tiene que ponerle ante los ojos los necesarios premios internos y externos. En las condiciones de la moderna lucha de clases, tiene que ofrecer como premio interno la satisfacción del odio y del deseo de revancha y, sobre todo, la satisfacción del resentimiento y de la pasión pseudoética de tener razón; es decir, tiene que satisfacer la necesidad de difamar al adversario y de acusarle de herejía.”

Weber, 1919

“El mito del salvaje individualista fue derribado hace mucho tiempo. No existe ninguna prueba del egoísmo primitivo, ni de la apócrifa propensión al trueque, al intercambio o al comercio, ni tampoco de la tendencia a abastecerse a sí mismo. También quedó desacreditada la leyenda de la psicología comunista del salvaje, de su presunta indiferencia a sus intereses personales. Lo que parecía ‘comunismo’ era el hecho de que el sistema productivo o económico estaba organizado en tal forma que ningún individuo quedaba expuesto a la amenaza de la indigencia. Cada quien tenía asegurado su lugar alrededor de la lumbre y su cuota de recursos comunes, cualquiera que hubiese sido su contribución a la caza, al pastoreo, al cultivo de la tierra o a la horticultura.”

Polanyi, 1947

“Tanto el altruismo como la solidaridad son instintos muy fuertes que guiaron al hombre en un pequeño grupo sirviendo a otras personas conocidas, cuando sus esfuerzos eran dirigidos a las necesidades de gente que eran sus familiares. Ahora hemos sustituido esto por un sistema en el que ya no se trabaja para las necesidades conocidas de otras personas conocidas, y ya no se utiliza la ayuda de otras personas conocidas, sino donde nuestro esfuerzo está completamente guiado por señales de precios que para el individuo significa que debe usar sus recursos para el máximo éxito del objeto por el que se sacrifican los recursos. Por lo tanto lo que ocurre en lo referente a las actividades económicas es que vamos a beneficiar a nuestros semejantes si nos guiamos exclusivamente por la búsqueda de la ganancia. Entonces luego estaremos en completa libertad de usar lo que hemos ganado, y allí puede aparecer un deseo altruista muy fuerte, pero no en el principio ordenador de la sociedad.”

Hayek, 1980

“El mercado era visto como la institución óptima para la producción y el intercambio de bienes y servicios, en tanto que para los bienes no privados se requería del ‘Estado’ para imponer reglas e impuestos que obligaran a individuos egoístas a contribuir con recursos necesarios y a limitarse en actividades de exclusivo beneficio personal. Por otro lado, sin un gobierno jerárquico que induzca al acatamiento, individuos egoístas y oficiales fracasarían en generar niveles eficientes de bienes públicos tales como la paz y la seguridad, en diferentes niveles. Una sola unidad gubernamental era la recomendación enfática para reducir la estructura ‘caótica’ de la gobernabilidad metropolitana. Esta visión dicotómica del mundo explica pautas de interacción y resultados relacionados con los mercados para la producción y el intercambio de bienes privados, pero no analiza las dinámicas internas de las empresas, ni trata adecuadamente con la amplia diversidad de arreglos institucionales que los seres humanos construyen para gobernar, proveer y administrar bienes públicos y bienes de uso común.”

Ostrom, 2009