No necesitas ser experto forense: la alfabetización en deepfakes como acto de soberanía ciudadana

Una madre en Lima recibe una llamada. Es la voz de su hijo —su entonación, sus muletillas, ese leve quiebre cuando está asustado— diciendo que lo secuestraron, que necesita dinero ahora, que no cuelgue, que no llame a nadie. La voz es perfecta porque no es del todo su hijo: es un modelo de clonación entrenado con segundos de audio extraído de un video de TikTok. La madre tiene treinta segundos para decidir. En esos treinta segundos, ninguna herramienta forense le sirve. No abrirá una aplicación web de detección, no subirá el archivo de audio a un clasificador de Microsoft, no comparará espectrogramas. Lo único que puede salvarla es algo mucho más humilde y mucho más difícil de enseñar: una pausa, una palabra clave acordada de antemano, el reflejo de colgar y marcar el número real.

Esa escena —que ya no es hipotética en ninguna ciudad latinoamericana— condensa la trampa de cómo el mundo ha decidido hablar sobre los deepfakes. El discurso global, dominado por laboratorios del Norte y empresas que venden detección como servicio, propone una solución que se parece sospechosamente a su modelo de negocio: que cada ciudadano se convierta en un perito digital, capaz de leer artefactos en los píxeles, inconsistencias en el parpadeo, glitches en la sincronización de labios. Es un encuadre cómodo para quien vende clasificadores y desastroso para quien recibe la llamada. Porque cuando el peso de la defensa recae sobre la capacidad técnica individual, la mayoría de las personas —que no tienen ese capital técnico ni la obligación de tenerlo— quedan, por definición, indefensas.

Quiero defender una tesis incómoda para la industria: la alfabetización en deepfakes no es, ni debe ser, una habilidad técnica de élite. Es un derecho ciudadano básico, y como todo derecho, depende menos de la virtuosidad del individuo que de la infraestructura que lo hace ejercible. La verdadera alfabetización no consiste en aprender a usar herramientas que no existen en español, son caras y no funcionan con los formatos que circulan por WhatsApp. Consiste en desarrollar una sospecha saludable y conocer los canales de verificación accesibles. La meta no es producir forenses. Es que cualquier persona sepa qué hacer en los treinta segundos antes de reaccionar.

La detección como espejismo vendido

Conviene nombrar el movimiento retórico antes de desarmarlo. La conversación dominante sobre desinformación sintética asume que el problema es de identificación: si pudiéramos detectar lo falso, lo neutralizaríamos. De ahí la enorme inversión en clasificadores, marcas de agua, estándares de procedencia. Pero la premisa esconde un desplazamiento de responsabilidad. El HAI AI-Index-Report-2024 documenta sistemas como CounterCloud, donde una IA genera un artículo falso atribuido a un periodista inexistente, otra IA fabrica comentarios para simular engagement orgánico, y una tercera busca tweets relevantes para inyectar la respuesta como si fuera conversación espontánea. Frente a una cadena de producción automatizada de ese calibre, pedirle al ciudadano que “detecte” cada eslabón es como pedirle que inspeccione molécula por molécula el agua que sale de su grifo.

El problema con la detección como defensa primaria es que corre detrás de la generación, siempre un paso atrás. Cada vez que un detector aprende a reconocer un artefacto, la siguiente generación de modelos lo elimina. Es una carrera armamentista donde el ciudadano latinoamericano llega sin armas y sin entrenamiento. Marta Peirano lo formuló con precisión al describir cómo el ecosistema mediático fraudulento prospera sobre la pérdida de prestigio de las cabeceras tradicionales: páginas que pueden publicar “noticias falsas como si fueran reales sin temer una demanda, cosa que un periódico no puede hacer” El enemigo conoce el sistema. El daño no se produce en el momento de la detección técnica; se produce en el momento de la circulación social, cuando el contenido ya se compartió, ya generó pánico, ya transfirió el dinero.

Y aquí aparece la asimetría latinoamericana que el discurso global ignora sistemáticamente. García Canclini lo anticipó: las herramientas de phishing y manipulación están disponibles en un mercado desregulado mientras “la sociedad civil no dispone de conocimiento o de la capacidad necesaria para protegerse de estos ataques” Ciudadanos reemplazados por algoritmos. La oferta de ataque es barata, masiva y multilingüe. La oferta de defensa es cara, escasa y monolingüe. Convertir al ciudadano en su propia última línea de defensa, en ese contexto, no es empoderamiento: es abandono administrativo disfrazado de responsabilidad personal.

El detector más confiable no es un modelo

Si la detección técnica es un espejismo, ¿qué queda? Queda algo que ningún laboratorio puede vender porque no es un producto: la verificación por un canal separado. El mejor detector de deepfakes que existe hoy no es un clasificador de redes neuronales. Es colgar y volver a llamar al número real. Es preguntar, en una videollamada, algo que solo la persona verdadera sabría. Es esperar veinte minutos antes de compartir. Estos no son trucos tecnológicos; son protocolos sociales, y su eficacia radica precisamente en que operan en una dimensión donde la IA generativa todavía no puede seguirte: la del contexto compartido y la relación previa.

Esto reorienta radicalmente lo que significa alfabetizar. La habilidad central no es leer artefactos en una imagen sino reconocer la estructura emocional del ataque. Las estafas con clonación de voz, la sextorsión con imágenes falsas, los audios manipulados de un familiar: todos comparten un guion. Generan urgencia (“es ahora o nunca”), aíslan a la víctima (“no llames a nadie”), explotan un vínculo de confianza (“soy tu hijo, tu jefe, tu banco”). La alfabetización efectiva enseña a reconocer ese guion emocional —la presión, el aislamiento, la urgencia artificial— como la señal de alarma primaria, mucho antes que cualquier glitch visual. Quien aprende a desconfiar de la urgencia no necesita saber nada sobre redes generativas adversarias.

La UNESCO, en su marco para pensar críticamente, propone justamente desplazar la pregunta desde “¿es esto falso?” hacia “¿qué algoritmos podrían amplificar esto, y qué intereses sirve?” UNESCO Think Critically Click Wisely. Es un giro decisivo: de la inspección del objeto a la interrogación del flujo. La pregunta forense —”¿está manipulado este píxel?”— es la pregunta del experto. La pregunta cívica —”¿por qué me llega esto, ahora, con esta carga emocional, pidiéndome que actúe de inmediato?”— es la pregunta que cualquiera puede aprender y que protege mejor.

Conviene ser honesto con un matiz aquí, porque la tesis no debe volverse dogma. Hay contextos donde la verificación contextual no basta. La desinformación política masiva —un video falso de un candidato la víspera de una elección— no se neutraliza con una palabra clave familiar. Ahí sí se necesita fact-checking profesional, respuesta institucional rápida, y sí, alguna capacidad técnica de detección concentrada en organizaciones especializadas. El argumento no es que la habilidad técnica sea inútil; es que no puede ser la carga del ciudadano individual. La detección técnica debe existir, pero alojada en infraestructura compartida —verificadores, plataformas, bancos— no exigida como competencia personal universal.

El diseño para el medio real, no para el medio imaginado

Hay una falla de diseño en casi toda la pedagogía sobre deepfakes que viene del Norte: asume un usuario que se sienta frente a una computadora, abre un navegador, visita un sitio de verificación, sube un archivo. Ese usuario es una ficción en buena parte de América Latina. El medio real es WhatsApp, donde llega el audio reenviado catorce veces; es TikTok, donde el video falso se mezcla con el flujo de entretenimiento; es la llamada telefónica, donde no hay ningún archivo que subir a ningún lado. Diseñar alfabetización para una herramienta web que el usuario nunca abrirá es construir una escalera de emergencia en el piso equivocado del edificio.

Esto importa porque las plataformas dominantes en la región concentran el tráfico de información de un modo que la alfabetización debe asumir como punto de partida. Peirano recuerda que en la región los mensajes cifrados de WhatsApp se volvieron vehículo central de circulación política precisamente porque escapan al escrutinio público El enemigo conoce el sistema. El cifrado que protege la privacidad también protege la desinformación: nadie ve el audio falso que circula en mil grupos familiares hasta que ya hizo su daño. Una alfabetización seria no pelea contra esa realidad; la habita. Enseña qué hacer dentro de WhatsApp: no reenviar sin verificar, reconocer el “reenviado muchas veces”, marcar a la persona real.

El diseño para el medio real también significa diseño en español, con actores reconocibles y casos locales. Un módulo de alfabetización que muestra deepfakes de políticos estadounidenses no transfiere conducta a una abuela en San Salvador. La retención de hábitos de verificación aumenta cuando el ejemplo es próximo: la voz clonada de un nieto, el audio falso de un líder local, el WhatsApp del “banco” que todos usan. La proximidad no es un adorno pedagógico; es la condición de que la lección se active en el momento real del ataque. Aquí la asimetría de recursos vuelve a morder: producir ese material local, contextualizado, en español y con casos reconocibles, requiere inversión que las herramientas importadas no proveen y que los Estados de la región rara vez priorizan.

La soberanía ciudadana frente a la desdemocratización

Llamar a esto “soberanía ciudadana” no es retórica inflada. Es nombrar lo que está en juego. García Canclini, leyendo a Wendy Brown, describió la erosión contemporánea de la ciudadanía como una “desdemocratización”: la descomposición de las garantías y derechos sociales que daban sentido a la concepción moderna de la ciudadanía Ciudadanos reemplazados por algoritmos. La desinformación sintética acelera esa descomposición porque ataca la base misma de la deliberación democrática: la capacidad compartida de distinguir lo real de lo fabricado, de confiar en que la voz de tu hijo es la voz de tu hijo, de que el video del candidato es el candidato.

Cuando el ecosistema informativo se satura de falsificaciones perfectas, el daño no es solo que creamos cosas falsas. Es que dejamos de creer en cualquier cosa —el llamado “dividendo del mentiroso”, donde cualquier evidencia real puede descartarse como posible deepfake. Un político grabado en un acto de corrupción puede decir simplemente “es un deepfake” y sembrar duda suficiente. Esa erosión de la confianza compartida es el verdadero proyecto político de la desinformación sintética, y ninguna herramienta de detección individual lo revierte. Lo que lo revierte es la reconstrucción colectiva de canales confiables: verificadores con credibilidad pública, instituciones que respondan rápido, redes de confianza que funcionen como infraestructura social de chequeo.

Por eso la alfabetización, entendida como soberanía, es un acto cívico antes que técnico. Freire insistía en que la alfabetización liberadora no es depositar información en un sujeto pasivo —la “educación bancaria”— sino capacitar para “leer el mundo”, para nombrar la realidad y actuar sobre ella Pedagogía del oprimido. La alfabetización en deepfakes que merece el nombre no enseña a operar un clasificador; enseña a leer la estructura de poder e intención detrás de un mensaje. Quién lo manda, qué quiere que yo haga, a quién beneficia mi reacción inmediata. Esa es lectura del mundo, no inspección de píxeles. Y es, además, una habilidad que no caduca con la próxima generación de modelos, porque interroga la intención humana, que es constante, no el artefacto técnico, que es móvil.

Las cinco lentes sobre el terreno latinoamericano

Conviene pasar la tesis por el tamiz concreto de la región, porque las generalidades se evaporan ante los datos. Cuatro lentes resultan especialmente reveladoras aquí.

Disponibilidad. Las principales herramientas de detección de deepfakes —de Microsoft, OpenAI, de la constelación de startups del sector— carecen de versiones en español y no están optimizadas para contenidos latinoamericanos. Muchas requieren suscripción o cuentas bloqueadas por región. Esto no es un detalle: significa que el discurso global de “usa el detector” describe una infraestructura que, para el usuario hispanohablante promedio, sencillamente no existe. La asimetría tiene anclaje económico medible. Argentina, con el cuarto índice de preparación para la IA de la región según el ILIA (67.5/100), tiene un PIB per cápita de apenas 13.969 dólares y un crecimiento de -1.3% en 2024 Argentina country profile. El Salvador, donde las estafas con clonación florecen, marca 42.9 en el mismo índice y un PIB per cápita de 5.579 dólares El Salvador country profile. En esa escala económica, la suscripción mensual a una herramienta forense en inglés no es una prioridad doméstica realista.

Accesibilidad. El costo es prohibitivo para la mayoría de ciudadanos y pequeñas organizaciones, pero la barrera no es solo monetaria. La alfabetización necesaria para usar esas herramientas —inglés técnico, capacidad de manejar archivos pesados, comprensión de qué significa un “score de probabilidad”— constituye una segunda muralla. Una herramienta que arroja “73% probabilidad de manipulación” no ayuda a quien no sabe interpretar una probabilidad ni qué hacer con ella. Aquí la accesibilidad técnica y la alfabetización se entrelazan: lo que está disponible no es accesible, y lo que sería accesible —protocolos sociales simples— no se enseña porque no se puede vender.

Aplicabilidad. Las aplicaciones urgentes en la región no son las del laboratorio sino las de la vida diaria: estafas financieras, extorsión, desinformación política y bullying con imágenes falsas en escuelas. Estas amenazas viven en canales familiares —WhatsApp, TikTok, la llamada telefónica— no en interfaces web de detección. Una alfabetización aplicable debe integrarse donde ocurre el daño. Perú, con 58.9 en el ILIA y una Estrategia Nacional de Inteligencia Artificial en marcha Peru country profile, ilustra el punto: tener una estrategia nacional no equivale a tener defensas ciudadanas distribuidas en los canales donde la gente realmente vive su vida informativa. La política existe en el papel; el ataque existe en el grupo de WhatsApp.

Alternativas. Frente a la herramienta forense ausente, las alternativas reales ya están al alcance y son robustas: la verificación contextual (pedir una palabra clave acordada, una pregunta que solo la persona real responda), el apoyo comunitario a través de redes de confianza, y la presión sobre plataformas para que generen sellos de procedencia de contenido. El fact-checking manual, hecho por organizaciones con credibilidad, sigue siendo el estándar de oro para la desinformación pública. Ninguna de estas alternativas requiere que el ciudadano se vuelva experto. Todas requieren que el ecosistema —familias, comunidades, plataformas, verificadores— asuma su parte de la carga. Esa redistribución de la carga es, en sí misma, el corazón de la propuesta.

Anticipación. La región tiene una ventana para construir lo que aún no existe, y conviene nombrar las prioridades antes de que el problema escale. Primero, inversión en infraestructura de verificación accesible: versiones gratuitas y en español de herramientas de chequeo, alojadas en instituciones públicas o verificadores. Segundo, campañas de alfabetización masivas centradas no en habilidades técnicas sino en hábitos de sospecha y verificación —la pausa, el canal separado, la palabra clave familiar—. Tercero, marcos regulatorios que exijan a las plataformas etiquetar el contenido sintético, desplazando la carga de la detección desde el ciudadano hacia quien distribuye el contenido y tiene los recursos técnicos para marcarlo. La anticipación inteligente no apuesta a que cada persona se vuelva perito; apuesta a que el entorno haga la verificación fácil.

Lo que la regulación debe hacer porque el ciudadano no puede

Hay un límite duro en la alfabetización individual que ningún esfuerzo pedagógico supera, y honestidad intelectual exige reconocerlo. Por más sospecha saludable que cultive una persona, no puede etiquetar el contenido sintético que circula por una plataforma; eso solo lo puede hacer la plataforma. No puede obligar a un banco a implementar verificación de doble canal para transferencias urgentes; eso solo lo puede hacer la regulación. No puede crear estándares de procedencia que viajen con cada imagen y audio; eso requiere coordinación de infraestructura que excede a cualquier ciudadano por alfabetizado que esté.

Por eso la tesis de la “soberanía ciudadana” se completaría mal si terminara en el individuo. La soberanía aquí significa exigir, como ciudadanía organizada, que la infraestructura asuma lo que no puede ser tarea personal. Significa que el etiquetado de contenido sintético no sea una cortesía opcional de las plataformas sino una obligación regulatoria. Significa que los bancos diseñen sus flujos asumiendo que la voz que llama puede ser clonada. Significa que los Estados financien verificadores independientes con la misma seriedad con que financian otras defensas públicas. La alfabetización ciudadana y la infraestructura regulada no compiten: se necesitan. Una ciudadanía alfabetizada sin infraestructura es una población consciente de su indefensión; una infraestructura sin ciudadanía alfabetizada es un sistema que nadie sabe usar.

El riesgo político concreto es que la región adopte el encuadre importado —“alfabeticemos al ciudadano para que detecte”— precisamente porque es el más barato para los Estados y el más rentable para las empresas. Es la solución que no exige regular plataformas poderosas ni invertir en infraestructura pública: basta con echar la responsabilidad sobre el individuo y declarar el problema “atendido”. Reconocer ese desplazamiento es parte de la alfabetización misma. Como advierte la UNESCO, pensar críticamente incluye preguntar a quién beneficia el encuadre del problema, no solo el contenido del mensaje UNESCO Think Critically Click Wisely.

Preguntas abiertas para la región

Quiero cerrar resistiendo la tentación de la receta, porque las preguntas honestas valen más que las soluciones falsas.

La primera: ¿puede la verificación contextual escalar sin reconstruir, en el camino, las redes de confianza que la economía de la atención ya erosionó? La palabra clave familiar funciona porque presupone un vínculo previo. Pero buena parte del daño ocurre precisamente donde esos vínculos se debilitaron —en la soledad del adulto mayor, en la atomización urbana, en grupos de WhatsApp que reemplazaron la conversación cara a cara. Alfabetizar en verificación contextual puede exigir, antes, reconstruir el tejido social que la hace posible. No es una tarea técnica; es una tarea comunitaria de largo aliento.

La segunda: ¿quién paga la infraestructura de verificación accesible cuando los Estados de la región operan bajo restricción fiscal severa y las plataformas no tienen incentivo para autoregularse? El llamado a “versiones gratuitas en español” es justo, pero gratis para el usuario significa pagado por alguien. Si lo paga la plataforma, ¿con qué garantía de independencia? Si lo paga el Estado, ¿con qué recursos? Si lo paga la cooperación internacional, ¿con qué condiciones de soberanía tecnológica? La pregunta del financiamiento no es secundaria; es la que decide si la propuesta es real o decorativa.

La tercera, quizás la más incómoda: ¿estamos alfabetizando para un mundo donde la distinción entre real y sintético seguirá siendo legible, o para uno donde esa distinción ya colapsó? Si la generación se vuelve indetectable —y la tendencia apunta ahí— la apuesta entera por la verificación del objeto pierde sentido, y solo quedan las preguntas sobre intención, procedencia y confianza institucional. Tal vez la alfabetización del futuro próximo no enseñe a distinguir lo verdadero de lo falso, sino a vivir y deliberar sabiendo que no podemos distinguirlos por inspección, apoyándonos en cambio en la procedencia verificada y en instituciones que merezcan confianza. Esa es una transformación cívica profunda, y la región haría bien en empezar a pensarla ahora, no cuando la madre en Lima ya no tenga ningún canal separado al cual marcar.

Mientras tanto, la lección práctica se sostiene en su humildad: no necesitas ser experto forense. Necesitas una pausa, una palabra clave, un número real al cual llamar, y la sospecha saludable de que la urgencia es, casi siempre, el primer síntoma del engaño. Esa alfabetización mínima, distribuida masivamente y sostenida por infraestructura que asuma su parte, protege más que todos los detectores que la industria del Norte nos vende sin traducir.