Alucinaciones de la IA y aversión al algoritmo
por Miguel Lucas
Cuando Alcaraz pierde una final, decimos que tuvo un mal día. Cuando la IA alucina, decimos que la tecnología no funciona.
No es que seamos injustos con las máquinas. Más bien es que se nos olvida que la alternativa, nosotros los humanos, está lejos de ser infalible. Los errores diagnósticos médicos causan 795.000 muertes o discapacidades permanentes al año solo en Estados Unidos 1. Uno de cada catorce pacientes hospitalizados sufre un error diagnóstico con consecuencias 2. No es negligencia; es la tasa base de la cognición humana aplicada a tareas complejas. Y lo hemos normalizado hasta hacerlo invisible. Sin embargo, que un modelo como GPT-5 presente tasas de alucinación en torno al 1,6% 3, basta para que muchos descalifiquen la IA generativa como herramienta de trabajo.
La psicología cognitiva ha documentado este fenómeno con precisión. Se llama aversión al algoritmo: perdemos la confianza en una máquina mucho más rápido que en un humano tras observar exactamente el mismo error 4. Al humano le concedemos contexto y circunstancias. A la máquina le exigimos perfección. Los vehículos autónomos de Waymo registran un 85% menos de accidentes con lesiones que los conductores humanos 5, pero cada incidente de un coche autónomo genera titulares mientras los miles de muertos anuales por conductores distraídos permanecen en el ángulo ciego de nuestra atención.
Sin embargo, la historia de la tecnología sugiere otra lógica. La aviación no se convirtió en el medio de transporte más seguro eliminando el error del piloto. Lo hizo minimizando sus consecuencias. El sistema fly-by-wire de Airbus rechaza las órdenes que llevarían al avión a estrellarse 6. No pilotos perfectos; sistemas que gestionan la imperfección. De 35 accidentes fatales por millón de vuelos en los años 50 a solo 4 en todo el mundo en 2024 7.
La alucinación de la IA no es un defecto que invalida. Es una característica que se gestiona, exactamente igual que el error humano: con verificación, redundancia y guardarraíles. Llevamos un siglo construyendo sistemas fiables con humanos que fallan. Con la IA no será diferente.
Tesis relacionadas
Referencias
- Johns Hopkins Medicine — Report Highlights Public Health Impact of Serious Harms From Diagnostic Error in U.S. ↩
- BMJ Group — Harmful diagnostic errors may occur in 1 in every 14 general medical hospital patients ↩
- Weights & Biases — GPT-5 Benchmark Scores ↩
- Tandfonline — Algorithm appreciation or aversion: the effects of accuracy disclosure on users' reliance on algorithmic suggestions ↩
- PubMed — Comparison of Waymo rider-only crash data to human benchmarks at 7.1 million miles ↩
- Airbus — Safety Innovation #7: Flight Envelope Protection ↩
- Our World in Data — Commercial flights have become significantly safer in recent decades ↩