NeurIPS, una de las conferencias de investigación de IA más prestigiosas del mundo, celebró su 39ª reunión anual en San Diego en diciembre, atrayendo decenas de miles de presentaciones y participantes. Lo que alguna vez fue una reunión principalmente académica se ha convertido en un coto de caza privilegiado para los mejores laboratorios de IA, donde una buena actuación puede traducirse directamente en ofertas de trabajo. Los investigadores cuyos artículos son aceptados para presentación en vivo se consideran entre la élite del campo.

Sin embargo, la startup canadiense GPTZero analizó más de 4.000 artículos de investigación aceptados y presentados en NeurIPS (Neural Information Processing Systems) 2025 y dice que descubrió cientos de citas alucinadas por IA que pasaron desapercibidas para los tres o más revisores asignados a cada envío, abarcando al menos 53 artículos en total. Las alucinaciones no habían sido reportadas previamente.

Desde citas totalmente inventadas hasta cambios sutiles

En algunos casos, un modelo de IA combinó o parafraseó elementos de múltiples artículos reales, incluidos títulos que suenan creíbles y listas de autores, dice la compañía. Otros parecían totalmente inventados: un autor inexistente, el título de un artículo inventado, una revista o conferencia falsa o una URL que no lleva a ninguna parte.

En otros casos, el modelo partía de un artículo real pero hacía cambios sutiles: expandía las iniciales de un autor a un nombre adivinado, eliminaba o agregaba coautores o parafraseaba el título. Algunos, sin embargo, están claramente equivocados: citan a “John Smith” y “Jane Doe” como autores, por ejemplo.

Cuando se le contactó para hacer comentarios, la junta directiva de NeurIPS compartió la siguiente declaración: «El uso de LLM en artículos en conferencias de IA está evolucionando rápidamente, y NeurIPS está monitoreando activamente los desarrollos. En años anteriores, pusimos a prueba políticas relacionadas con el uso de LLM, y en 2025, se ordenó a los revisores que señalaran las alucinaciones. En cuanto a los hallazgos de este trabajo específico, enfatizamos que se requiere un esfuerzo significativamente mayor para determinar las implicaciones. Incluso si el 1,1% de los artículos han una o más referencias incorrectas debido al uso de LLM, el contenido de los artículos en sí no necesariamente se invalida. Por ejemplo, los autores pueden haberle dado a un LLM una descripción parcial de una cita y haberle pedido al LLM que produzca bibtex (una referencia formateada). Como siempre, NeurIPS se compromete a evolucionar el proceso de revisión y autoría para garantizar mejor el rigor científico e identificar formas en que los LLM se pueden utilizar para mejorar las capacidades del autor y del revisor”.

Edward Tian, ​​cofundador y director ejecutivo de GPTZero, que se fundó en enero de 2023 y recaudó una ronda Serie A de 10 millones de dólares en 2024, dijo Fortuna El análisis de NeurIPS se produjo apenas unas semanas después de que la compañía descubriera 50 citas alucinadas en artículos que se estaban revisando para otra importante conferencia de investigación de IA, ICLR, que se celebrará en Río de Janeiro en abril. En ese caso, los artículos aún no habían sido aceptados, pero las citas falsas ya habían pasado desapercibidas para los revisores pares. Tian dijo que la conferencia ICLR contrató a la compañía para verificar futuras presentaciones en busca de citas inventadas durante la revisión por pares.

Aparecieron errores en trabajos aceptados y presentados en NeurIPS

Según Tian, ​​los hallazgos de NeurIPS son aún más preocupantes porque los errores aparecen en artículos que fueron aceptado por la conferencia. En el mundo académico de la IA, “publicar o morir” es más que un cliché: la contratación y la permanencia a menudo dependen de la acumulación de publicaciones revisadas por pares. Sin embargo, según normas académicas de larga data, incluso una sola cita inventada sería, en principio, motivo de rechazo. Las referencias tienen como objetivo anclar un artículo en el cuerpo de investigación existente y demostrar que sus autores realmente han leído y se han comprometido con el trabajo que citan.

«Definitivamente es una escalada mayor en el sentido de que estos fueron los primeros casos documentados de citas alucinadas que ingresaron al registro oficial de la principal conferencia de aprendizaje automático», dijo Tian, ​​señalando que dado que NeurIPS 2025 tuvo una tasa de aceptación para los artículos principales del 24,52%, cada uno de estos artículos superó a otros 15.000 artículos a pesar de contener una o más alucinaciones. «Estos sobrevivieron a la revisión por pares y se publicaron en las actas finales de la conferencia», dijo. «Así que definitivamente es un gran momento».

Alrededor de la mitad de los artículos con citas alucinadas eran artículos que probablemente fueron generados por IA o que tenían una gran cantidad de uso de IA, añadió. «Pero en lo que realmente nos centramos en esta investigación son en las citaciones mismas», dijo. Las herramientas de detección de IA a menudo han sido criticadas por falsos positivos al intentar identificar texto escrito por máquina. Pero Tian argumentó que la detección de alucinaciones es una clase diferente de problema, ya que la herramienta de GPTZero verifica hechos verificables: busca en la web abierta y en bases de datos académicas para confirmar si un artículo citado realmente existe. La compañía dice que la herramienta tiene una precisión de más del 99% y, para el análisis de NeurIPS, cada cita marcada también fue revisada por un experto humano del equipo de aprendizaje automático de GPTZero.

Alex Cui, cofundador y director de tecnología de Tian, ​​dijo que la herramienta de verificación de alucinaciones de GPTZero ingiere un artículo y luego busca en la web abierta y en bases de datos académicas para verificar cada cita: sus autores, título, lugar de publicación y enlace. Si no se puede encontrar una referencia, o si solo coincide parcialmente con un artículo real, el sistema la marca. Así es como detecta casos en los que un modelo de IA parte de un artículo real pero agrega autores que no existen, altera el título o inventa una publicación.

«A veces, incluso cuando hay una coincidencia, encontrarás que agregaron como cinco autores que no existen a un artículo real, por lo que estos son errores que ningún ser humano cometería razonablemente», explicó. Para la investigación de NeurIPS, después del escaneo automatizado, un miembro del equipo de aprendizaje automático de GPTZero verificó manualmente cada cita marcada, asegurándose de que los hallazgos no sean en sí mismos falsos positivos.

El gran volumen de artículos dificulta un escrutinio profundo

Una gran parte del desafío es la enorme escala. En 2025, la línea principal de investigación de NeurIPS recibió 21.575 envíos válidos, frente a 15.671 en 2024 y 12.343 en 2023. Incluso con miles de revisores voluntarios, ese volumen hace que el escrutinio profundo de cada artículo y sus referencias sea cada vez más difícil.

Pero si bien la IA tiene un papel en esto al hacer que sea mucho más fácil la producción de presentaciones a conferencias, dijo Tian, ​​un artículo defectuoso todavía conlleva un riesgo real para la reputación: para los autores, para la conferencia que lo aceptó y para las empresas que contratan investigadores basándose en esas credenciales.

Esto es particularmente cierto para las citas, dijo, porque en la investigación moderna de IA, las citas son una parte central de cómo el campo intenta resolver problemas de reproducibilidad. «Los resultados de la IA son notoriamente difíciles de reproducir, por lo que las citas son importantes», dijo, para «trazar la línea entre si ese resultado fue reproducible o no», permitiendo que otros investigadores rastreen el resultado hasta algo concreto y comprobable. Las citas alucinadas, por otro lado, envían a los lectores a algo que no existe.



Source link