Un equipo de científicos de Google DeepMind ha desarrollado una herramienta que añade marcas de agua a textos generados por grandes modelos lingüísticos (LLMs), mejorando la capacidad de identificar y rastrear contenido creado por IA.
Los LLMs se utilizan ampliamente en aplicaciones como chatbots y asistencia en la escritura, pero identificar la fuente del texto generado por IA sigue siendo un desafío, lo que plantea preocupaciones sobre la fiabilidad de la información.
Si bien las marcas de agua son comunes en imágenes y videos, aplicarlas a textos es complejo, ya que cualquier alteración puede cambiar el significado y la calidad. La nueva herramienta SynthID-Text utiliza un novedoso algoritmo de muestreo para sesgar sutilmente la elección de palabras, insertando una firma que puede ser reconocida por el software de detección asociado.
En un estudio publicado en la revista Nature, los investigadores Sumanth Dathathri y Pushmeet Kohli informaron que SynthID-Text mostró una eficacia mejorada en comparación con los métodos existentes. Además, requiere poca potencia de cálculo adicional, lo que facilita su implementación.
La capacidad de identificar texto sintético puede ayudar a mitigar el uso indebido accidental o deliberado. Los autores enfatizan que SynthID-Text mantiene la calidad del texto mientras permite una alta precisión de detección, presentando una solución técnicamente robusta para identificar texto generado por IA.
Los expertos destacan la necesidad de tales tecnologías, ya que los sistemas actuales para detectar documentos generados por IA tienen tasas de precisión bajas. Sin embargo, la adopción generalizada enfrenta desafíos, especialmente porque las marcas de agua pueden ser vulnerables a modificaciones que reducen su detectabilidad.