OpenAI ha presentado su nuevo modelo de IA, o3, el sucesor de la serie o1 anterior. Esta nueva serie incluye o3 y una variante más pequeña, o3-mini, diseñada para tareas específicas.
El modelo o2 fue omitido para evitar confusiones con el proveedor de telecomunicaciones británico O2. Aunque ambos modelos aún no están ampliamente disponibles, los investigadores en seguridad informática pueden solicitar acceso ahora, con o3-mini previsto para ser lanzado al público a finales de enero, seguido de o3.
OpenAI utiliza una nueva técnica llamada 'alineación reflexiva' para prevenir intentos de engañar a los usuarios. A diferencia de la mayoría de los modelos de IA, o3 realiza auto-verificaciones, lo que ayuda a mitigar problemas comunes que enfrentan los sistemas de IA.
Este proceso de verificación puede causar retrasos, ya que o3 tarda más—desde varios segundos hasta un minuto—en llegar a soluciones. Sin embargo, generalmente es más confiable en campos como la física, la ciencia y las matemáticas.
Entrenado a través del aprendizaje por refuerzo, o3 puede 'pensar' antes de responder utilizando lo que OpenAI describe como una 'cadena de pensamiento privada.' Después de recibir una consulta, o3 se detiene para considerar preguntas relacionadas y explica su razonamiento antes de resumir lo que considera la respuesta más precisa.
En términos de rendimiento, o3 ha mostrado una mejora significativa en el benchmark ARC-AGI, logrando resultados tres veces mejores que o1 en condiciones desafiantes. Sin embargo, ha tenido un rendimiento inferior en tareas muy simples, lo que resalta diferencias fundamentales en comparación con la inteligencia humana.
En otras pruebas, o3 ha superado a sus competidores, aunque aún se esperan resultados de evaluaciones externas de fuentes fuera de OpenAI.