Primicias24.com OpenAI, la empresa creadora del popular ChatGPT, presentó este viernes OpenAI o1, el primer modelo de inteligencia artificial (IA) de su serie capaz de “razonar” y “pensar” sus respuestas a través de las matemáticas y la ciencia para así cometer menos errores.
“Entrenamos estos modelos para que dediquen más tiempo a pensar en los problemas antes de responder, de manera muy similar a lo que lo haría una persona. A través del entrenamiento, aprenden a refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores”, explicó la empresa en un comunicado publicado el jueves.
Hasta ahora, OpenAI había enseñado a sus modelos a imitar patrones de sus datos de entrenamiento tomando como base muchas veces la información que está en internet, pero como la red está llena de información falsa, la tecnología aprendió a repetir las mismas informaciones erróneas.
No obstante, o1 usa una técnica conocida como aprendizaje de refuerzo, que enseña al sistema a través de recompensas y penalizaciones.
En tanto, al resolver varios problemas matemáticos, por ejemplo, puede aprender qué métodos conducen a la respuesta correcta y cuáles no.
Como resultado de esta nueva metodología de entrenamiento, OpenAI dice que el modelo debería ser más preciso y evitar así las ‘alucinaciones’ -cuando da respuestas bien estructuradas, pero falsas-, según dijo el líder de investigación de OpenAI, Jerry Tworek al medio especializado The Verge.