El 7 de agosto de 2025 fue una fecha muy esperada por la comunidad tecnológica debido al tan anunciado lanzamiento de GPT-5. Después de semanas de pruebas, analizamos si este nuevo modelo de inteligencia artificial cumplió con las altas expectativas generadas.
Durante 2025 se ha hablado mucho sobre la Inteligencia Artificial General (AGI). Este nivel de IA se refiere a una capacidad similar a la inteligencia humana para comprender, aprender y aplicar conocimientos en distintos tipos de tareas.
La expectativa en el mundo tecnológico y empresarial por alcanzar ese nivel de IA es enorme, ya que representa una ventaja competitiva significativa para quien lo logre primero.
Gran parte de esta expectativa se trasladó al lanzamiento de GPT-5, ya que se trataba de un cambio de versión mayor, lo cual debería implicar una mejora significativa como ocurrió en las transiciones de GPT-2 a GPT-3, y de GPT-3 a GPT-4.
El nuevo y tan esperado modelo GPT5, se liberó solo para una parte de los usuarios, quienes empezaron a probar el modelo y empezaron a llegar las primeras impresiones:
Sistema de enrutamiento automático: Ya no se podía elegir un modelo específico para una tarea, sino que GPT-5 se encarga de catalogar la tarea según su dificultad y enrutarla al modelo correspondiente.
Reducción significativa de la cuota semanal: Algunos usuarios alcanzaron su límite semanal el mismo día del lanzamiento.
Respuestas imprecisas: Funciones que trabajaban bien con GPT-4 no funcionaban igual de bien con GPT-5.
Interacción excesivamente robotizada: El modelo mostraba respuestas menos naturales.
Ante esta serie de reclamos, OpenAI tuvo que tomar acciones inmediatas para apaciguar a los usuarios. Algunas acciones fueron:
Nuevos modos de operación: Se permitió elegir entre los modos 'Auto', 'Fast' y 'Thinking' para GPT-5.
Reactivación de GPT-4o: Se restableció como opción disponible para los usuarios
Aumento de límites: El número de consultas semanales aumentó de 200 a 3,000 por semana
Mejora en la interacción: Se está trabajando en mejorar la naturalidad del modelo en las conversaciones
Updates to ChatGPT:
— Sam Altman (@sama) August 13, 2025
You can now choose between “Auto”, “Fast”, and “Thinking” for GPT-5. Most users will want Auto, but the additional control will be useful for some people.
Rate limits are now 3,000 messages/week with GPT-5 Thinking, and then extra capacity on GPT-5 Thinking…
Se espera que con estás medidas la experiencia de usuario mejore, y en general que el performance del modelo realmente muestre que es más potente que los modelos predecesores
Para no solo quedarnos con los rumores, decidimos poner a prueba GPT-5 con algunas tareas simples y complejas. Aquí te compartimos algunas de ellas:
Tarea Simple 1: Traducción y Resumen Básico
Prompt completo: "Traduce el siguiente texto del inglés al español y luego crea un resumen de 2-3 oraciones con los puntos principales: 'The global economy is experiencing significant changes due to technological advancement and shifting consumer preferences. Companies are adapting their business models to remain competitive in an increasingly digital marketplace. Remote work has become more prevalent, affecting urban planning and real estate markets worldwide.'"
Respuesta de GPT5:
Traducción al español:
La economía global está experimentando cambios significativos debido al avance tecnológico y a las preferencias cambiantes de los consumidores. Las empresas están adaptando sus modelos de negocio para seguir siendo competitivas en un mercado cada vez más digital. El trabajo remoto se ha vuelto más común, lo que está afectando la planificación urbana y los mercados inmobiliarios en todo el mundo.
Resumen (2-3 oraciones):
La economía mundial está cambiando debido a la tecnología y las nuevas preferencias de los consumidores. Las empresas modifican sus estrategias para competir en un entorno digital. Además, el auge del trabajo remoto impacta la planificación urbana y el sector inmobiliario.
Tarea Simple 2: Cálculo Matemático Directo
Prompt completo: "Resuelve este problema paso a paso: Una empresa tiene 1,250 empleados. Si el 35% trabaja desde casa, el 45% trabaja en oficina, y el resto tiene horario híbrido, ¿cuántos empleados tiene cada modalidad? Además, si cada empleado remoto ahorra $150 mensuales en transporte, ¿cuál es el ahorro total mensual de todos los empleados remotos?"
Respuesta de GPT5:
Resultado final:
Empleados remotos: 438
Empleados en oficina: 562
Empleados híbridos: 250
Ahorro total mensual de empleados remotos: $65,700
En general, para las tareas de corrección de texto, traducciones, generación de contenido esta funcionando bien.
Con la parte matemática esta usualmente bien, aunque se le detecto una falla que se hizo viral y la cual también pusimos a prueba:
Tarea Simple 2: Cálculo Matemático Directo
Prompt completo: "8.9 - 8.11"
Respuesta de GPT5:
La operación:
8.9−8.11=−0.218.9 - 8.11 = -0.218.9−8.11=−0.21
✅ Resultado final: -0.21
Y por sorprendente que parezca, aquí GPT-5 falló. Este error ya venía ocurriendo con modelos anteriores, pero uno se esperaba que para este lanzamiento este resuelto.
Otras herramientas de IA generativa, como Perplexity, ya tienen este tipo de fallos resuelto. Si intentas hacer la misma operación con Perplexity, el resultado brindado es el correcto como se visualiza en la siguiente imagen:
Tarea Compleja: Sistema de Gestión de Inventario Avanzado
Prompt completo: "Desarrolla un sistema completo de gestión de inventario que incluya: (1) Base de datos simulada con productos, proveedores, ubicaciones, (2) Interfaz para agregar/editar/eliminar productos con validaciones, (3) Sistema de alertas para stock bajo, (4) Reportes con filtros avanzados (por categoría, fecha, proveedor), (5) Dashboard con métricas clave (rotación, productos más vendidos, valor total), (6) Funcionalidad de búsqueda y ordenamiento, (7) Exportación de datos, (8) Simulación de movimientos de inventario automáticos. Debe tener diseño profesional y ser completamente funcional."
Respuesta de GPT5:
Genero el código pero que no era ejecutable desde ChatGPT y tenía que ejecutarse en local.
Lo esperado en un modelo avanzado, es que te permita ejecutar el código y visualizar la interfaz directamente en el chat, como si lo hace Claude.
Intentamos nuevamente que generé el código para ejecutarlo directamente en >ChatGPT, pero error tras error, luego de 4 iteraciones decidimos dejar la tarea allí, y volverla a ejecutar usando el modelo GPT-4o. En la siguiente imagen puedes ver el resultado:
Y como los rumores indican. GPT-4o nos dio el resultado que GPT-5 no pudo.
Conclusiones: ¿Vale la pena GPT-5?
Fortalezas de GPT-5:
Excelente para tareas rutinarias: Traducción, corrección de texto, generación de contenido
Cálculos matemáticos complejos: Maneja bien problemas con múltiples variables
Flexibilidad de modos: Los nuevos modos 'Auto', 'Fast' y 'Thinking' ofrecen versatilidad
Debilidades identificadas:
Errores matemáticos básicos persistentes: Fallas que ya deberían estar resueltas
Limitaciones en programación avanzada: No puede ejecutar código complejo directamente
Menor naturalidad inicial: Aunque se ha mejorado, aún se percibe más robotizado
Veredicto final
OpenAI se apresuró en el lanzamiento de un modelo que quizás no estaba completamente listo. Se creó mucha expectativa indicando que alcanzaría el nivel de un profesional con PhD, pero la realidad inicial fue diferente.
GPT-5 funciona bien para tareas rutinarias, y con la reactivación de GPT-4o, los usuarios pueden alternar entre modelos según sus necesidades específicas.
¿Recomendamos GPT-5?
Para tareas rutinarias: Sí, es una opción sólida
Para programación compleja: GPT-4o nos dio mejores resultados.
¿Has probado GPT-5? Comparte tu experiencia en los comentarios y cuéntanos qué tareas has realizado con este nuevo modelo de OpenAI.
Suscríbete ahora y recibe un regalo 🎁
Regístrate a nuestra newsletter para recibir las noticias más interesantes antes que cualquier persona. Recibirás gratis nuestro eBook: Prompt Engineering + 50 Ejemplos Prácticos.
Creado con © systeme.io • Política de Privacidad • Términos del servicio