El lanzamiento de ChatGPT cautivó a los usuarios con sus impresionantes capacidades de lenguaje natural, basándose en el modelo de lenguaje GPT-3.5 previamente establecido. Sin embargo, la llegada del tan esperado GPT-4 transformó las expectativas sobre la inteligencia artificial, siendo reconocido como un vistazo temprano hacia la inteligencia general artificial (AGI).
¿Qué es GPT-4?
GPT-4 es el último modelo de lenguaje de OpenAI, capaz de generar texto que se asemeja al habla humana. Este modelo mejora la tecnología de ChatGPT, pasando de GPT-3.5 a un sistema más avanzado. "Generative Pre-trained Transformer" o GPT, se refiere a la arquitectura de aprendizaje profundo que utiliza redes neuronales artificiales para emular la escritura similar a la humana.
OpenAI destaca que GPT-4 supera a ChatGPT en tres áreas cruciales: creatividad, entrada visual y manejo de contextos más largos. En términos de creatividad, GPT-4 destaca en la generación y colaboración en proyectos de diversos formatos, incluyendo música, guiones, escritura técnica, e incluso adaptándose al estilo único del usuario.
La capacidad para procesar contextos más largos también es significativa. GPT-4 puede manejar hasta 128,000 tokens de entrada del usuario y puede interactuar con texto de enlaces web, lo que mejora su capacidad para producir contenido extenso y mantener conversaciones prolongadas.
Además, GPT-4 puede procesar imágenes, lo que le permite responder a indicaciones visuales. Por ejemplo, puede analizar una foto de ingredientes de repostería y sugerir recetas basadas en lo que observa. Sin embargo, no está claro si la entrada de video es compatible de la misma manera.
Es importante mencionar que GPT-4 ha sido diseñado para mejorar la seguridad de manera significativa en comparación con su predecesor. Internamente, reportedly ofrece un 40% más de respuestas fácticas y es un 82% menos propenso a interactuar con solicitudes de contenido prohibido. Este avance se basa en un amplio entrenamiento que incorpora retroalimentación humana y colaboración con más de 50 expertos, especialmente en seguridad y salvaguarda de IA.
En las semanas posteriores a su lanzamiento, los usuarios demostraron aplicaciones notables de GPT-4, como la creación de nuevos idiomas, el diseño de animaciones complejas e incluso la programación de una versión funcional de Pong en solo sesenta segundos utilizando HTML y JavaScript.
¿Cómo usar GPT-4?
GPT-4 está disponible para todos los usuarios en los niveles de suscripción de OpenAI. Los usuarios de la modalidad gratuita tienen acceso limitado: aproximadamente 80 chats en un lapso de tres horas, tras los cuales son trasladados a la menos capaz GPT-4o mini hasta que se reinicie el tiempo de espera. Para mejorar el acceso a GPT-4 y generar imágenes con DALL-E, los usuarios pueden optar por la suscripción ChatGPT Plus a $20 por mes. La actualización es sencilla: solo deben hacer clic en “Actualizar a Plus” en la barra lateral dentro de ChatGPT, ingresar los detalles de la tarjeta de crédito y alternar entre GPT-4 y modelos de lenguaje anteriores.
Para aquellos que dudan en suscribirse, Bing Chat de Microsoft ofrece una forma de experimentar las capacidades de GPT-4 de forma gratuita. Microsoft integra GPT-4 en Bing Chat, aunque algunas características pueden faltar y el servicio incluye mejoras patentadas de Microsoft. Si bien Bing Chat es gratuito, está limitado a 15 chats por sesión y 150 sesiones diarias.
Una variedad de otras aplicaciones también están aprovechando GPT-4, incluyendo Quora, una popular plataforma de preguntas y respuestas.
¿Cuándo se lanzó GPT-4?
GPT-4 fue presentado oficialmente el 13 de marzo, tras la confirmación previa de Microsoft. Inicialmente disponible para suscriptores de ChatGPT Plus y a través de Microsoft Copilot, GPT-4 también es accesible como API para desarrolladores. Empresas como Duolingo, Be My Eyes, Stripe y Khan Academy ya han integrado GPT-4 en sus servicios. La primera demostración pública de las capacidades de GPT-4 fue transmitida en vivo por YouTube.
¿Qué es GPT-4o Mini?
GPT-4o mini es la última iteración de la línea de modelos GPT-4 de OpenAI, optimizada para tareas simples y de alto volumen que priorizan la velocidad de inferencia rápida sobre las capacidades del modelo completo. Lanzado en julio de 2024, GPT-4o mini ha reemplazado a GPT-3.5 como el modelo predeterminado una vez que los usuarios superan su límite de tres horas de consultas con GPT-4o.
¿Es GPT-4 mejor que GPT-3.5?
Anteriormente, la versión gratuita de ChatGPT se basaba en GPT-3.5. Sin embargo, desde julio de 2024, ChatGPT opera en GPT-4o mini, que demuestra un rendimiento superior incluso en comparación con GPT-3.5 Turbo. Comprende y responde de manera más completa a más consultas, ofrece salvaguardias adicionales, proporciona respuestas concisas y es un 60% más rentable de operar.
La API de GPT-4
Para los desarrolladores, GPT-4 está disponible como una API, siempre que hayan realizado al menos un pago exitoso a OpenAI anteriormente. La API abarca varias versiones de GPT-4 junto con modelos heredados de GPT-3.5. OpenAI anunció que, aunque GPT-3.5 seguirá siendo accesible, eventualmente será descontinuado, aunque no se ha decidido un cronograma específico para esta transición.
La API está diseñada principalmente para desarrolladores que crean nuevas aplicaciones, pero algunos usuarios han experimentado confusión. Por ejemplo, Plex facilita la integración de ChatGPT en su reproductor de música Plexamp, requiriendo una clave de API de ChatGPT separada de ChatGPT Plus. Por lo tanto, es necesario registrarse para obtener una cuenta de desarrollador para acceder a la API.
¿Está empeorando GPT-4?
Si bien GPT-4 recibió elogios iniciales tras su lanzamiento, algunos usuarios han informado una disminución en la calidad de las respuestas en los meses posteriores. Observaciones de figuras notables en la comunidad de desarrollo han surgido, lo que ha llevado a discusiones en los foros de OpenAI. Un ejecutivo de OpenAI sostiene que estas preocupaciones son en gran parte infundadas, argumentando que cualquier declive percibido es meramente subjetivo y afirmando que las versiones más recientes del modelo están en constante mejora.
Sin embargo, un estudio sugiere que puede haber verdad en estas preocupaciones, ya que notó una disminución en la precisión del 97.6% en marzo al 2.4% en junio. Aunque este hallazgo no es concluyente, respalda afirmaciones de que los usuarios están experimentando cambios reales en el rendimiento.
¿Dónde está la entrada visual en GPT-4?
Una de las características más anticipadas de GPT-4 es su capacidad para procesar entradas visuales, transformando a ChatGPT en un modelo realmente multimodal. Subir imágenes para su análisis es tan simple como adjuntar documentos; los usuarios solo necesitan hacer clic en el ícono de clip en la ventana de contexto, seleccionar la fuente de la imagen y adjuntar la imagen para recibir interacciones significativas.
¿Cuáles son las limitaciones de GPT-4?
A pesar de las afirmaciones de OpenAI sobre los avances de GPT-4, el modelo aún enfrenta ciertas limitaciones. Al igual que sus predecesores, GPT-4 lidia con problemas relacionados con sesgos sociales, inexactitudes y desafíos presentados por indicaciones adversarias. Por lo tanto, no es infalible. Numerosos casos en línea destacan estas deficiencias, sin embargo, OpenAI asegura que continúa trabajando en resolver dichos problemas. En general, GPT-4 es menos propenso a inventar información en comparación con modelos anteriores.
Otra limitación notable es que los datos de entrenamiento de GPT-4 solo cubren información disponible hasta diciembre de 2023, mientras que GPT-4o y 4o mini tienen un límite en octubre de 2023. A pesar de esto, las capacidades de búsqueda web de GPT-4 le permiten localizar y recuperar información más reciente de internet. Con el lanzamiento de GPT-4o, los usuarios pueden anticipar el próximo modelo GPT-5.