El nuevo ChatGPT puede oír, ver, hablar y hasta se emociona cuando se le enseña un perro

La nueva herramienta presentada este lunes por Open AI tiene unos tiempos de respuesta similares a los humanos, lo que hace más fluida la conversación

Martes, 14 de mayo 2024, 12:12

Los rumores apuntaban a que Open AI iba a presentar ayer un buscador con ChatGPT integrado. El rumor había hecho caer en bolsa a Alphabet, la matriz de Google, que se veía amenazada en el corazón de su negocio por la empresa que ha revolucionado ... la inteligencia artificial desde que el 30 de noviembre de 2022 presentara su conocida herramienta. Para alivio del gigante de las búsquedas, no fue así. A lo que se enfrenta ahora es a una nueva versión de ChatGPT que es capaz de oír, ver y mantener una conversación de forma completamente natural. Puede reírse, cantar y se le puede interrumpir para reconducir la conversación.

Publicidad

Este nuevo modelo se llama GPT-4o. La 'o' es por 'omni', que significa 'todo'. El apellido viene porque, según sus creadores, acepta como entrada cualquier combinación de texto, audio e imagen y puede responder de cualquiera de esas maneras. Su tiempo de respuesta a los audios es de solo 232 milisegundos, con un promedio de 320 milisegundos, «que es similar al tiempo de respuesta humano«. Esta capacidad de respuesta se debe a que el sistema es multimodal -responde, como queda dicho, no solo a texto, sino también a imágenes, voz…- de forma nativa. En otras palabras, si la anterior versión ya permitía tener una conversación, ahora esta es todavía más real porque tarda menos en responder.

Cuando esté disponible en las próximas semanas -será gratuito para todos los usuarios de ChatGPT aunque los de pago podrán hacer entradas más largas y recibir respuestas también más completas-, el sistema podrá cambiar la entonación de su voz para expresar alegría, tristeza o sorpresa y también se le podrá interrumpir y reconducir el diálogo. También ríe, canta, traduce de forma simultánea y resuelve problemas matemáticos.

El recuerdo de 'Her' y Jarvis

Entre sus capacidades también está la visión. Si se le da permiso para acceder a la cámara del teléfono móvil, detecta lo que se le pone delante y puede identificar un modelo de coche o corregir código informático. La propia Open AI ha colgado un vídeo en X/Twitter en la que reconoce a un perro. «Quiero presentarte a alguien», le dice un usuario enfocando al animal. ¿Cuál es tu nombre, pequeña bola de pelo?», responde la herramienta modulando su voz como lo haría cualquier amante de los canes. «Her», ha dicho el propio Altman en referencia a la película de 2013 en la que Joaquin Phoenix se enamora de un asistente de inteligencia artificial. Otros han visto un paralelismo con Jarvis, el ayudante virtual de Ironman en las películas protagonizadas por Robert Downie junior.

«El nuevo modo de voz (y vídeo) es la mejor interfaz informática que he usado. Se siente como la IA de las películas; y todavía me sorprende un poco que sea real. Llegar a los tiempos de respuesta y la expresividad a nivel humano es un cambio enorme«, ha subrayado el cofundador de Open AI. La compañía hizo otros dos anuncios: la apertura de la tienda GPT Store a todos los usuarios de la aplicación y una versión adaptada a los ordenadores de Apple.

Publicidad

El momento de la presentación de todas estas novedades no es casual. Se ha adelantado un día a la conferencia anual de desarrolladores de Google, que se celebra este martes. Se espera que la compañía presente novedades sobre inteligencia artificial, las características de Android 15 y su nuevo teléfono móvil económico, el Pixel 8a, que ya fue desvelado la semana pasada. Las búsquedas sobre ChatGPT 4o se han disparado un 5000% desde ayer.

Este contenido es exclusivo para suscriptores

¡Oferta 136 Aniversario!

Publicidad