Openai cambia para siempre la forma en la que interactuamos con la IA

Si estás de pie, siéntate porque vas a flipar.

OpenAI acaba de concluir su evento donde presentó las novedades de ChatGPT y… ¡vaya novedades!

Se marca un antes y un después en cómo vamos a interactuar con la tecnología a partir de ahora… ¿Has visto la película Her? Pues ya no es ciencia ficción.

Nuevo modelo: GPT-4 O

Empezamos por el principio: OpenAI lanza un nuevo modelo llamado GPT-4 O que, además, estará disponible para todos los usuarios, incluidos los gratuitos.

GPT-4 O, apodado “omni” por su capacidad omnimodal, está diseñado para procesar y responder a cualquier combinación de texto, audio e imágenes, permitiendo una interacción mucho más natural con la tecnología. Este modelo responde a entradas de audio en tan solo 232 milisegundos, con un tiempo de respuesta promedio similar al de una conversación humana, estableciendo un nuevo estándar en la interacción con IA.

Inicialmente, GPT-4 O se lanza con capacidades de texto e imagen, con planes para expandir sus funcionalidades de audio y vídeo. Esta fase de lanzamiento permite a OpenAI garantizar la infraestructura técnica y la seguridad necesarias para una implementación completa.

Los desarrolladores y usuarios disfrutarán de una mejora significativa en eficiencia, con un modelo que es el doble de rápido y a la mitad del costo que su predecesor.

Un nuevo paradigma

Lo que lo cambia todo es la interacción en tiempo real con la IA, tanto por texto, como por audio como por video.

Si, chatgpt en su versión de movil ya tenia la opcion de hablar por audio, pero no tiene nada que ver con lo que han presentado ahora.

Empiezo, ahora tu puedes hablar por voz tal cual hablarias con una persona, no tarda en responderte, lo hace en tiempo real, como lo haría una persona, si le interrumpes se calla y te escucha. Hasta ahora, el modo de voz de chatgpt funcionaba así:
Whisper te transcribia la voz pasandola a texto y dandole esto como input a chatgpt. Ahora ya no es así, este modelo esta entrenado realmente para entender el audio, por lo que, no solo entiende la voz, es capaz de entender ambientes, de saber tu estado de animo segun tu voz, de distinguir entre diferentes hablantes, y de entender sonidos de todo tipo. Como este de la presentación, que le decía que estaba nervioso y chatgpt le decia que respirara para tranquilizarte a lo que el presentador empieza a respirar muy fuerte, chatgpt entiende estos sonidos y le dice que tiene que respirar más lento.

Pero eso no es todo, ha mejorado muchisimo la voz de chatgpt, ahora es capaz de modularla en funcion de sus emociones, te puede hablar muy alegre, o mas triste, puede recitar un cuento y si le dices que lo haga más dramático enfatizará su voz para hacerlo. ¡Incluso puede cantar!

Estas nuevas capacidades desbloquean funciones como la traducción en tiempo real.

Le puedes decir que vas a hablar con un italiano pero que tu no lo entiendes, por lo que cuando este hable chatgpt lo traduzca al ingles, y cuando hables tu lo traduzca al italiano… ¡Todo esto en tiempo real, os lo recuerdo!

Pero eso no es todo, este modelo tambien entiende video en tiempo real, de loco.

En los ejemplos de la demostración habrían la cámara y se ponian a hacer calculos matemáticos y chatgpt les iba guiando en tiempo real.

O incluso si pones el modo selfie es capaz de identificar tus emociones.

Aplicación de Escritorio

Tambien han presentado la app de chatgpt para escritorio, permitiendote funciones como tener chatgpt siempre en segundo plano mientras trabajas y que en cualquier momento le puedas pasar cualquier cosa y te responda enseguida, incluso pudiendo compartir pantalla para que te ayude con cualquier cosa.

La nueva aplicación de escritorio para macOS de OpenAI facilita una integración más fluida con las actividades diarias del usuario. Próximamente, esta aplicación también estará disponible para Windows, extendiendo sus beneficios a un mayor número de usuarios.

GPT 4o gratuito para todos

Ahora, los usuarios gratuitos de ChatGPT también podrán disfrutar de las siguientes capacidades avanzadas:

  • Inteligencia a nivel de GPT-4: Experimenta respuestas rápidas y precisas.
  • Interacciones mejoradas: Desde analizar datos y crear gráficos hasta discutir fotos y cargar archivos para obtener ayuda en resúmenes y escritura.
  • Descubrimiento de GPTs y Tienda GPT: Explora y utiliza nuevos GPTs específicos para necesidades particulares.
  • Experiencia Enriquecida con Memoria: Construye una experiencia más útil recordando interacciones pasadas.

Los usuarios gratuitos tendrán un límite en el número de mensajes, pero en casos de alta demanda, se cambiará automáticamente a GPT-3.5 para asegurar que la conversación pueda continuar.

Hablar con un ordenador nunca se ha sentido natural… hasta ahora.

Una Nueva Cara para ChatGPT

Openai tambien ha revelado una nueva interfaz de ChatGPT que busca ser más amigable y conversacional, mejorando significativamente la interacción del usuario con la inteligencia artificial. No es un cambio drástico, pero se agradece.

Mas info en el blog de OpenAI

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies