En este articulovamos a repasar lo mejor que nos ha dejado la inteligencia artificial este 2023 y vamos a intentar predecir lo que va a llegar en 2024.
¿Que puedes esperar en cuanto a inteligencia artificial este 2024?
El año 2023 ha sido un año de grandes avances en el campo de la inteligencia artificial. Hemos visto el lanzamiento de nuevos modelos de lenguaje cada vez más potentes, como GPT-4, Gemini y Claude, que son capaces de generar texto que es indistinguible del escrito por humanos. También hemos visto el desarrollo de nuevos generadores de imágenes, como Dall-E 3, Midjourney v6 y Firefly, que pueden crear imágenes realistas a partir de descripciones textuales. Además, hemos asistido a la aparición de los primeros generadores de vídeo, como Pika, Runway y Stable Video Diffusion, que pueden crear vídeos realistas a partir de guiones o descripciones textuales.
Pero esto es solo la punta del iceberg. Hoy quiero hacer de Nostradamus e intentar adivinar lo que se viene este 2024 en cuanto a IA.
Edición de imágenes
En 2024, la IA continuará avanzando a un ritmo acelerado. Una de las tendencias más importantes será el control por lenguaje natural. Esto significa que podremos interactuar con los sistemas de IA simplemente hablando con ellos. Es probable que veamos editores de imágenes que funcionen con lenguaje natural, como el presentado recientemente por Meta con EmuEdit. Imagina un Photoshop que trabaje solo con el habla sin que tengas que tocar ninguna herramienta, que le subas una foto y le digas qué hacer y lo veas en tiempo real.
Generadores de imágenes
Y hablando de tiempo real, va a ser otro de los retos de este año, como ya hemos visto con herramientas como Krea Ai o Stable Diffusion XL turbo, vamos a poder hacer video llamadas con deepfakes en tiempo real, editar en tiempo real y seguir generando imágenes al momento, de hecho, la gente de Midjourney ha dicho que para finales de 2024 esperan poder generar imágenes espectaculares a 60 fps. ¡Impresionante! Otra cosa en la que sabemos que están trabajando es en la coherencia de personajes, ya que es muy complicado hacer el mismo personaje o el mismo escenario en varias generaciones, probablemente esto sea un problema del que nos olvidemos en 2024 con herramientas como Dall-E 4, las nuevas versiones de Midjourney, Stable Diffusion, etc.
Generación de video
En cuanto a generación de vídeo, la cosa pinta muy bien. Este año hemos vivido su nacimiento y en 2024 toca su desarrollo. Veremos cómo Midjourney está empezando a entrenar su modelo de generación de vídeos (que si tiene la misma calidad que su generador de imágenes, vamos a flipar en colores). Pika acaba de nacer con su versión 1.0 y ya hace cosas espectaculares como expansión de lienzos, inpainting en vídeo, etc. Esto es algo que en breve incorporarán las herramientas de Runway ML. Y no solo eso, ya que veremos el nacimiento de nuevas herramientas, como la que está preparando Google, VideoPoet. Veremos vídeos con sonido por primera vez, sincronización labial con voces e incluso edición de vídeos ya grabados. Podremos hacer cortometrajes enteros consistentes y con calidad solamente con inteligencia artificial.
Edición de vídeo
A esto se añade el lanzamiento de Adobe Firefly for Video, anunciado hace unos meses y originalmente esperado para finales de 2023, pero que finalmente se estrenará en algún momento de 2024. Estas herramientas de IA para vídeo simplificarán enormemente nuestra vida. Con ellas, podremos realizar tareas como añadir recursos visuales automáticamente a nuestros vídeos, generar subtítulos con distintos estilos, incorporar música y efectos de sonido al instante y acordes al contenido de nuestro vídeo. Además, incluye herramientas que, a partir de un guión, crean un storyboard o incluso una animática en 3D. La perspectiva es fascinante.
Modelos de Lenguaje
Ahora, lo que nos interesa, en 2024 es muy probable que veamos GPT 5 y modelos similares, potentísimos que seguirán sorprendiéndonos, multimodales incluso con vídeo como Gemini y posiblemente con menor tiempo de respuesta y con muchísimo más contexto. Lo que sí que tendremos en breve confirmado es Gemini Ultra, presumiblemente el modelo de lenguaje más potente hasta la fecha.
La GPT store tambien saldrá a principios de año y puede ser super interesante.
Generación de 3D
En el mundo del 3D, el Gaussian Splatting continuará siendo relevante, con la proliferación de videos en 4D y la capacidad de alterar la iluminación, los ángulos e incluso los movimientos de cámara en postproducción. Veremos herramientas asombrosas como Simulon, que sale a principios de año para iOS. Esta aplicación, una de las más impresionantes que he visto, incorpora elementos 3D a tus vídeos con un seguimiento y una interpretación de la iluminación nunca antes vistos, mucho más potente que herramientas como Wonder Dynamics.
El 2024 parece ser el punto de partida para la expansión de herramientas de texto a 3D. El equipo de Midjourney ya ha anunciado esta tendencia, y estamos viendo los primeros indicios con herramientas como Genie de Lumalabs, que muestran resultados sumamente potentes.
VideoJuegos
Tambien es probable que veamos muchas mas herramientas de IA en el ambito de los videojuegos, ya hay varias herramientas como NVIDIA ACE for Games o Replica Smart NPCs que hacen que los NPCs hablen contigo en tiempo real por voz y texto usando IA siempre teniendo en cuenta el contexto del videojuego, el objetivo de la misión y la personalidad del personaje.
Por supuesto, estas son solo algunas de las tendencias que podemos esperar en 2024. Sin duda, habrá muchas otras sorpresas que nos esperan en el campo de la inteligencia artificial pero si no te quieres perder ninguna, ¡ya sabes donde encontrar todas las novedades!.
Espero que sigais viendonos este 2024. ¡Felices fiestas!