OpenAI avanza cuando llegará para todos su IA Sora para generar imágenes
En una entrevista, la firma deja claro que este desarrollo será una realidad este mismo año
El mes pasado, el creador de ChatGPT, OpenAI, sorprendió al mundo con su último modelo de inteligencia artificial: un generador de texto a vídeo llamado Sora. Una demostración de la compañía dejaba que este desarrollo podría generar contenidos y simulaciones casi de forma impecable con objetos en movimiento simplemente con unas indicaciones escritas. Un gran avance que, por el momento, no se puso al alcance de todos.
Sin embargo, OpenAI se abstuvo de lanzar de inmediato, diciendo que sus desarrolladores siguen trabajando para lograr mejoras en el funcionamiento y detectar posibles peligros. El caso es que las cosas no están muy lejos de cambiar, ya que la directora de tecnología de OpenAI, Mira Murati, ha confirmado que Sora se lanzará este año para todos.
No hay muchos datos respecto al entrenamiento de la IA
En una entrevista con The Wall Street Journal, Murati confirmó que Sora se lanzará en los próximos meses, aunque se abstuvo de detallar un marco de tiempo más exacto. Del mismo modo, la ejecutiva parecía fue bastante cauta, se le preguntaba sobre los datos de entrenamiento para el impresionante modelo de inteligencia artificial. Simplemente, se limitó a indicar que la información utilizada para entrenar a la herramienta era públicamente accesible -o provenían de socios como Shutterstock-. Además, enfatizó que no iba a entrar en detalles más específicos sobre este tema.
Lo cierto es que la duda que existe en lo referente a los entrenamientos de cualquier inteligencia artificial es cada vez mayor. Se desconoce cómo los modelos de creación gestionan los datos que toman forma y, lo que es más importante, de dónde provienen estos y quién -o quiénes- son las personas que deciden lo que sí se utiliza y lo que no. Pero, por el momento, todas las compañías son muy celosas en dar información precisa a este respecto.
Llegada de Sora para todos
Una de las grandes dudas es el precio que podría tener el uso de esta IA. Hay que recordar que el CTO de OpenAI confirmó que Sora es muy costoso de ejecutar en este momento, pero la compañía está buscando optimizar este apartado y fijar un precio similar al modelo de texto a imagen DALL·E cuando el producto se lance oficialmente. Para aquellos que no lo saben, la generación de una imagen estándar en DALL·E 3 comienza en 0,04 dólares, mientras que una imagen en alta definición comienza en 0,08$. Habrá que ver cómo la compañía consigue esto, lo que sería rompedor frente a la competencia a la que le pondría las cosas muy complicadas.
Murati también señaló que OpenAI está buscando agregar más características a Sora en un futuro cercano, incluida la integración de audio -así como otras capacidades de edición de vídeo-. Dicho esto, aún no hemos visto una demostración de estas características por el momento, pero es natural esta evolución con el paso del tiempo. Queda por ver qué otras características incorporará la herramienta cuando se lance oficialmente, pero hay algo claro: esto sucederá en apenas unos meses… por lo que hay que prepararse para ello.
Sigue toda la información de Cinco Días en Facebook, X y Linkedin, o en nuestra newsletter Agenda de Cinco Días