Sora: La última IA de OpenAI
febrero 19, 2024Sora crea videos coherentes de varios segundos de duración a partir de descripciones de textos y pone el foco en los peligros de la IA como una herramienta de desinformación.
Por ejemplo, Dall-E tiene la capacidad de crear imágenes indistinguibles de una fotografía, ChatGPT responde como lo haría un ser humano, en OpenAI, la empresa que está detrás de estas inteligencias artificiales, le faltaba conquistar el video, ahora presume haberlo logrado.
La última herramienta de inteligencia artificial de la compañía es Sora, un modelo que tiene la capacidad de crear secuencias de elevada fidelidad, a partir de una descripción de texto.
Ventajas de Sora
Sora tiene la capacidad de generar escenas complejas donde existen múltiples personajes, movimientos, detalles precisos del sujeto y el fondo, el modelo entiende no solo lo que el usuario ha pedido, sino como son las cosas en el mundo real, explican desde OpenAI.
Este no es el primer motor generativo que trata de conseguir escenas en movimiento, pero hasta los momentos los resultados de las alternativas dejaban bastante que desear.
Herramientas como Dall-E, Mid Journey o Imagen son capaces de crear imágenes estáticas realistas, es difícil para una inteligencia artificial, mantener coherencia de los diferentes elementos en una secuencia de video.
Los resultados pueden llegar a ser cómicos, carne de memes, a las manos les crecen dedos, la ropa cambia de color e incluso de talla y corte, un video especialmente gracioso que circula por la red muestra una recreación del actor Will Smith comiendo espagueti, donde esta pasta parece tener vida propia.
Fallos de Sora
Sora tiene fallos, pero logra escenas mucho más realistas que la inmensa mayoría, es más importante, de mayor duración, hasta de un minuto, los videos tienen una buena resolución, equivalente a 1080p.
Algunos de los ejemplos de OpenAI muestra en su web, que son realmente sorprendentes, si uno no se fija en los detalles, son indistinguibles de un video real.
El motor consigue crear escenas convincentes de animación tridimensional o mezclar objetos realistas con otros claramente generados por ordenador.
En cuanto al realismo de los resultados, vuelve a poner el foco en el potencial de estas herramientas en campañas de desinformación, es relativamente sencillo crear escenas que pueden parecer reales pero que sin imaginarias.
Mucho más de lo que es posible conseguir hasta ahora con diversas herramientas de edición de videos y audios.
Hasta los momentos OpenAI no ha activado la herramienta a cualquier usuario, solo a un reducido número de académicos, profesionales y un equipo de seguridad encargado de buscar posibles fallos tendrá acceso a Sora en sus primeras versiones.
El modelo tiene además las mismas limitaciones que Dall-E, el motor generativo de imágenes estáticas, no puede generar videos de personal reales o con contenido sexual o violento.
Desde OpenAI, se busca dialogar con políticos, educadores y artistas de diversos lugares del mundo, para comprender sus inquietudes e identificar casos de uso positivos para esta nueva tecnología.
Cada día salen al mercado una serie de programas, que buscan, mediante la Inteligencia Artificial, crear imágenes tan reales, que las personas no sepan si fueron reales o realizadas con aplicaciones como Sora.