OpenAI lanza Sora: un generador de vídeo de IA revolucionario

En un mundo cada vez más basado en videos, las herramientas de creación y edición de videos son cada vez más importantes. Sin embargo, el proceso de edición de vídeo sigue siendo complejo y requiere mucho tiempo, especialmente para los principiantes.

A medida que la velocidad del desarrollo de la IA avanza hacia un punto más allá de la comprensión humana, Sora de OpenAI para convertir indicaciones de texto en video es solo la última tecnología de IA que está conmocionando al mundo al darse cuenta de que las cosas están sucediendo antes de lo que nadie esperaba.

OpenAI Sora es una tecnología innovadora que tiene como objetivo convertir y editar videos de una manera eficiente e innovadora. Este modelo plantea interrogantes sobre el alcance de su impacto en la industria del vídeo y ¿contribuirá a cambiar para siempre la forma en que se produce y edita el vídeo? En este artículo, exploraremos el concepto de OpenAI Sora y sus capacidades potenciales, analizando cómo afectará a la industria del vídeo y qué podría significar esta innovación tanto para los usuarios como para los creadores. Verificar Los mejores generadores de video AI (texto a video).

OpenAI lanza Sora: un generador de vídeo de IA revolucionario - AI

¿Qué es OpenAI Sora?

Al igual que otros modelos de IA generativa como DALL-E y MidJourney, Sora toma tus indicaciones de texto y las convierte en un medio visual. Sin embargo, a diferencia de los generadores de imágenes impulsados por IA mencionados anteriormente, Sora crea un vídeo lleno de movimiento, diferentes ángulos de cámara, dirección y todo lo que esperarías de un vídeo producido tradicionalmente.

OpenAI lanza Sora: un generador de vídeo de IA revolucionario - AI

Mirando los ejemplos de sitio web de sora, los resultados suelen ser indistinguibles de los vídeos reales producidos profesionalmente. Todo, desde tomas con drones de alta gama hasta producciones cinematográficas multimillonarias con actores, creadas por inteligencia artificial, efectos especiales y obras de arte.

OpenAI lanza Sora: un generador de vídeo de IA revolucionario - AI

Por supuesto, Sora no es la primera tecnología en hacer esto. Con diferencia, el líder más visible en este ámbito ha sido PasarelaML, que presta sus servicios al público a cambio de una tarifa. Sin embargo, incluso en las mejores circunstancias, los vídeos de Runway están más cerca de las primeras generaciones que de las Imágenes fijas de MidJourney. No hay estabilización de imagen, la física no tiene sentido y mientras escribo este artículo, el clip más largo dura alrededor de 16 segundos.

Por el contrario, el mejor valor que Sora tiene para ofrecer es una estabilidad total, con una física que se siente bien (al menos para nuestro cerebro), y los clips pueden durar hasta un minuto. Los clips no tienen ningún audio, pero ya existen otros sistemas de IA que pueden generar musica Efectos de sonido y habla. Así que no tengo ninguna duda de que estas herramientas pueden integrarse en el flujo de trabajo de Sora o, en el peor de los casos, en el trabajo tradicional de locución y foley. Verificar Las herramientas de IA más interesantes e interesantes para ver.

No se puede subestimar el gran salto que representa Sora con respecto al video de pesadilla de IA de apenas un año antes de la demostración de Sora. Como el video de IA extremadamente inquietante de Will Smith comiendo espaguetis. Creo que esto supone un shock mayor para el sistema que cuando los generadores de imágenes de IA pasaron de ser una broma a provocar un temor existencial en los corazones de los artistas visuales.

Es probable que Sora afecte a toda la industria del vídeo, desde los creadores de una sola toma hasta el nivel de proyectos de gran presupuesto de Disney y Marvel. Nada sobrevivirá a esto. Creo que esto es especialmente cierto ya que Sora no tiene que crear cosas enteras, sino que puede trabajar con materiales existentes, como animar una imagen fija que usted haya proporcionado. Este podría ser el verdadero comienzo del cine con IA.

¿Cómo funciona Sora?

Profundizaremos en el personaje de Sora tanto como podamos, pero no es posible entrar en tantos detalles. En primer lugar, OpenAI, irónicamente, no es abierto sobre el funcionamiento interno de su tecnología. Es patentado, por lo que desconocemos en sus detalles más finos la salsa secreta que distingue a Sora de la competencia. En segundo lugar, no soy un científico informático, y tal vez usted no sea un científico informático, por lo que sólo podemos entender cómo funciona esta tecnología en términos amplios y generales.

La buena noticia es que existe un excelente tutorial de Sora (suscripción protegida) de mike joven En Medio, basado en Informe técnico de OpenAI El cual ha sido detallado para que nosotros, la gente común y corriente, podamos entenderlo. Si bien vale la pena leer ambos documentos, aquí podemos extraer los hechos más importantes.

Sora se basa en las lecciones que OpenAI aprendió al crear modelos como ChatGPT o DALL-E. OpenAI inventó cómo entrenar a Sora con videos de muestra segmentando estos videos en "parches" que son similares a los "tokens" utilizados por el modelo de entrenamiento ChatGPT. Dado que estos tokens son todos del mismo tamaño, a Sora no le importan cosas como la duración del clip, la relación de aspecto y el tamaño de la resolución.

Sora utiliza el mismo enfoque de transformador amplio que impulsa GPT combinado con el método de propagación utilizado por los generadores de imágenes de IA. Durante el entrenamiento, observa tokens de parche parcialmente propagados a partir de un video e intenta predecir cómo se vería un token sin ruido. Al comparar esto con la verdad básica, el modelo aprende el "lenguaje" del vídeo. Por eso los ejemplos de sitio web de sora Parece muy original.

Aparte de esta increíble habilidad, Sora también tiene anotaciones integradas muy detalladas para los cuadros de video en los que ha sido entrenado, lo cual es en gran parte la razón por la que puede editar los videos que crea basándose en indicaciones de texto.

La capacidad de Sora para simular con precisión la física en videos parece ser una característica emergente, que simplemente resulta de su entrenamiento en millones de videos que contienen movimiento basado en la física del mundo real. Sora tiene una excelente estabilidad del objeto, de modo que cuando el objeto sale del marco o es obstruido por algo más dentro del marco, permanece allí y regresa sin ninguna perturbación.

Sin embargo, a veces todavía hay problemas cuando los objetos en el video interactúan con la causalidad y con la creación automática de objetos. Además, algo gracioso, Sora parece confundir izquierda y derecha de vez en cuando. Sin embargo, lo que se ha demostrado hasta ahora no sólo es realmente utilizable, sino que ciertamente está a la vanguardia de la tecnología.

¿Cuándo es accesible Sora?

Entonces, todos estamos muy emocionados de probar Sora, y pueden garantizar que lo usaré y escribiré sobre exactamente qué tan buena es esta tecnología cuando no nos muestra resultados precisos, pero cuando podría hacerlo, lo hará. ¿eso pasa?

Al momento de escribir este artículo, no está claro exactamente cuánto tiempo pasará antes de que Sora esté disponible para el público en general, o cuánto costará acceder a él. OpenAI dijo que el modelo está en manos del "Equipo Rojo", un grupo de personas cuyo trabajo es tratar de hacer que Sora haga todas las cosas malas que se supone que no debe hacer, y luego ayudar a levantar barreras contra ese tipo de cosas. La cosa sucede cuando los clientes reales pueden usarlo. Esto incluye la posibilidad de crear información engañosa, crear material ofensivo u ofensivo y muchas otras violaciones que uno podría imaginar.

Al momento de escribir este artículo, también está en manos de creadores de contenido selectos, lo cual creo que es para fines de prueba y para obtener revisiones y aprobaciones de terceros mientras estamos en el camino hacia su lanzamiento final.

La conclusión es que en realidad no sabemos cuándo estará disponible, de la misma manera que puedes pagar para usar DALL-E 3 y, de hecho, ni siquiera OpenAI tiene una fecha exacta todavía. Esto se debe simplemente a que si está en manos de evaluadores de seguridad, pueden descubrir problemas que tardarán más de lo esperado en solucionarse, lo que retrasará el lanzamiento público.

El hecho de que OpenAI se sienta listo para mostrar a Sora e incluso hacer algunas afirmaciones públicas coordinadas a través de Safety detectado, nadie lo puede asegurar. Creo que estamos hablando de meses, no de años, pero no esperen que eso suceda la próxima semana. Puedes ver ahora Herramientas éticas de IA para artistas y creadores.

¿Qué es OpenAI Sora?

¿Cómo funciona Sora?

¿Cuándo es accesible Sora?

Razones por las que me extraño los eventos de juegos locales (LAN) con mis amigos en la vida real

¿Pueden las tarjetas gráficas AMD ofrecer compatibilidad total con trazado de rayos?

Artículos relacionados