Vistas de página en total

jueves, 15 de febrero de 2024

OpenAI acaba de revelar un nuevo software que le permite crear videos realistas simplemente escribiendo una oración descriptiva

 

OpenAI acaba de revelar un nuevo software que le permite crear videos realistas simplemente escribiendo una oración descriptiva

SHARE
PUNTOS CLAVE
  • OpenAI anunció el jueves que se ha expandido más allá del texto y las imágenes para ofrecer IA para generación de video por primera vez.
  • El nuevo modelo, llamado Sora, permite al usuario escribir una escena deseada y convertirla en un videoclip de alta definición.
  • Los videos generados por IA crean otro obstáculo para las plataformas preocupadas por la desinformación, especialmente ahora que este año se programan elecciones importantes en todo el mundo.

En este articulo

A Samoyed and a Golden Retriever dog are playfully romping through a futuristic neon city at night.
Un samoyedo y un perro golden retriever corren juguetonamente por una ciudad futurista de neón por la noche.
Abierto AI

OpenAI, que irrumpió en la corriente principal el año pasado gracias a la popularidad de ChatGPT, está llevando su tecnología de inteligencia artificial al vídeo.

La compañía presentó el jueves Sora , su nuevo modelo de IA generativa. Sora funciona de manera similar a la herramienta de inteligencia artificial de generación de imágenes de OpenAI, DALL-EUn usuario escribe la escena deseada y Sora le devolverá un videoclip de alta definición. Sora también puede generar videoclips inspirados en imágenes fijas y ampliar vídeos existentes o completar fotogramas faltantes.

El vídeo podría ser la próxima frontera de la IA generativa ahora que los chatbots y los generadores de imágenes se han abierto camino en el mundo de los consumidores y los negociosSi bien las oportunidades creativas entusiasmarán a los entusiastas de la IA, las nuevas tecnologías presentan graves problemas de desinformación a medida que se acercan las principales elecciones políticas en todo el mundo. La cantidad de deepfakes generados por IA ha aumentado un 900% año tras año, según datos de Clarity, una empresa de aprendizaje automático.

Con Sora, OpenAI busca competir con herramientas de IA de generación de vídeo de empresas como Metagoogle, que anunció Lumiere en enero . Otras empresas emergentes ofrecen herramientas de inteligencia artificial similares, como Stability AI, que tiene un producto llamado Stable Video Diffusion. Amazonastambién lanzó Create with Alexa, un modelo que se especializa en generar contenido infantil animado de formato corto basado en indicaciones.

Actualmente, Sora se limita a generar videos de un minuto de duración o menos. OpenAI, respaldado por Microsoft, ha hecho de la multimodalidad (la combinación de generación de texto, imágenes y videos) un objetivo en su esfuerzo por ofrecer un conjunto más amplio de modelos de IA.

“El mundo es multimodal”, dijo a CNBC el director de operaciones de OpenAI, Brad Lightcapen noviembre . “Si piensas en la forma en que nosotros, como seres humanos, procesamos el mundo y nos relacionamos con él, vemos cosas, oímos cosas, decimos cosas: el mundo es mucho más grande que el texto. Así que para nosotros, siempre nos pareció incompleto el texto y El código debe ser las modalidades únicas, las interfaces únicas que podríamos tener para determinar cuán poderosos son estos modelos y qué pueden hacer”.

Hasta ahora, Sora sólo ha estado disponible para un pequeño grupo de evaluadores de seguridad, o “equipos rojos”, que prueban el modelo en busca de vulnerabilidades en áreas como la desinformación y el sesgo. La compañía no ha publicado ninguna demostración pública más allá de 10 clips de muestra disponibles en su sitio web, y dijo que el documento técnico que lo acompaña se publicará más tarde el jueves.

OpenAI también dijo que está construyendo un “clasificador de detección” que puede identificar videoclips generados por Sora y que planea incluir ciertos metadatos en su salida que deberían ayudar a identificar el contenido generado por IA. Es el mismo tipo de metadatos que Meta busca utilizar para identificar imágenes generadas por IA este año electoral.

Sora es un modelo de IA de difusión que, al igual que ChatGPT, utiliza la arquitectura Transformer, presentada por investigadores de Google en un artículo de 2017.

“Sora sirve como base para modelos que pueden comprender y simular el mundo real”, escribió OpenAI en su anuncio.

MIRAR: OpenAI está en el camino hacia un ‘verdadero avance tecnológico’

OpenAI está en el camino hacia un 'verdadero avance tecnológico' con AGI, dice Geoff Lewis de Bedrock
VÍDEO 05:37
OpenAI está en el camino hacia un ‘verdadero avance tecnológico’ con AGI, dice Geoff Lewis de Bedrock

No

No hay comentarios:

Publicar un comentario