OpenAI tem um novo gerador de vídeo chamado Sora
OpenAI apresentou Sora, seu principal gerador de texto para vídeo, apresentou na quinta-feira vídeos lindos e surpreendentemente realistas mostrando os recursos do modelo de IA. Sora está agora disponível para um pequeno número de pesquisadores e criativos que testarão o modelo antes de um lançamento público mais amplo, o que poderá significar um desastre para a indústria cinematográfica e nosso problema coletivo de deepfake.
“Sora é capaz de gerar cenas complexas com vários personagens, tipos específicos de movimento e detalhes precisos do assunto e do fundo”, disse OpenAI em um comunicado. entrada do blog. “O modelo entende não apenas o que o usuário solicitou na mensagem, mas também como essas coisas existem no mundo físico”.
A OpenAI não informou quando Sora será lançado ao público.
Sora é a primeira incursão da OpenAI na geração de vídeo de IA, somando-se ao texto e à tecnologia de IA da empresa. geradores de imagensBate-papoGPT e Dall-E. É único porque é menos uma ferramenta criativa e mais um “mecanismo de física baseado em dados,”conforme observado pelo Dr. Jim Fan, pesquisador sênior da Nvidia. Sora não apenas gera uma imagem, mas também determina a física de um objeto em seu ambiente e gera um vídeo com base nesses cálculos.
Para gerar vídeos com Sora, os usuários podem simplesmente digitar algumas frases como uma mensagem, muito parecido com os geradores de imagens de IA. Você pode escolher entre um estilo fotorrealista ou animado, produzindo resultados impressionantes em apenas alguns minutos.
Sora é um modelo de difusão, o que significa que ele gera vídeo começando com um vídeo borrado e cheio de estática e suavizando-o lentamente até obter as versões polidas que você vê abaixo. Os geradores de imagem e vídeo Midjourney e Stable Diffusion também são modelos de difusão.
Porém, devo ressaltar que o Sora da OpenAI é muito melhor. Os vídeos que Sora produz são mais longos, mais dinâmicos e fluem melhor que os da concorrência. Sora parece criar vídeos reais, enquanto os modelos concorrentes parecem imagens de IA em stop motion. A OpenAI mais uma vez explodiu outro campo da IA com um gerador de vídeo que envergonha a concorrência.
Os vídeos produzidos por Sora são sem dúvida incríveis. Esses vídeos levariam horas para serem produzidos por uma equipe de filmagem ou animadores reais. É provável que Sora seja perturbador para a indústria cinematográfica da mesma forma que o ChatGPT e os geradores de imagens de IA conquistaram o mundo editorial e do design. É uma tecnologia notável e ao mesmo tempo assustadora em termos de segurança no emprego para criadores de vídeo.
A OpenAI diz que há alguns ajustes a serem feitos, incluindo a falta de compreensão de causa e efeito. Sora pode gerar um vídeo de uma pessoa mordendo um biscoito, mas depois o biscoito pode não ter marca de mordida. A OpenAI também afirma que o modelo carece de consciência espacial. Você pode confundir esquerda e direita e não entender como uma pessoa ou objeto interage com uma cena.
A segurança também é uma preocupação primordial, especialmente dado como a tecnologia de IA tem sido abusada para criar deepfakes nos últimos meses. A OpenAI afirma que criará ferramentas para ajudar a detectar conteúdo enganoso, bem como aplicará tecnologias existentes que rejeitam mensagens de texto prejudiciais. No entanto, dadas as formas como as pessoas contornaram as proteções dos atuais modelos de IA, é questionável o sucesso destes esforços.
Sora é tão impressionante quanto assustador, e está claro como este poderoso gerador de vídeo de IA pode perturbar a indústria cinematográfica e criar resultados prejudiciais. Imagine se o Os deepfakes de Taylor Swift eram vídeos. Ou e se o Telefonema ultra-falso de Joe Biden para eleitores de New Hampshire Foi uma mensagem fotorrealista do Salão Oval? Sora ainda não está disponível publicamente, mas as implicações de uma tecnologia tão poderosa precedem o seu lançamento.
Este artigo apareceu originalmente no Gizmodo.