Sora: Meta afirma que IA de vídeos da OpenAI está fadada ao fracasso
Desde que foi apresentado pela OpenAI, Sora, o novo modelo gerador de vídeos com base em comandos de texto, tem impressionado por seus resultados ultrarrealistas. Vários vídeos circularam nas redes sociais para demonstrar o poder da ferramenta, que parece bem mais avançada que outros geradores de vídeo populares.
Outra aplicação que vem sendo considerada e pode ser amplamente explorada pelos criadores no futuro é no setor audiovisual, na criação de efeitos, cenários ou ambientes mais fiéis à realidade em filmes ou séries, por exemplo. No entanto, há o temor de que a tecnologia possa acabar com empregos de algumas categorias profissionais do segmento.
Yann LeCun, cientista-chefe de IA da Meta, no entanto, não parece muito empolgado com o Sora. Para ele, a proposta de tentar simular de forma fiel elementos do mundo real, o que é muito mais complexo do que simplesmente compreender e gerar texto, está “fadada ao fracasso”.
Segundo o cientista, considerado uma das figuras mais proeminentes do setor de IA, chatbots de texto têm sido um sucesso até aqui porque a linguagem escrita possui uma quantidade finita de símbolos e sinais a serem processados. Em contrapartida, a geração de vídeos lida com um número muito maior de variáveis imprevisíveis.
Meta desenvolve modelo capaz de aprender assistindo vídeos
Embora o trabalho de LeCun não tenha a mesma repercussão dos lançamentos da OpenAI, ele segue conseguindo avanços bem interessantes com a equipe de IA da Meta. Recentemente, a empresa revelou o modelo V-JEPA (Video Joint Embedding Predictive Architecture), capaz de “aprender” a assistindo vídeos.
A intenção da empresa era desenvolver um novo modelo que pudesse aprender e evoluir como humanos. Internamente, existe bastante otimismo em torno da ferramenta, considerada um passo fundamental no desenvolvimento da chamada inteligência artificial geral — que seria capaz de superar a inteligência humana.
LeCun acredita fortemente que a incapacidade de modelos de empresas concorrentes de aprendizado por imagens e sons está limitando consideravelmente o potencial da evolução da IA e, neste momento, a Meta pode ter conseguido, finalmente, superar esta barreira.