
Nova IA da Apple transforma fotos em cenas 3D
Pesquisadores de inteligência artificial (IA) da Apple desenvolveram um modelo capaz de transformar fotos estáticas em vídeos 3D. A novidade em questão é o Matrix3D. A gigante de Cupertino, em parceria com a Universidade de Nanquim, da China, e a Universidade de Ciência e Tecnologia, de Hong Kong, desenvolveu a novidade.
O resultado final, que foi devidamente documentado no GitHub, impressiona bastante pelo nível de detalhe. Ainda não se sabe exatamente como a Apple vai aproveitar esta tecnologia no futuro. Porém, ela parece muito promissora e agradou bastante internamente e também entre os estudiosos de IA.
Durante o processo de treinamento, os pesquisadores envolvidos no projeto forneceram imagens de objetos, esconderam parte dos dados extraíveis e deixaram que o modelo processar o que restou completamente sozinha, sem nenhum auxílio ou informação externa. Veja a ferramenta em ação:
Tecnologia de fotos em 3D pode integrar Apple Intelligence
Ao todo, os pesquisadores utilizaram seis conjuntos de dados contendo milhões de imagens equador de profundidade. Assim, a ideia é garantir que o Matrix3D aprendesse a criar os vídeos tridimensionais a partir de fotos. Para gerar os conteúdos 3D, a IA analisa as imagens de amostra, compreende onde a câmera estaria posicionada em um cenário real, calcula a profundidade de pixels e gera novos ângulos com alta precisão.
Na prática, a big tech pode aproveitar a tecnologia dentro das ferramentas do Apple Intelligence nos iPhones no futuro. No entanto, a especulação que tem maior força neste momento é de que a nova ferramenta desenvolvida pela “maçã” seja aproveitada nos headsets de realidade mista da marca, os Vision Pro.
O fato de a pesquisa ter sido publicada de forma aberta significa que outras empresas e pesquisadores podem criar sua própria versão do Matrix3D. Aliás, os pesquisadores disponibilizaram o conteúdo completo para consulta neste link.
O jornalista Chris Smith, do BGR, diz que plataformas de e-commerce podem aproveitar a tecnologia. Isso porque ela pode exibir representações mais detalhadas de produtos, como móveis, por exemplo. Assim, clientes podem analisar minuciosamente o produto antes de fechar a compra.