Google desenvolve solução que cria objetos 3D a partir de imagens 2D

Em 18 jun 2018 - 2:14pm por videobes


A divisão de inteligência artificial do Google, a DeepMind, anunciou recentemente o desenvolvimento de um algoritmo de visão computacional que consegue gerar objetos 3D a partir de imagens em 2D. Chamada de Generative Query Network, ou GQN, a solução pode “imaginar” e renderizar uma cena a partir de qualquer ângulo, conforme a gigante de buscas.

“De forma muito parecida com crianças e animais, a GQN aprende ao tentar fazer sentido das suas observações sobre o mundo ao redor. Ao fazer isss, a GQN aprende sobre cenas plausíveis e suas propriedades geométricas…sem a anotação humana dos conteúdos das cenas”, explicam os pesquisadores da DeepMind em um post sobre a novidade no blog da empresa.

Basicamente, a GQN busca replicar o funcionamento do cérebro humano na hora de aprender sobre os seus arredores. Com algumas imagens, por exemplo, o algoritmo pode renderizar partes não vistas nessas fotos e gerar uma visualização em 3D do local, tudo isso sem supervisão humana.

Segundo os pesquisadores da subsidiária do Google, a nova solução é composta de duas partes: uma rede de representação e uma rede de geração. “A rede de geração pega as observações do agente como sua absorção e produz uma representação (um vetor) que descreve a cena implícita. A rede de geração então prevê (“imagina”) a cena a partir de um ponto de vista não observado anteriormente.”

Vale notar que o algoritmo ainda está em seu estágio inicial, já que foi testado apenas com cenas simples com poucos objetos. “Apesar de ainda existir muita pesquisa a ser feita antes que a nossa abordagem esteja pronta para ser colocada em prática, acreditamos que esse trabalho é um passo significativo em direção à compreensão totalmente autônoma de cenas.”

Comentários no Facebook