Enquanto a inteligência artificial generativa domina telas com ferramentas como ChatGPT, Claude e Copilot, transformando a maneira como escrevemos, resumimos e nos comunicamos, uma cientista renomada acredita que a verdadeira revolução da IA está prestes a acontecer no mundo físico. Fei-Fei Li, professora de Stanford e figura influente no campo, defende que a próxima era da IA será definida por sistemas capazes de compreender e interagir com o ambiente real, uma abordagem que ela denomina “inteligência espacial”.
Li e seus cofundadores, Justin Johnson, Christoph Lassner e Ben Mildenhall, estão à frente da World Labs, uma nova venture que busca desbloquear um vasto potencial industrial e econômico através dessa nova geração de IA. A ideia central é criar modelos que compreendam objetos, movimentos, relações de causa e efeito, e as restrições físicas do mundo real.
O primeiro produto da World Labs, chamado Marble, oferece um vislumbre de como essa inteligência espacial pode funcionar. Ao fornecer uma breve descrição textual, o sistema gera um ambiente 3D explorável, proporcionando uma experiência imersiva de interação com um mundo criado sob demanda.
A visão de Li se distancia dos Large Language Models (LLMs) que dominam o cenário atual. Ela argumenta que a maior parte da economia global opera em ambientes que os LLMs não conseguem “ver” – fábricas, armazéns, hospitais, redes de energia e canteiros de obras. Esses ambientes são regidos pela física, pelo tempo e pela incerteza, elementos que os humanos compreendem intuitivamente, mas que as máquinas precisam aprender.
A cientista ressalta que os humanos são “agentes incorporados”, aprendendo através do movimento, da interação e das consequências. Sistemas de IA treinados apenas em texto carecem dessa conexão com o mundo físico, criando uma lacuna entre o que podem descrever e o que realmente conseguem fazer. Os modelos de mundo que Li está desenvolvendo visam preencher essa lacuna, proporcionando às máquinas uma intuição sobre o funcionamento do mundo.
Nesse novo paradigma, a IA não é mais definida pela linguagem, mas pelo espaço. Enquanto os modelos de linguagem leem textos e preveem a próxima palavra, os modelos de mundo observam vídeos e imagens e aprendem a recriar espaços 3D completos a partir de qualquer ângulo. Eles são treinados com imagens, vídeos e dados sobre profundidade, iluminação, materiais e o comportamento físico dos objetos.
A inovação reside na capacidade desses modelos de manter uma compreensão tridimensional real do espaço, preservando as leis da física e as relações espaciais ao simular cenários ou reorganizar ambientes. Essa consistência os torna ferramentas confiáveis para planejamento, simulação e tomada de decisão no mundo real.
As implicações para as empresas são significativas. A tecnologia permite modelar decisões antes de implementá-las, reduzindo riscos e acelerando a execução. Linhas de produção podem ser redesenhadas digitalmente, redes logísticas podem ser testadas virtualmente e hospitais podem simular o fluxo de pacientes antes de ajustar equipes.
Além disso, a inteligência espacial pode impulsionar a chamada “IA incorporada”, a camada de inteligência por trás de robôs, drones, veículos autônomos e automação industrial. Ao oferecer às máquinas um ambiente seguro e rico para aprender, os modelos de mundo podem acelerar o desenvolvimento desses sistemas.
Fei-Fei Li enfatiza que a inteligência só tem valor quando serve à humanidade. À medida que os modelos de mundo movem a IA das palavras para o mundo físico, esse princípio se torna a verdadeira vantagem competitiva. Ela acredita que a próxima era da inovação será liderada por empresas que compreenderem o poder da IA e seus riscos, e que a inteligência espacial irá redefinir a forma como as indústrias operam e como respondemos aos desafios globais.
Fonte: forbes.com.br











