IA aprende a falar como um bebê

Photo of author

By Sohaib


EUimagine ver o mundo através dos olhos de uma criança de seis meses. Você não tem palavras para descrever nada. Como você poderia começar a compreender a linguagem, quando cada som que sai da boca das pessoas ao seu redor tem um número quase infinito de significados potenciais?

Esta questão levou muitos cientistas a levantar a hipótese de que os humanos devem ter alguma facilidade intrínseca de linguagem para nos ajudar a começar a adquirir a linguagem. Mas um papel publicado em Ciência esta semana descobriu que um sistema de IA relativamente simples alimentado com dados filmados a partir da visão de um bebê começou a aprender palavras.

O artigo constrói uma conjunto de dados de imagens filmadas com uma câmera montada em um capacete usado por um bebê australiano ao longo de dezoito meses, com idades entre seis e 25 meses. Os assistentes de pesquisa analisaram e anotaram meticulosamente 37.5000 declarações – como “você vê este bloco do triângulo”, ditas por um pai enquanto o bebê brinca com um conjunto de blocos de brinquedo – a partir de 61 horas de vídeo. Um clipe compartilhado com a TIME mostra o bebê tateando em busca do conjunto de brinquedos antes de voltar sua atenção para um gato nada impressionado.

Quadros do vídeo com visão do bebê acompanhado de declarações transcritas.Cortesia de Wai Keen Vong

Pesquisadores do Centro de Ciência de Dados e do Departamento de Psicologia da Universidade de Nova York alimentaram esse conjunto de dados em um sistema de IA multimodal – que poderia ingerir texto e imagens. Eles descobriram que o modelo de IA poderia identificar muitos objetos diferentes, tanto em testes usando dados da câmera montada na cabeça quanto em testes usando um conjunto de dados de imagens idealizadas de vários objetos, embora sua precisão fosse um tanto limitada.

O sistema de IA foi melhor em nomear objetos que via com mais frequência, incluindo maçãs (que são onipresentes em livros infantis) e berços. Ele também foi capaz de detectar melhor objetos que não estavam obscurecidos nas imagens da câmera principal. Foi particularmente fraco no reconhecimento de facas, diz Wai Keen Vong, um dos autores do artigo.

Testes para o modelo de IA
Perguntas de avaliação usadas para testar se o modelo de IA poderia identificar com precisão vários objetos. LHS: testes utilizando imagens tiradas da câmera montada no capacete. RHS: testes utilizando um conjunto de dados de imagens idealizadas de vários objetos.Cortesia de Wai Keen Vong

Alguns psicólogos e linguistas acreditam que as crianças não seriam capazes de formar associações entre palavras e objetos sem terem alguma habilidade inata de linguagem. Mas o facto de o modelo de IA, que é relativamente simples, poder até começar a aprender associações de palavras num conjunto de dados tão pequeno desafia esta visão, diz Vong.

Porém, é importante ressaltar que as imagens coletadas pela câmera capturam o bebê interagindo com o mundo e seus pais reagindo a isso. Isto significa que o modelo de IA está “colhendo o que a criança sabe”, dando-lhe uma vantagem no desenvolvimento de associações de palavras, diz Andrei Barbu, cientista pesquisador do Laboratório de Ciência da Computação e Inteligência Artificial do Instituto de Tecnologia de Massachusetts. “Se você pegasse esse modelo e o colocasse em um robô, e o mantivesse funcionando por 61 horas, você não obteria o tipo de dados que eles obtiveram aqui, que serão úteis para atualizar um modelo como este.”

Desde que escreveram os seus resultados, os investigadores da NYU transcreveram quatro vezes mais dados das imagens da câmara principal, que pretendem alimentar no seu modelo. Eles esperam examinar quanto mais o modelo de IA aprende quando recebe mais dados, diz Vong. Eles também esperam testar se o modelo pode começar a aprender palavras e comportamentos linguísticos mais desafiadores que tendem a se desenvolver mais tarde na vida.

Estas experiências poderão lançar mais luz sobre como os bebés aprendem a falar, bem como ajudar os investigadores a compreender as diferenças entre a inteligência humana e a artificial. “Há muito a aprender com o estudo de como os humanos adquirem a linguagem”, diz Vong, “e como fazemos isso de forma tão eficiente em comparação com as máquinas atualmente.”

Leave a Comment